优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效
优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens 的序列。然而,这也给 KV cache 的存储带来了严峻挑战。
LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens 的序列。然而,这也给 KV cache 的存储带来了严峻挑战。
微软研究院官宣开源多模态AI——Magma模型。首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。
哥大的大二学生Roy Lee,靠AI作弊顺利取得亚马逊、Meta、TikTok等大厂的offer!被告发后,哥大在11日将举行听证会,但小哥表示,自己已经买了单程票,到时自己并不会在学校,甚至可能退学。如今,小哥已经成了网红,AI作弊神器Interview Coder卖60美元一个月,公司收入快破百万了。
LeCun最新访谈,对DeepSeek一顿猛夸。 他表示,DeepSeek是一项很出色的成果,它的开源不只是成果创造者受益,全世界都能从中受益。
字节对MoE模型训练成本再砍一刀,成本可节省40%! 刚刚,豆包大模型团队在GitHub上开源了叫做COMET的MoE优化技术。
智能眼镜的意义不在于呈现更多的功能,而是尽可能不干扰用户的情况下,为用户提供智能服务。
北京时间3月10日,据《华尔街日报》报道,富士康母公司鸿海已研发出中国台湾地区首个具备先进推理能力的大模型,性能上落后于DeepSeek的部分大模型。鸿海周一表示,已自主研发了具备推理能力的人工智能(AI)大语言模型FoxBrain,并在四周内完成训练。FoxBrain最初为公司内部使用而设计,具备数据分析、数学运算、推理以及代码生成的能力。
近日,索尼音乐宣布已采取行动,针对 AI 生成的假冒音乐内容进行了大规模的下架处理。据报道,索尼已下架超过7.5万条与旗下艺人哈里・斯泰尔斯等相关的 AI 伪造音乐。
北京时间3月10日清晨,推特用户jianxliao发布推文称成功“越狱”了Manus AI的代码,据其透露,他只是简单地要求Manus提供"/opt/.manus/"目录下的文件,系统便直接提供了沙盒运行时代码,并揭示了Manus使用Claude Sonnet模型、配备29个工具且使用了browser_use开源项目等技术细节。
二次元圈子突然冒出了个AI新玩具,最近有点小火🔥
OpenAI的模型搞得太多太凌乱,官方自己都看不下去了。
刚填完坑就又埋下“惊喜预告”??
AI智能体领域Type-C来了!Manus及其开源复现诞生,一夜捧红了MCP,工具调用/访问外部数据,一个协议就够了。
马克·扎克伯格今年正在提升 Meta 人工智能的语音功能,准备从这项快速发展技术中创收。
吴彦祖高途合作推398元AI英语课,高途亏损仍押注AI教育。
没能延续第一款AI产品闷声发大财的路线
“大力出奇迹”能持续多久?
推理token减少80%-90%,准确率变化不大,某些任务还能增加。
近年来,大语言模型(LLM) 的快速发展正推动人工智能迈向新的高度。像 DeepSeek-R1 这样的模型因其强大的理解和生成能力,已经在 对话生成、代码编写、知识问答 等任务中展现出了卓越的表现。
最近, Meta首席AI科学家杨立昆接受海外播客This Is IT 的专访,探讨了深度学习的发展历程、机器学习的三种范式、莫拉维克悖论与AI发展的限制、训练AI模型的资源、AI基础设施投资等话题。
双一流高校本科扩容”这一话题日前登上热搜,引发关注。清华大学此次拟扩招的新生将进入新成立的本科通识书院,着力培养具备人工智能思维、胜任人工智能技术、具有人工智能与不同学科深度交叉知识素养的复合型人才。
最近这段时间Manus 爆火,一码难求,不妨来试试这款产品,Flowith。Flowith作为新一代AI创作工作空间,以其独特的二维画布交互方式和知识花园生态系统,正在重新定义人与AI的协作方式。本文将从产品设计理念、核心功能及应用场景等维度,深入解析这款备受瞩目的AI创作工具。
甚至很多人嘲讽,国外的论坛和自媒体还没动静,只有国内AI自媒体吹,所以一定都是收钱的营销号。那现在,海外热度开始爆了,是不是也都收钱了?
最近 AI 圈最炸的瓜,毫无疑问是——Manus。
由于语言泛化,今天出现了很有趣的现象:「Agent 是什么」,这个问题没有了标准的定义。一个常见的观点是:Agent 是一种让 AI 以类似人的工作和思考方式,来完成一系列的任务。一个 Agent 可以是一个 Bot,也可以是多个 Bot 的协同。
AI竟能精准模拟博士生资格考试?只需将评委的履历和论文输入ChatGPT,就能创建数字形象,模拟面试问题,顺利通过考试。
未来,专家级Agents也许会达到“赢者通吃”的水平。
AGI明年降临?清华人大最新研究给狂热的AI世界泼了一盆冷水:人类距离真正的AGI,还有整整70年!若要实现「自主级智能,需要惊人的10²⁶参数,所需GPU总价竟是苹果市值的4×10⁷倍!
最近AI一直是很火的话题,Deepseek也是一夜爆火,但是实际使用下来发现Deepseek好像和其他大模型一样,并没有什么厉害之处,而且官网经常服务器繁忙。
2021 年年初,我在一个学长的数据公司做投放。这家公司主要是给大厂提供人脸识别标注数据、街道场景标注数据和自然语言标注数据。其中前两个是非常成熟,大厂需求也最多,而自然语言数据需求量几乎说少得可怜。