第一批追赶AI的人,正在被AI甩开
第一批追赶AI的人,正在被AI甩开近两年,随着AI的火热发展,“提示词(prompt)”这个词也被普通人熟知。
近两年,随着AI的火热发展,“提示词(prompt)”这个词也被普通人熟知。
近半年来,OpenAI 形象开始变得灰暗: 团队骨干相继离职引发猜疑、组织转型遭受口诛笔伐、GPT-4.5/Sora 等模型表现不及预期,还有被 DeepSeek R1 打破的叙事神话……
最近“AI ✖像素风”的搭配突然变得很热门,创作者们用粗颗粒感、低分辨率、强符号化这种带着复古游戏风格的视觉语言进行表达,加上轻松、幽默的气质,很容易在信息流中抓人眼球。
MetaMind是一个多智能体框架,专门解决大语言模型在社交认知方面的根本缺陷。传统的 LLM 常常难以应对现实世界中人际沟通中固有的模糊性和间接性,无法理解未说出口的意图、隐含的情绪或文化敏感线索。MetaMind首次使LLMs在关键心理理论(ToM)任务上达到人类水平表现。
来自华盛顿大学、AI2、UC伯克利研究团队证实,「伪奖励」(Spurious Rewards)也能带来LLM推理能力提升的惊喜。
一篇文章,一键转成几乎跟真人无异的十几分钟中文AI播客。
又是一个让程序员狂欢的研究!来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架,直接把代码定位准确率拉到了 92.7% 的新高度。该研究已被 ACL 2025 录用。
Google I/O 2025 结束后,Google CEO Sundar Pichai 接受了《The Verge》主编专访,这也是双方连续第三年于 I/O 后展开对谈,而今年的背景更为特殊:Gemini 模型全面更新、多模态生成工具 Veo3 登场、AI 功能深度融入 Android 与 XR 平台,Google 展现出前所未有的产品化信心。
真乐观的科学家和创业者们常低估人性的缺陷,而高谈阔论的历史和哲学家们,在描绘悲观问题时又很难提出解决方案。
既当裁判员,又当运动员?
第一财经「新皮层」独家获得消息称,小红书已将内部大模型技术与应用产品团队升级为「hi lab」(人文智能实验室,Humane Intelligence Lab)。同时,小红书今年年初开始组建「AI人文训练师」团队,邀请有深厚人文背景的研究者与AI领域的算法工程师、科学家共同完成对AI的后训练,以训练AI具有更好的人文素养以及表现上的一致性。而这个「AI人文训练师」团队也隶属于「hi lab」。
今天,我们正式发布 DeepSeek-R1,并同步开源模型权重。DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API,对用户开放思维链输出,通过设置 `model='deepseek-reasoner'` 即可调用。
当我们谈论“玩具”时,惯性地会联想到儿童、娱乐与消费属性。但在AI技术快速演进的当下,玩具的定义正在悄然发生变化——它不再只是儿童的专属物件,也不仅是简单的娱乐工具,而正逐步演变为一个集感知、交互与情绪反馈于一体的智能终端。它可能是孩子成长中的伙伴,也可能是老年人日常的陪伴者,亦或是成人情绪缓释的寄托载体。
过度依赖CoT思维链推理会降低模型性能,有新解了! 来自字节、复旦大学的研究人员提出自适应推理框架CAR,能根据模型困惑度动态选择短回答或详细的长文本推理,最终实现了准确性与效率的最佳平衡。
就在刚刚,全球首款实时摄像头重磅诞生!从此,AI视频生成的「实时性」和「沉浸感」被重新定义,全行业都有了颠覆性方案。
GPA是死线 or 没那么重要? 有人表示,比起发表的论文,其实GPA并不是那么重要,因此TOP 20绝对是可以达到的。
30年码龄程序员4年都没搞定的bug,Claude Opus 4只用几个小时轻松破解了。
面对谷歌、OpenAI等劲敌猛攻及Llama 4翻车、人才流失困境,小扎决定重组Meta GenAI团队,设AI产品、AGI基础和FAIR三大架构。
AI替代人类的风,正在加速吹向程序员群体。
LLM发展到今天,下一步该往哪个方向探索?
想象一下,作为销售经理,你每天晚上都会被一个问题困扰:我的销售代表今天在客户家里到底说了什么?这不是什么玄学,而是销售行业一个长期存在的盲区。我们有监控后台操作的工具,有分析线上会议的软件,甚至有追踪每个电话的系统,但对于面对面销售这个最关键的环节,我们却一直处在黑暗中摸索。
近期,具身智能公司「优理奇机器人 UniX AI」完成数亿元天使轮及天使+轮融资,中关村前沿基金,赛纳资本及长安私人资本参与本轮融资。本轮融资将用于加速研发多模态具身智能大模型与通用机器人本体的同步演进,以及面向多个泛商业服务和C端场景落地与交付。
大模型做数独,总体正确率只有15%???
5 月 28 日,有消息称字节跳动发布最新内部邮件,宣布将逐步禁用包括 Cursor、Windsurf 在内的第三方 AI 开发软件,转而推广自研编程助手 Trae 作为替代方案。邮件由字节跳动安全与风控部门发出,称此举是出于防范数据泄露风险的考虑,自 6 月 30 日起将分批在内部实施相关禁用措施。
从OpenAI 的 4o 到 Stable Diffusion,能够根据文本提示生成逼真图像的 AI 基础模型如今已比比皆是。相比之下,能够仅凭文本提示就生成完整、连贯的 3D 在线环境的基础模型才刚刚崭露头角。
你有没有遇到过这样的算力困境:买了 GPU,用不了几次就闲置烧钱,偶尔想用的时候却一卡难求?
2025 年快要过半,今年上半年 AI 搜索、AI 深度研究类产品可谓是欣欣向荣。
1+1等于几?
王潜曾在美国创立量化基金,可“晚上经常睡不着想做机器人”,2023年,他解散了基金,回国创业。
在日益强调“思维能力”的大语言模型时代,如何让模型在“难”的问题上展开推理,而不是无差别地“想个不停”,成为当前智能推理研究的重要课题。