DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录
DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录近日,普林斯顿大学的研究团队发布了一篇新论文,提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型,是国内开源大模型 DeepSeek-V4-Flash。
搜索
近日,普林斯顿大学的研究团队发布了一篇新论文,提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型,是国内开源大模型 DeepSeek-V4-Flash。
6月1日,在英伟达GTC舞台,黄仁勋聊AI工厂,聊智能体,反复念叨的也是这个Token:算力就是收入,算力就是利润。没有收入和利润,就是亏损。一座AI工厂这辈子能赚多少钱,看的就是它总共产出多少Token,也就是曲线下方的面积。一句话:谁能更快、更省电、更稳定地生产Token,谁就赚得多。
该论文第一作者为曹子昂,研究方向主要聚焦于 3D AIGC、Physical AI 与具身智能。论文主要合作者包括来自南洋理工大学的李海天、姚润茂、洪方舟、陈昭熹,以及大晓机器人的刘英豪和潘亮。通讯作者为南洋理工大学刘子纬教授。
Codex和Claude Code长得越来越像了!最近,开发者Elie Bakouch感到Claude Code和Codex的功能越来越像,他好奇到底哪家在领跑,于是就把两家都有的功能做成了一张时间线。
近日,来自清华大学智能产业研究院(AIR)的团队联合北京智源研究院(BAAI)、北京大学、南京大学等机构构建了一个基准:GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark,
它不同于我们认知中传统的「学术机构」or「创业公司」。它要在同一个屋顶下,同时扛住四件事:科学路径是否成立、工程能不能跑通、市场有没有人买单、资本能不能撑到关键节点。硅谷现在有个非正式叫法:Neo Labs。
奥特曼官宣ChatGPT记忆重大升级!全新Dreaming V3架构正式上线:ChatGPT会在后台「做梦」,首次向数亿免费用户开放。这一次升级,「做梦」功能向十亿人免费开放,Plus和Pro记忆容量直接翻倍。
早在 2023 年大模型快速发展期,哈工大张民教授立知大模型团队已开展多模态大模型驱动的视频内容创作智能体研究,并全球首发开源了电影制作智能体 FilmAgent 与动画片生成智能体 Anim-Director,受到国内外智能体研究者与文艺创作者的广泛关注。
在人工智能与体育产业深度融合的浪潮中,高尔夫这项传统运动正迎来一场由“物理AI”驱动的技术革命。近日,专注于高尔夫运动科技创新的XintLabs宣布完成数千万元天使轮融资,由高瓴创投独家投资。资金将主
就在昨天,Anthropic 的官方状态页突然挂起一排刺眼的红灯——Claude API、Claude Code、Claude.ai、Claude Cowork……几乎所有核心服务,突然大面积宕机。从 Opus 4.6 到 Opus 4.8,五大模型无一幸免。
最近,一个叫 Emergence AI 的团队做了一场社会实验。它们建了一个持久化的虚拟小镇,把市面上最顶级的几个大模型扔了进去,赋予它们行动的权限。它们想看看,当 AI 真正拥有了不受限制的 15 天,它们会建立一个乌托邦,还是一个疯人院。
1985 年,教育部高考语文研究组编了一本书,《全国高考作文评分系统与各类标准卷选》,那是一个关注语言水平、写作创造力和文字如何反映生活的时代,高考作文既是一种考察写作能力的方式,也是教书育人理念的延
CVPR 2026全部奖项揭晓!最佳学生论文荣誉提名颁给了ChordEdit,一作和通讯都是广东工业大学本科在读生。他们用一块7年半前的老Titan,跑完了全部实验。
OpenSquilla 是一个开源 Agent Harness 框架(https://github.com/opensquilla/opensquilla)。它在 Agent 应用和模型之间加了一层运行中枢。OpenSquilla 由上海基元律动科技有限公司开发。基元律动成立仅几个月后,已完成首轮融资,估值高达1亿美元。
据彭博社报道,美国总统特朗普表示有意让美国政府持有领先AI公司的股权,并称他计划最早下周与AI公司高管讨论合作的想法。周五,特朗普在空军一号上被记者问到此事时谈道:“有些方案可以将部分股份赠予美国公众,让美国公众实际上成为合作伙伴。这很有意思,它几乎可以与美国公众建立伙伴关系,我们会研究一下。”
智东西6月6日消息,据《福布斯》今日报道,瑞典明星AI氛围编程创企Lovable正在洽谈融资,估值将达到120亿美元(约合人民币812亿元)。四位消息人士透露,新资金注入将使Lovable的估值几乎翻番,高于去年12月的66亿美元(约合人民币447亿元)。
Boson AI 与 SGLang-Omni 团队宣布,SGLang-Omni 已完成对 Higgs Audio v3 TTS 的端到端 Serving 支持。作为一家成立于 2023 年的 AI 基础设施公司,李沐与 Alex Smola共同创立了 Boson AI,聚焦大模型时代的系统与基础设施创新。
有读者告诉《读佳》,腾讯做了一个龙虾社区“虾友会”,还没正式推广。说实话,“虾友会”这个社区挺有意思的,它就像是腾讯AI产品用户的“聚贤庄”,一些大佬还在里面做LV1的“小芯肝”,这个产品意味着什么呢?我们认为:
没人重训模型,没人重写代码,OpenAI的AI系统六周内自己把准确率从25%拉到86%。Codex自己定位bug、写修复、跑测试,AI自我进化已在生产环境跑起来了。
近日,AI制药独角兽Chai Discovery宣布与制药巨头辉瑞达成许合作许可。合作后辉瑞将获得Chai Discovery首次曝光的新一代模型Chai-3的优先访问权限,以及利用辉瑞专有数据、量身定制的定制模型。
在代码世界里 Debug 已经不能满足硅谷了。2026 年 5 月底,谷歌向美国环境保护署(EPA)提交了一份实验使用许可申请:他们计划在未来两年内,向美国佛罗里达州和加利福尼亚州放飞 3,200 万只被一种特殊细菌感染过的雄性蚊子,在真实世界里“Debug”。
怎么让VGM学会按规则推理?过去主要有两条路。两条路,一个不动模型,一个只写文字,都没真正解决“执行”问题。为此,城大×快手可灵提出了第三条路:VLM-as-Teacher。
计算机界「青年图灵奖」出炉了!今天,2025 ACM Grace Hopper大奖正式揭晓,一锤砸中了两位灵魂人物——获奖理由只有一个词:NeRF(神经辐射场)。
终于看到一个跳出 Codex、Claude Code 这些 Agent 范畴的新 AI 产品。而且在海外已经火起来了。这个产品叫 Aippy。目前 MAU 将近两百万,全球下载超过三百万,刚完成首轮融资,投后估值 2.5 亿美元。也是垂类赛道的新独角兽了。
刚刚,AI圈发生了一件很不寻常的事。Sam Altman、Dario Amodei、Demis Hassabis……一群平时打得最凶的人,把名字签在了同一封公开信上。他们联合呼吁美国国会:立法强制筛查所有合成DNA订单。
一觉睡醒,具身智能公司竟然也开始搞房地产了?!刚刚,大晓机器人联合港中文MMLab发布了一个新项目——Kairos-Homeworld,全球首个实现全屋三维生成与物体级全交互的统一框架。
数学,这块人类心智的荣耀,正面临一场前所未有的「降维打击」。当算法的「非人化」优势把80年的接力变成32小时的副产品时,我们不得不问:人类到底想要一个又一个正确答案,还是想要理解这些答案的过程?
来自中国科学院计算技术研究所、ETH Zurich等机构的研究者提出了Fast-SAM3D。该方法直接面向SAM3D的推理链路做训练无关加速,在最大程度保持重建质量的同时,将单对象生成提速最高2.67倍,场景生成提速最高2.01倍。
复盘三年多的AI行情,就是一个不断找硬件瓶颈的过程:最开始涨GPU,后来涨服务器,再后来涨数据中心,然后涨电力,接着涨HBM存,现在又开始涨CPU、高速互联和ASIC。
京东首次开源长音视频生成框架JoyAI-Echo。它直击长视频生成中的角色一致性、声音稳定性和生成速度三大核心难题,一举在多个核心指标上超越行业标杆模型。根据公开评测结果,JoyAI-Echo在跨镜头一致性、语音准确率、用户偏好等关键指标上均取得领先表现,与业内主流长视频生成模型相比优势明显,出道即跻身全球第一梯队。