
深度|Sam Altman回应与微软分歧及行业诉讼:这是一段有着广阔未来的合作关系
深度|Sam Altman回应与微软分歧及行业诉讼:这是一段有着广阔未来的合作关系我们认为,“隐私”与“AI”的关系,是关乎未来的一个关键议题,必须被严肃、妥善地解决。我们之所以坚持,是因为这不仅是技术问题,更关乎制度上的“先例”会怎么被建立。
我们认为,“隐私”与“AI”的关系,是关乎未来的一个关键议题,必须被严肃、妥善地解决。我们之所以坚持,是因为这不仅是技术问题,更关乎制度上的“先例”会怎么被建立。
现在的AI Agent在文档生成PPT或视频方面,要想像人一样,把文字、图片、讲解、音视频全都串起来讲清楚,还真不太行。
昨天,飞书在上海举办了 2025 年飞书未来无限大会,我们也去现场瞅了瞅。刚进会场,第一感受就是人真多。
最近,一款全新的奖励模型「POLAR」横空出世。它开创性地采用了对比学习范式,通过衡量模型回复与参考答案的「距离」来给出精细分数。不仅摆脱了对海量人工标注的依赖,更展现出强大的Scaling潜力,让小模型也能超越规模大数十倍的对手。
让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。
庞若鸣,苹果基础模型团队负责人、杰出工程师,即将成为 Meta 新成立的超级智能团队的最新成员。他本科毕业于上海交通大学,在谷歌工作了 15 年,此后加入苹果。另据彭博社最新消息,Meta 更是开出了 2 亿美金的天价来邀请庞若鸣加入。
最新研究发现,模型的规模和通用语言能力与其处理敏感内容的判断能力并无直接关联,甚至开源模型表现的更好。
无需CUDA代码,给H100加速33%-50%! Flash Attention、Mamba作者之一Tri Dao的新作火了。
大家都有看 Grok4 的发布会吗?Grok4 预热了好几天,没想到马斯克还贴心地选择了国内时间发布,再也不用熬夜看发布会了。
这篇报告第一次把对人心智状态的推断,放到和物理世界模型(physical world model)同等重要的位置上,并将其概念化为心智世界模型(mental world model)。相比于传统世界模型(如LeCun的JEPA)仅关注物理规律(物体运动、机械因果),心智世界模型则首次将心理规律(意图、情感、社会关系)纳入世界模型框架,实现“双轨建模”。
刚刚,全球首个通用生物医学AI智能体Biomni正式开源,相关代码及文件已经在Github发布,现已斩获超过700星,任何人都可以进行本地部署。
Llama惨遭抛弃!据Meta工程师透露,现在Meta内部开发都已经换掉了自家的Llama,改用Claude Sonnet写代码。
Tech星球独家获悉,BOSS直聘的多支业务团队对部分AI细分赛道进行试水,并研发相应的AI产品,推出了爪爪知道、FanDa、男生听劝等微信小程序产品,涉足宠物、穿搭、约饭社交等领域。
谁说扩散模型只能生成图像和视频?现在它们能高质量地写代码了,速度还比传统大模型更快!Inception Labs推出基于扩散技术的全新商业级大语言模型——Mercury。
3月份,我在线下分享过办公软件的一个大趋势——未来,每个人的应用使用界面将只保留一个或极少数几个。现在,如果企业同时运行着20个软件,需要分别登录这20个应用进行相应的任务操作。而AI正在让使用界面和操作界面实现分离。以后,用户只需停留在一个高频应用界面,就能让Agent在背后完成绝大部分跨应用操作,人类只需等待执行结果。
今天咱们再聊聊TTS(文本转语音)这个话题。4月份给大家分享了MiniMax的TTS平台:MiniMax Audio当时我直呼它是最强中文TTS,那篇反响还不错,主要他们Speech-02-HD的效果确实NB
所有使用MCP协议的企业注意:你的数据库可能正在“裸奔”!
“Grok”一词不是马斯克原创,而是源于科幻作家罗伯特·海因莱因 (Robert A. Heinlein) 1961年的经典小说《异乡异客》(Stranger in a Strange Land)。在小说中,“Grok”是一个火星词汇,其含义远超“理解”,它代表着一种深刻、直观、感同身受的领悟,一种与被理解对象融为一体的境界。
AI 商品图,国内厂商很难追赶的一条赛道。
距离 3 月凭借 “AI 智能体自主完成复杂任务” 的产品惊艳亮相仅四个月不到,AI Agent 公司 Manus 就因一场大规模裁员陷入舆论漩涡。近日, Manus 向多家媒体证实,公司对国内业务团队展开优化,120 名员工中,除 40 余名核心技术人员迁往新加坡总部,其余皆被裁员。
在光鲜外表下,OpenAI暗藏着令人震惊的黑暗一面!华人女记者郝珂灵深挖了奥特曼背后的秘密。
最近明显感觉到,大厂对表格的关注度越来越高。原本没什么存在感的表格,现在似乎成了 AI 最被看好的落地场景。
Listen Labs 由两位哈佛校友 Florian Juengermann 与 Alfred Wahlforss 在 2024 年底联合创立,并在 2025 年 4 月连获 Sequoia 领投的种子轮与 A 轮合计 2700 万美元融资,目标是打造一套能自动招募受访者、主持上千场多语访谈、即时归档并复用洞察的“AI 用户研究员”体系。
我们在做App选品时,经常会发现:那些拿奖的、爆火的、上热搜的产品,并不一定挣得到钱。 反而是一些你压根没听说过的工具类、功能型App,悄无声息吸金百万。 所以问题不在于你有没有看到热度,而是你有没有能力找到那批“别人看不上,你刚好能搞定”的项目。尤其是在AI时代,这个“搞定”的含义,已经彻底变了。
企业级Agent正在成为整个toB市场的共识。企业级智能体(toB AI Agent)正在成为全球最受资本追捧的赛道之一。
阿梁从没想过,有一天自己会把内心深处的挣扎,倾诉给“AI”。
当前,驱动科学研究的人工智能(AI for Science,AI4S)在单点取得了可观的进展,实现了工具层面的革新,然而要成为「革命的工具」,需要采用「通专融合 AGI」方式。
“抢占AI表格定义权,抢的其实是To B AI的话语权。 ”
让机器人学会聪明且快速精准执行,一直是机器人操控领域的难题。为了解决这个问题,香港中文大学、北京大学、智平方和北京智源研究院联合创新性地提出了Fast-in-Slow(FiS-VLA),即一个统一的双系统VLA模型。
您有没有遇到过这样的场景:为了调试一个LLM应用的效果,您需要在一大堆Python代码中翻找那些零散的提示词字符串?每次想要A/B测试不同的提示时,就像在做开颅手术一样小心翼翼。