
李飞飞最新访谈:没有空间智能,AGI就不完整
李飞飞最新访谈:没有空间智能,AGI就不完整在我看来,没有空间智能,通用人工智能就不完整。这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。
在我看来,没有空间智能,通用人工智能就不完整。这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。
ChatGPT诞生内幕最新大曝光: 纳尼??原来“ChatGPT”这个名字,直到发布前一晚才确定下来。
是「正当防卫」还是「学术欺诈」?
2023 年 7 月,《晚点 LatePost》曾独家披露,字节 AI Lab 旗下机器人团队正推进机器人量产。当时曾定下到 2023 年年底,量产 200 台的目标。
隔壁”苏超”激战正酣之际,”机超”也在悄然火爆。
想象一下,凌晨三点你被电话吵醒,公司的核心系统彻底崩溃,数十万用户无法正常使用服务,每分钟损失数万美元。你和 50 个工程师挤在一个 Slack 紧急群里,面对着成千上万条日志、指标和报警,却根本找不到问题的根源。
从 Chatbot 到 Perplexity,搜索正被 AI 改写,但这只是开始。Chatbot 与 Perplexity.ai 分别代表了 AI 重塑搜索的两类探索路径:一个是对话式交互的路径,一个是「答案即结果」的路径。
原来,CoT推理竟是假象!Bengio带队最新论文戳穿了CoT神话——我们所看到的推理步骤,并非是真实的。不仅如此,LLM在推理时会悄然纠正错误,却在CoT中只字未提。
本文第一作者是上海交通大学计算机学院三年级博士生程彭洲,研究方向为多模态大模型推理、AI Agent、Agent 安全等。通讯作者为张倬胜助理教授和刘功申教授。
多模态对齐模型借助对比学习在检索与生成任务中大放异彩。最新趋势是用冻结的大语言模型替换自训文本编码器,从而在长文本与大数据场景中降低算力成本。LIFT首次系统性地剖析了此范式的优势来源、数据适配性、以及关键设计选择,在组合语义理解与长文本任务上观察到大幅提升。
混合专家网络模型架构(MoE)已经成为当前大模型的一个主流架构选择,以最近开源的盘古Pro MoE为例
大家好,我是小林,周一在阿里魔搭现场,听知乎创始人周源老师分享,有句话非常打动我: 开源不仅仅是技术,还有思想开源。
设定角色,让AI照“本”生成主角不变的不同图像,对于各路AIGC工具来说一直是不小的挑战。
号称“近10年最大改版”,百度搜索这是要自己革自己的命?
「聊天界面,本质上是一种懒惰的产物。」大多数 AI 产品都在做 chatbot。对话框是最简单直接的人类与 AI 交互的「接口」,同时也是一个 AI 产品最低成本上线的方式。
自从 Transformer 问世,NLP 领域发生了颠覆性变化。大语言模型极大提升了文本理解与生成能力,成为现代 AI 系统的基础。而今,AI 正不断向前,具备自主决策和复杂交互能力的新一代 AI Agent 也正加速崛起。
大家好,这里是歸藏(guizang),分享一下 Gemini CLI 不写代码能有多好用! 前几天最近随着 Claude Code 这个命令行 AI 代码工具的火爆,谷歌也耐不住寂寞推出了自己的同类产品 Gemini CLI,而且完全免费,非常顶。
近年来,随着扩散模型(Diffusion Models)、Transformer 架构与高性能视觉理解模型的蓬勃发展,视频生成任务取得了令人瞩目的进展。从静态图像生成视频的任务(Image-to-Video generation)尤其受到关注,其关键优势在于:能够以最小的信息输入生成具有丰富时间连续性与空间一致性的动态内容。
将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习(RLHF)。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分,最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。
AinimateLab的总监周士诚今年有两部AI短片斩获佳绩——《缸中之脑》获得今年北京国际电影节AIGC单元最佳动画;《我的外星女友》则入围了今年上海国际电影节AIGC短片单元六强。
美国加州两起判决首次认定:AI公司扫描购买的正版书籍用于模型训练属合理使用,训练行为具变革性也属合理使用,但盗版素材获取仍侵权。中美监管宽松利于AI产业发展,欧盟严格规定要求素材许可或提供退出选项。AI输出侵权内容或诱导输出训练素材存在争议。
就在刚刚,xAI再获百亿美元融资,估值飙至1130亿。而xAI控制台中,已有源代码流出,Grok 4和Grok 4 Code即将上线!现在,全网都在搓手以待,Grok 4的诞生,将怎样搅动当前顶尖大模型的局面。
微软首席执行官Satya Nadella在社交平台分享了,微软最新发布的突破性医疗AI系统MAI-DxO。
2025年上半年,AI开源领域的竞赛异常激烈,主要围绕着几个核心方向展开:首先是效率竞赛,各路玩家不再单纯追求千亿、万亿参数的“巨无霸”模型,而是更专注于通过新架构和训练方法,用更小的参数实现更强的性能。其次,多模态已成标配,纯文本模型越来越少,新发布的旗舰模型几乎都具备了处理图像、视频等多种信息的能力。
为智谱构建可信的人工智能基础设施注入坚实动能。
“中国版OpenAI”智谱,意外被OpenAI点了次名。
AI开始挤占人类音乐了。今年1月,法国音乐流媒体服务Deezer曾透露,该平台新上传内容有10%完全由AI生成,两个月来,比例提高到了18%。“而且我们看不到任何放缓的迹象。”
刚刚,一支华人主导的AI团队打破硅谷融资纪录。
2023年至今,检索增强生成(RAG)经历了从备受瞩目到逐渐融入智能体生态的转变。尽管有人宣称“RAG已死”,但其在企业级应用中的重要性依然无可替代。RAG正从独立框架演变为智能体生态的关键子模块,2025年将在多模态、代理融合、行业定制化等领域迎来新的突破。
终于出现一款真正面向C端的AI医疗产品了。