Llama 4五大疑点曝光,逐层扒皮!全球AI进步停滞,NYU教授称Scaling彻底结束
Llama 4五大疑点曝光,逐层扒皮!全球AI进步停滞,NYU教授称Scaling彻底结束刚刚,一位AI公司CEO细细扒皮了关于Llama 4的五大疑点。甚至有圈内人表示,Llama 4证明Scaling已经结束了,LLM并不能可靠推理。但更可怕的事,就是全球的AI进步恐将彻底停滞。
刚刚,一位AI公司CEO细细扒皮了关于Llama 4的五大疑点。甚至有圈内人表示,Llama 4证明Scaling已经结束了,LLM并不能可靠推理。但更可怕的事,就是全球的AI进步恐将彻底停滞。
“最强AI语音”的场景化突围。
CUDA 迎来 “Python元年”!
Alphabet(谷歌)作为互联网时代的科技巨头之一,在 AI 技术重塑世界的浪潮中勇立潮头,不仅通过自有的产品和服务推动 AI 发展,也通过风险投资,赋能初创企业,积极参与全球 AI 创业生态的构建。
基于规则的强化学习(RL/RFT)已成为替代 SFT 的高效方案,仅需少量样本即可提升模型在特定任务中的表现。
多点发力,协同并进,才能让AI的成长有更多道路可走
大规模数据集和标准化评估基准显著促进了自然语言处理和计算机视觉领域的发展。然而,机器人领域在如何构建大规模数据集并建立可靠的评估体系方面仍面临巨大挑战。
众所周知,大语言模型(LLM)往往对硬件要求很高。
最近,Tinder与OpenAI合作,推出了一款名为"Game Game"的AI语音调情游戏,号称能让用户在模拟约会场景中练习调情技巧。用户可以通过与 AI 机器人互动,练习调情、模拟初次相遇场景,并根据表现获得评分和建议。
2025年斯坦福HAI报告重磅发布,456页深度剖析全球AI领域的最新趋势:中美顶级模型性能差距缩至0.3%,以DeepSeek为代表的模型强势崛起,逼近闭源巨头;推理成本暴降,小模型性能飙升,AI正变得更高效、更普惠。
AI乃至生成式 AI 正以前所未有的态势向边缘设备迁移,从 AIoT 的初步探索,迈向真正意义上的边缘 AI 时代,这一转变让嵌入式行业发生着天翻地覆的巨变。
Llama 4真要被锤爆了,这次是大模型竞技场(Chatbot Arena)官方亲自下场开怼:
大家翘首以盼的 Llama 4,用起来为什么那么拉跨?
一块毫无设计感的电路板,成了全网最火的「AI 硬件」。
法国班轮巨头达飞与本土科技公司Mistral AI合作,在未来五年内投资1亿欧元(1.1亿美元),为集团的航运、物流和媒体活动部署定制的人工智能解决方案。
最近各家文生图 AI 都在不断迭代。
多模态视频异常理解任务,又有新突破!
AI绘画总「翻车」,不是抓不住重点,就是细节崩坏?别愁!微软和港中文学者带来ImageGen-CoT技术,让AI像人一样思考推理,生成超惊艳画作,性能提升高达80%。
是的,Rabbit,那个一度声名鹊起的第一代 AI 硬件公司,下场做 AI Agent 了。
在信息检索系统中,搜索引擎的能力只是影响结果的一个方面,真正的瓶颈往往在于:用户的原始 query 本身不够好。
Q-Insight不再简单地让模型拟合人眼打分,而是将评分视作一种引导信号,促使模型深度思考图像质量的本质原因。有了会思考的“大脑”,视频云技术栈不仅得以重塑也让用户体验有了跃迁。
路由LLM是指一种通过router动态分配请求到若干候选LLM的机制。论文提出且开源了针对router设计的全面RouterEval基准,通过整合8500+个LLM在12个主流Benchmark上的2亿条性能记录。将大模型路由问题转化为标准的分类任务,使研究者可在单卡甚至笔记本电脑上开展前沿研究。
图文大模型通常采用「预训练 + 监督微调」的两阶段范式进行训练,以强化其指令跟随能力。受语言领域的启发,多模态偏好优化技术凭借其在数据效率和性能增益方面的优势,被广泛用于对齐人类偏好。目前,该技术主要依赖高质量的偏好数据标注和精准的奖励模型训练来提升模型表现。然而,这一方法不仅资源消耗巨大,训练过程仍然极具挑战。
我之前拉了一个AI自媒体的群,就...同行交流,互相学习。
今日凌晨,Meta AI 部门副总裁 Ahmad Al-Dahle 发文,回应了近日发布的 Llama 4 大模型的争议问题:对于「不同服务中模型质量参差不齐」这一问题,Ahmad Al-Dahle 解释称,由于模型一准备好就发布了,所以 Meta 的团队预计所有公开的应用实现都需要几天时间来进行优化调整,团队后续会继续进行漏洞修复工作。
随着AI能力的迭代升级,可以发现一个明显的趋势,AI已经从最初理解人类进行智能对话,逐渐演变成一种情感治愈工具。而这种工具的体现形式不仅仅限于正值火热的AI萌宠硬件、AI社交软件,还有一些小众的细分应用,比如AI解梦。
Agentic AI 的 3 要素是:tool use,memory 和 context,围绕这三个场景会出现 agent-native Infra 的机会。
Kimi 开放平台的朋友们,基于 Moonshot AI 一年来的技术积累和性能优化,我们已经在北京时间 2025 年 04 月 07 日 0 点对 Kimi 开放平台提供的模型推理服务进行价格调整,具体调整方案如下:
2025 CSRankings新鲜出炉了!CMU稳坐全球第一,中国高校强势崛起,清华摘得第2,上交大与浙大并列第3,北大位居第5。中国在AI领域表现尤为抢眼,上交大、清华、北大、浙大包揽前四,中国科学院与哈工大也跻身全球前十。
几天前,AI 驱动的演示工具 Tome 宣布,将在四月底前关闭 Tome Slides 功能,并转型至销售领域(「搞定交易,而非幻灯片」:面向销售的 AI 助手)。