
苹果新研究:不微调、不重训,如何让AI提问效率暴增6.5倍?
苹果新研究:不微调、不重训,如何让AI提问效率暴增6.5倍?在这场以大型语言模型(LLM)为核心的 AI 浪潮中,苹果似乎一直保持着低调,很少出现在技术报道的前沿。尽管如此,时不时地,该公司也能拿出一些非常亮眼的研究成果,比如能在 iPhone 上直接运行的高效视觉语言模型 FastVLM。
在这场以大型语言模型(LLM)为核心的 AI 浪潮中,苹果似乎一直保持着低调,很少出现在技术报道的前沿。尽管如此,时不时地,该公司也能拿出一些非常亮眼的研究成果,比如能在 iPhone 上直接运行的高效视觉语言模型 FastVLM。
AI 也要「考古」式科研?
全球三大高翻院之一,蒙特雷国际研究学院(MIIS)官宣,2026年7月正式停招研究生。生源不足、财务问题之下,许多人还将矛头指向了AI。如今,机翻精度高、又快又准,突然理解,什么是时代的眼泪了。
AI 产品经理,和我们所熟知的 PC、App 时代的产品经理完全不一样。
大语言模型通过 CoT 已具备强大的数学推理能力,而 Beam Search、DVTS 等测试时扩展(Test-Time Scaling, TTS)方法可通过分配额外计算资源进一步提升准确性。然而,现有方法存在两大关键缺陷:路径同质化(推理路径趋同)和中间结果利用不足(大量高质量推理分支被丢弃)。
论搞事情,网友们从来不让人失望。 这不,最近海外又出了个营销大整活,网友 Ömer Öztok 声称自己给 OpenAI 投了份申请担任 CEO 的简历。
最近,工业界“RAG已死”甚嚣尘上。过去几年,AI领域的主旋律是“规模定律”(Scaling Law),即更大的模型、更多的数据会带来更好的性能。即便偶然有瑕疵,也认为只是工程上的不足,并非数学上的不可能。
现在做 AI 课程的,不计其数,吴恩达、Andrej Karpathy,Greg Isenberg 等人更是大神下凡支教。高校如斯坦福、MIT、哈佛等也有公开课资源。
AI医疗领域,冲出一匹年度黑马! 据外媒报道,美国AI医疗初创公司OpenEvidence正在寻求新一轮融资,估值约60亿美元(约合人民币427亿元)。
国内外开发者:亲测,美团新开源的模型速度超快!
上周,北京的 WRC 世界机器人大会史无前例的火爆。 维他动力半年内融资 3 亿人民币,带着新产品首次亮相,因其独特性成为了全场最多人排队的展位之一。
屋漏偏逢连夜雨,内部动荡的Meta被曝其AI在互联网上恶搞明星。 路透社消息,Meta的AI允许盗用明星肖像和名字,任意创造恶搞bot,这些bot在社交平台上会坚称自己就是明星本人,还会和其他用户互动。
太魔幻!量子位从多个信源处独家获悉,Meta正式对内宣布了一条爆炸性消息: 即日起,FAIR若是要对外发表论文,必须先经过TBD实验室的审核。
随着DeepSeek R1、Kimi K2和DeepSeek V3.1混合专家(MoE)模型的相继发布,它们已成为智能前沿领域大语言模型(LLM)的领先架构。由于其庞大的规模(1万亿参数及以上)和稀疏计算模式(每个token仅激活部分参数而非整个模型),MoE式LLM对推理工作负载提出了重大挑战,显著改变了底层的推理经济学。
机器人对可形变物体的操作(Deformable Object Manipulation, DOM),是衡量通用机器人智能水平的关键指标之一。与刚体操作不同,衣物、绳索、食物等物体的形态不固定,其状态空间维度极高,且物理交互过程呈现出复杂的非线性动力学特性,为感知、规划和控制带来了巨大挑战。
火遍全网的「氛围编程」(Vibe Coding),让人人都可以上手编程,写出自己的程序了。然而,作为Vibe Coder,和真正的软件工程师之间,还存在哪些差距呢?
AI图像编辑技术发展迅猛,扩散模型凭借强大的生成能力,成为行业主流。 但这类模型在实际应用中始终面临两大难题:一是“牵一发而动全身”,即便只想修改一个细节,系统也可能影响到整个画面;二是生成速度缓慢,难以满足实时交互的需求。
覆盖桌面、移动和 Web,7B 模型超越同类开源选手,32B 模型挑战 GPT-4o 与 Claude 3.7,通义实验室全新 Mobile-Agent-v3 现已开源。
22-25岁初入职场的年轻人,就业率同比已经下降了13%,AI带来的就业冲击愈发严峻。一些老板们也开始冻结招聘,将AI能力不足的求职者直接拒之门外。AI造就的新形势迫使我们认真思考,哪些岗位是很难被AI取代的呢?
Anthropic 宣布已经完成了新一轮 130 亿美元融资,投后估值达 1830 亿美元,约为这家人工智能初创公司 3 月份上次融资时的三倍。
谷歌回归搜索老本行,这一次,它要让 AI 能像人一样「看见」网页。 这是谷歌前不久在 Gemini API 全面上线的 URL Context 功能(5 月 28 日已在 Google AI Studio 中推出),它使 Gemini 模型能够访问并处理来自 URL 的内容,包括网页、PDF 和图像。
原来,Scaling Law在32年前就被提出了! 不是2020年的OpenAI、不是2017年的百度,而是1993年的贝尔实验室。
这家由剑桥大学行为科学背景的 James He 和 Patrick Sharpe 创立的公司,声称能够通过 AI 模拟整个人类社会的互动模式。他们不是在构建另一个聊天机器人或者内容生成工具,而是在尝试解决一个困扰人类社会数千年的根本问题:如何准确预测群体行为。
今天凌晨,特斯拉公布了他们的《宏图计划第四篇章》。 与以往聚焦汽车或能源产品的蓝图不同,特斯拉这次描绘了一个更遥远、也更理想化的终点:一个由 AI 和机器人主导的「可持续富足」的社会。
大家好,我是歸藏(guizang),今天教大家解决 Nana Banana 出图最大的问题。 Nano Banana 已经非常强了,但是最近大家普遍用的时候两个问题非常影响可用性
一群AI玩狼人杀,GPT-5断崖式领先,胜率达到了惊人的96.7%。 OpenAI的总裁格雷格·布罗克曼转发了这样的一个基准测试:让7个强大的LLMs,包括开源和闭源,玩了210场完整的狼人杀。
AI 硬件,已经成为大模型之后,又一个令人兴奋的领域。 正如 AI Agent 从通用开始走向垂直,AI 硬件,也已经逐渐分化到「陪伴」、「工作」等各个垂直领域。
国内AI音乐领域迎来突破性进展。日前,自由量级0到1全自研的音乐大模型——“音潮音乐”已成功通过国家互联网信息办公室的生成式人工智能服务备案(备案号:Shanghai-YinChaoYinYue-202507160059)。
当前AI大模型(LLM)训练与推理对算力的巨大需求,以及传统计算精度(如FP16/BF16)面临的功耗、内存带宽和计算效率瓶颈。
不使用端侧AI的话,谷歌在Pixel 10上就有虚假宣传的嫌疑了。