
小白也能玩转AI视频!即梦Agent模式实测:一句话搞定插画、海报、Vlog
小白也能玩转AI视频!即梦Agent模式实测:一句话搞定插画、海报、Vlog即梦AI最新上线的Agent模式,只需要说出你的需求,它就能自动帮你写提示词,新上手的小白也能轻松玩转。比Nano banana更懂中文场景,文生图和图像编辑还比Nano banana强!
即梦AI最新上线的Agent模式,只需要说出你的需求,它就能自动帮你写提示词,新上手的小白也能轻松玩转。比Nano banana更懂中文场景,文生图和图像编辑还比Nano banana强!
缘起 我们为什么要做视频绘本呢?它源于一位父亲小小的愿望。 ListenHub 的 CTO Kris 是一名新手爸爸,他每天在家听到孩子说的最多的三个字就是:讲故事。 孩子永远有数不清的故事想听,同一
谷歌DeepMind研究团队一年前的研究成果直到昨晚才姗姗揭秘,提出了一种叫做GDR的新方法,颠覆了传统训练中设法剔除脏数据的思路,将饱含恶意内容的数据「变废为宝」,处理后的数据集用于训练,甚至比直接剔除脏数据训练出的模型效果还好,「出淤泥而不染」,「择善而从」。
9 月 11 日下午,机器之心联合张江具身智能机器人有限公司共同出品的 2025 Inclusion・外滩大会 「具身智能:从泛化到行动,重塑产业未来」见解论坛在上海隆重举办。在这场围绕具身智能展开的盛会上,多位来自学界和业界的代表分享了他们在具身智能行业发展的经验和看法。
近日,全球网络通信顶会 ACM SIGCOMM 2025 在葡萄牙落幕,共 3 篇论文获奖,华为网络技术实验室与香港科技大学 iSING Lab 合作的 DCP 研究成果,获本届大会 Best Student Paper Award (Honorable Mention),成为亚洲地域唯一获奖的论文。
两年过去,ElevenLabs 已经融资 2.6 亿美元,网站访问量超 2500 万,稳坐 AI Web 全球 Top50 榜单,成为 AI 语音赛道的头部创企。而 Speechify 却渐渐“掉队”,榜单中难觅身影,而作为一个 AI 企业,它仅在 2017 和 2020 年有过两次融资,近几年也没有传出任何融资消息。
就在今天,斯坦福大学教授李飞飞的创业公司 World Labs 发布了新成果 —— 限量开放的测试预览版空间智能模型 Marble。「只需一张图片,就能生成持久存在的 3D 世界,比以往更宏大、更震撼!」
这项名为 MachineLearningLM 的新研究突破了这一瓶颈。该研究提出了一种轻量且可移植的「继续预训练」框架,无需下游微调即可直接通过上下文学习上千条示例,在金融、健康、生物信息、物理等等多个领域的二分类 / 多分类任务中的准确率显著超越基准模型(Qwen-2.5-7B-Instruct)以及最新发布的 GPT-5-mini。
顶级大模型在AAI提出的FormulaOne基准集体翻车:三层难度递进,GPT-5进阶题仅约4%正确,最深层零分;Grok 4、o3 Pro全部失手。该基准以图上MSO逻辑与动态规划生成问题,贴近路径规划等现实优化,旨在衡量超越竞赛编程的算法推理深度。
本周,我们关注 Agent 与工业结合正在发生的变化,我们邀请研发时序大模型 Geegobyte-g1 以及工业智能体平台「河谷」的初创企业极峰科技的创始人王筱圃,和我们聊一聊什么是时序大模型,和大语言模型的区别和具体的案例,他们如何训练一个 Agent 并把它卖给企业投入到生产流程中。希望能对大家了解 AI Agent 如何应用于工业生产有所帮助。
只要科学任务可以评分,AI就能找到超越人类专家的方法,实现SOTA结果? 这是谷歌一篇最新论文里的内容: 使用大模型+树搜索,让AI大海捞针就行。
昨晚,“阿里版Cursor”AI编程平台Qoder面向全球用户正式推出付费订阅,Pro用户订阅费用为每月20美金(约合人民币142.4元),Pro+用户订阅费用为每月60美金(约合人民币427.1元)。
AI for Science的浪潮下,彻底激发了投资人的热情。 据彭博社报道,AI公司Lila Sciences已经完成2.35亿美元的A轮融资,公司估值约为12亿美元。
上周,福布斯、Wired等争相报道「全球最快开源推理模型」K2-Think,,甚至图灵奖得主Yann LeCun转发推文。但仅三天后,ETH五位研究员的博客如晴天霹雳:87数学评估题竟藏在训练集中!这不仅仅是技术突破,更是行业诚信的警钟。
当Mark Lee 还在哈佛法学院就读时,一门商标法课程让他见识到仿冒产业的惊人规模——这个非法产业年产值超过 3 万亿美元。Sequoia Capital(红杉资本)前亚洲分支机构正在投资一家鲜为人知的初创公司——Marq Vision ,该公司致力于追踪并帮助下架未经授权的 AI 芯片、药品、游戏和奢侈品销售列表。
一觉醒来,宇树带着最新开源模型来了!这次开源的是一个世界模型-动作架构,名叫UnifoLM-WMA-0。它的核心之处在于拥有一个世界模型能够理解机器人和环境相互作用时的物理规律。
什么情况,帮马斯克训练大模型的人说失业就失业了?上周四晚,xAI内部上演了一场突袭测试,还要求员工必须在第二天早上之前完成并提交。这可不是一次简单的随堂测试——截至目前,本次xAI内部测试的淘汰率高达33%,已有超过500名员工被通知卷铺盖走人。
总部位于首尔的芯片初创公司FuriosaAI 正筹备进行一轮可能超过 3 亿美元的 IPO 前融资,该公司致力于挑战英伟达的市场地位。
人类的大脑,会在梦里筛选记忆。如今,AI也开始学会在「睡眠」中整理、保存,甚至遗忘。Bilt部署数百万智能体,让科幻小说里的设问——「仿生人会梦见电子羊吗?」——逐步成真。那么,当AI也能选择忘记时,它会变得更像人,还是更陌生?
在大厂内部“从0到1”推动并构建数据基础设施十余年之后,离哲选择走向台前,开启一场真正意义上的“从技术到产品、从产品到服务闭环”的创业实验。
AI Agent是否正在催生一个全新的经济层?谷歌DeepMind和多伦多大学联合表示:是的。在这里,智能体能够以超出人类直接监管的规模和速度进行交易与协作。
ChatGPT首份使用报告重磅上线!周月活飙至7亿,它已成为高学历白领的办公利器,编程却成为冷门。同时,Anthropic最新报告称,人们交给Claude完成任务暴涨至49%。
智能眼镜赛道,又添一款新产品。刚刚,魅族官方发布了全新AI拍摄眼镜——StarV Snap,首发价1999元。39g的轻量框架,把“会拍”和“能懂”都塞进了一副眼镜里。
奥特曼最近要做什么?投资、合作、加码,这次是一家初创的长寿公司。当然,同样和AI脱不开干系。奥特曼正在加大对旧金山生物技术初创公司Retro Biosciences的投资,该公司希望将人类的寿命延长10年。此前,奥特曼为该公司提供了全部1.8亿美元(约13亿人民币)的种子轮融资,完全是相当看好、倾力支持。
很多人认为,Scaling Law 正在面临收益递减,因此继续扩大计算规模训练模型的做法正在被质疑。最近的观察给出了不一样的结论。研究发现,哪怕模型在「单步任务」上的准确率提升越来越慢,这些小小的进步叠加起来,也能让模型完成的任务长度实现「指数级增长」,而这一点可能在现实中更有经济价值。
OpenAI 刚刚推出了新的编程模型 GPT-5 Codex,见前文:刚刚,OpenAI 发布 GPT‑5-Codex 新模型,专为编程而生
首份最全ChatGPT用户研究报告来了!
凌晨 1 点,OpenAI 发布了 GPT-5-Codex。
关注 AI 行业的朋友都知道,今年上半年 MCP 火得离谱。现在热度稍微降了一些,但已经有一些产品靠 MCP 开始赚钱了。
智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块,针对性优化了“幻觉”、“串语种”等关键问题,在高噪声的场景下,幻觉率从78.5%下降至10.7%,下降幅度接近70%。