刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理
刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理商汤最新升级的日日新SenseNova V6解锁的新能力—— 原生多模态通用大模型,采用6000亿参数MoE架构,实现文本、图像和视频的原生融合。从性能评测来看,SenseNova V6已经在纯文本任务和多模态任务中,多项指标均已超越GPT-4.5、Gemini 2.0 Pro,并全面超越DeepSeek V3:
搜索
商汤最新升级的日日新SenseNova V6解锁的新能力—— 原生多模态通用大模型,采用6000亿参数MoE架构,实现文本、图像和视频的原生融合。从性能评测来看,SenseNova V6已经在纯文本任务和多模态任务中,多项指标均已超越GPT-4.5、Gemini 2.0 Pro,并全面超越DeepSeek V3:
Google 终于下场了。搞了一个完全平替 V0、Bolt.new、Lovable 的产品 Firebase Studio。用自然语言一键生成网站或者App,后续还能集成 firebase 的各种服务,构建全栈应用。
Grok3 API 现在已经全网上线可以使用,只要需要绑定卡并且充值不低于5美金就可以免费使用Grok3 API。
OpenAI 竞争对手Anthropic ,计划为其 Claude 聊天机器人推出价格更高的订阅选项。2025 年 3 月,Anthropic 以 615 亿美元的估值完成了 35 亿美元的融资交易,巩固了其作为全球最大初创企业之一的地位。
刚刚,Kimi团队上新了!
今天凌晨,国际计算机学会(ACM)宣布了今年的 ACM 计算突破奖获奖者。丛京生(Jason Cong)「因其在现场可编程系统和可定制计算的设计和自动化方面做出的奠基性贡献而获奖」。
当下,人工智能(AI)技术正深度重塑医药健康行业格局。作为上海市“工赋链主”培育企业以及全球化医药健康产业集团,上海复星医药(集团)股份有限公司(简称“复星医药”),在药物研发、医学影像、精准医疗等领域进行AI布局,提升研发效率,推动行业发展。
利用字节团队魔改的FLUX模型,可以直接把多个参考主体放进一张图了。
昨天晚上,Google发了一个关于Agent的新开放协议。
谷歌首款AI推理特化版TPU芯片来了,专为深度思考模型打造。
GPT开山一作、「爱因斯坦级的天才」携手OpenAI前首席研究官,一起加入OpenAI前CTO的新公司Thinking Machine Lab。有消息称,Thinking Machine Lab曾与风投洽谈,筹集超过1亿美元的资金。
谷歌Deep Research重大升级,搭载全球顶尖Gemini 2.5 Pro模型。5分钟生成46页学术论文、复杂报告转为10分钟播客。性能超OpenAI DR 40%,价格仅为其1/10。
世界模型领域最新进展,要比拼“世界生成”了。
确实更快、更开放了
24笔过亿美元融资,美国16笔、中国2笔。
计算技术的一个历史时刻。
OpenAI o1/o3-mini级别的代码推理模型竟被抢先开源!UC伯克利和Together AI联合推出的DeepCoder-14B-Preview,仅14B参数就能媲美o3-mini,开源代码、数据集一应俱全,免费使用。
美团医药健康构建“检医药院养”全场景闭环,“药品+”跨品类消费用户占比已达46%
AI大模型在咖啡店怎么落地?
自数字人技术Omnihuman-1引起行业关注之后,字节智能创作团队再放大招。全新DreamActor-M1横空出世,一张照片一段视频,就能生成电影级视频,精准迁移表情动作,还支持多种画风。
芯片设计是现代科技的核心,逻辑优化(Logic Optimization, LO)作为芯片设计流程中的关键环节,其效率直接影响着芯片设计的整体性能。
北京大学陈宝权教授团队提出RainyGS技术,通过结合物理模拟和3D高斯泼溅渲染框架,实现了真实场景中动态雨效的高质量仿真与呈现,真正实现「从真实到真实」,或者「以仿真乱真」,即Real2Sim2Real !相比现有的视频编辑工具(如 Runway),其物理真实性获得保证。
谷歌重磅发布第七代TPU Ironwood,专为推理设计,性能较从初代飙升3600倍,可与英伟达B200一较高下。不仅如此,谷歌还带来了Veo 2等多款模型全新升级,就连「谷歌版」MCP协议也公布了。
统一多模态大模型(U-MLLMs)逐渐成为研究热点,近期GPT-4o,Gemini-2.0-flash都展现出了非凡的理解和生成能力,而且还能实现跨模态输入输出,比如图像+文本输入,生成图像或文本。
4月7日,斯坦福以人为本人工智能研究所(HAI)发布《2025年AI指数报告》,这份长达456页的报告,全景展示了过去一年AI领域的关键进展。
谷歌推出A2A协议,即Agent2Agent,能让AI Agent在不同生态系统间安全协作,而无需考虑框架或供应商。不同平台构建的AI Agent之间可以进行通信、发现彼此的能力、协商任务并开展协作,企业可通过专业Agent团队处理复杂工作流。
无监督学习训练整数规划求解器的新范式来了。
LLM Agent 火了两年了,但业界仍然存在许多非共识。智能体数量卷上去了,概念炒上去了,但质量参差不齐,娱乐向的不好玩,提效向的不好用,具体企业落地更是各种大小问题不断。
好消息,由谷歌最新的 Gemini 2.5 Pro 模型提供支持的 Deep Research(深度研究)正式发布!坏消息,目前仅 Gemini Advanced 付费会员可体验。
嚯!完全由AI生成的论文,通过顶会ICLR workshop评审?!