
o3完爆人类医生,OpenAI联合262名执业医师推出AI健康基准,直击医疗AGI!
o3完爆人类医生,OpenAI联合262名执业医师推出AI健康基准,直击医疗AGI!OpenAI发布新基准HealthBench,联手60个国家262名执业医生,树立新的「AGI标志性用例」。OpenAI o3碾压Grok 3和Gemini 2.5 Pro,成功登顶。而最强AI几乎达到了人类医生最佳水平!
OpenAI发布新基准HealthBench,联手60个国家262名执业医生,树立新的「AGI标志性用例」。OpenAI o3碾压Grok 3和Gemini 2.5 Pro,成功登顶。而最强AI几乎达到了人类医生最佳水平!
AI大模型“六小虎”之一的月之暗面,近期对AI医疗产品进行了布局,用于提升旗下产品Kimi在专业领域的搜索质量,并且探索Agent等产品方向。针对上述信息,月之暗面回应《智能涌现》:Kimi近期持续在优化财经、法律、医学等专业领域的搜索信源质量,希望给用户提供更可信、可靠的高质量回答。
说个超级有意思的事。 今天凌晨,一个AI设计类的垂直Agent工具,在X上爆了。
一夜之间,老黄天塌了(doge)。
Hi,我是银海。 你身边的AI产品经理,陪你解决每一个真实问题。 刚刚,前阵子很火的 AI Agent 概念工具 Manus,刚刚终于开放了全面注册。
硬氪获悉,近日新加坡人工智能金融科技公司RockFlow宣布完成1000万美元A1轮融资,由头部互联网公司创始人领投,老股东持续加注。本轮资金将用于进一步提升其人工智能技术和即将推出的金融AI Agent —— Bobby。
AI 产品的付费模式,尤其是 Agent 产品,传统的付费模式已经不再适用了,不管是 token 量还是席位模式。
在视觉语言模型(Vision-Language Models,VLMs)取得突破性进展的当下,长视频理解的挑战显得愈发重要。以标准 24 帧率的标清视频为例,仅需数分钟即可产生逾百万的视觉 token,这已远超主流大语言模型 4K-128K 的上下文处理极限。
谷歌最新发布的76页AI智能体白皮书,深入剖析了智能体的应用前景。智能体通过感知环境、调用工具和自主规划,能够完成复杂任务并做出高级决策。从智能体运维(AgentOps)到多智能体协作,这份白皮书为AI智能体指明了方向。
Agent 正在成为 2025 年 AI 世界最炙手可热的关键词之一。