哈佛医学院做了5679次组学分析:大模型能力没差别,关键在验证
哈佛医学院做了5679次组学分析:大模型能力没差别,关键在验证生物医学AI智能体正从「能不能做组学分析」快速进入下一阶段的检验:做出来的结果,能不能撑得住真实的治疗决策?哈佛医学院Zitnik团队的MEDEA 给出了一条明确的技术路线:与其追求更强的骨干大模型,不如在分析流程的每一步嵌入验证机制。
生物医学AI智能体正从「能不能做组学分析」快速进入下一阶段的检验:做出来的结果,能不能撑得住真实的治疗决策?哈佛医学院Zitnik团队的MEDEA 给出了一条明确的技术路线:与其追求更强的骨干大模型,不如在分析流程的每一步嵌入验证机制。
如果把科研流程整体交给智能体执行,会发生什么?
UCSD团队推出AIBuildAI智能体,无需编程,仅用自然语言描述任务,即可自动设计、编码、训练、调参并优化AI模型,分工协作,端到端完成AI开发。在OpenAI MLE-Bench测试中,AIBuildAI以63.1%的获奖率位居第一,性能媲美人类专家,推动AI开发迈向全自动化新时代。
2026年开年以来,Harness工程一词热度渐高,OpenAI在2月发布的一篇详细的内部实验报告标题中使用了此词,ThoughtWorks 首席科学家 Martin Fowler 在 X上也表示Harness工程是AI赋能软件开发的关键部分。
如今,一场由 AI 智能体驱动的变革正在发生。近日,来自香港科技大学、西北工业大学、清华大学等多家高校及研究机构的学者联合发布了遥感 AI 智能体领域系统综述。全文逾万字,首次为「遥感智能体」给出了严格定义,系统梳理了其架构、应用、数据集与未来方向。
Aaru是一家2024年成立的美国AI智能体初创公司,其核心业务是通过整合人口统计与心理特征数据构建模型,生成精准用户画像,并利用数千个AI智能体模拟人类行为反应,目前已被应用于产品开发、定价策略、新客拓展以及政治民调等多个领域。
微信「绝密级」AI智能体还在秘密开发,一位前腾讯工程师已经在硅谷交出了答卷——全球首个人类与AI共生的社交网络Teamily AI,让Agent组团混进群聊,带队干活。
龙虾席卷全球,美中两大社交巨头同一周出手。腾讯秘密为微信打造原生AI智能体;Meta火速收购龙虾社交网络Moltbook,抢建AI智能体时代的社交图谱。
谷歌大神用6个AI智能体杀疯了。
Google DeepMind最新AI智能体Aletheia在FirstProof挑战赛中,独立攻克了6道世界级数学难题,实现了从竞赛水平到PhD科研级的质变。人类数学研究的「手工时代」或许正步入倒计时。