
41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码
41个榜单SOTA!智谱最新开源GLM-4.5V实测:看图猜地址、视频秒变代码智谱基于GLM-4.5打造的开源多模态视觉推理模型GLM-4.5V,在42个公开榜单中41项夺得SOTA!其功能涵盖图像、视频、文档理解、Grounding、地图定位、空间关系推理、UI转Code等。
智谱基于GLM-4.5打造的开源多模态视觉推理模型GLM-4.5V,在42个公开榜单中41项夺得SOTA!其功能涵盖图像、视频、文档理解、Grounding、地图定位、空间关系推理、UI转Code等。
2024年,诺贝尔化学奖颁给了蛋白质结构预测与设计领域。 这一奖项不仅是对蛋白质结构预测与设计技术的肯定,更催化了整个蛋白质赛道和生命科学领域的范式变革。
大模型好不容易学会数r,结果换个字母就翻车了? 而且还是最新的GPT-5。 杜克大学教授Kieran Healy表示,自己让GPT-5数了数blueberry里有几个b,结果GPT-5斩钉截铁地回答3个。
想知道全球各大企业对大模型是如何使用的大模型的,今年和去年有哪些不同,请看Artificial Analysis发布的2025年第一季度AI应用报告,把握AI发展的潮流趋势。
「一只手有几根手指?」 这个看似简单的问题,强如 GPT-5 却并不能总是答对。 今天,CMU 博士生、英伟达 GEAR(通用具身智能体研究)团队成员 Tairan He(何泰然)向 GPT-5 询问了这个问题,结果模型回答错了。
GPT-oss放飞自我了?!居然出现了明显的幻觉行为。 在没有提示词的情况下,消耗超过30000个token凭空想出一个问题,还反复求解了5000多次?!
4D 空间智能重建是计算机视觉领域的核心挑战,其目标在于从视觉数据中还原三维空间的动态演化过程。这一技术通过整合静态场景结构与时空动态变化,构建出具有时间维度的空间表征系统,在虚拟现实、数字孪生和智能交互等领域展现出关键价值。
当行业里都认为,宇树是一个做机器人本体的公司,宇树科技创始人王兴兴,在世界机器人大会(WRC)期间的一番言论,打破了这刻板印象。
近年来,文生图模型(Text-to-Image Models)飞速发展,从早期的 GAN 架构到如今的扩散和自回归模型,生成图像的质量和细节表现力实现了跨越式提升。这些模型大大降低了高质量图像创作的门槛,为设计、教育、艺术创作等领域带来了前所未有的便利。
AI吞噬资源、操控表达、重构秩序。每次AI进步都暗埋代价,硅谷精英却信仰末日选择不育。七年调查,华人女记者出版了《AI帝国》,揭露OpenAI背后的隐秘真相!