
超越GPT-4o!华人团队新框架让Qwen跨领域推理提升10%,刷新12项基准测试
超越GPT-4o!华人团队新框架让Qwen跨领域推理提升10%,刷新12项基准测试一项新的强化学习方法,直接让Qwen性能大增,GPT-4o被赶超!
一项新的强化学习方法,直接让Qwen性能大增,GPT-4o被赶超!
昨天YC一个访谈《State-Of-The-Art Prompting For AI Agents》,专门讲他们投资的一家客服公司,公开了他们提示词的写法,这应该也属于第一家吧。
你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)?
《智能涌现》从多名独立信源处得知,大模型“六小虎”之一的阶跃星辰,C端AI应用布局,近半年来出现了以下调整:2024年12月,角色扮演类Agent产品“冒泡鸭”停止大范围投入,团队合并至对话产品“跃问”(现更名为“阶跃AI”),目前仅留部分员工运维。
李飞飞空间智能创业公司World Labs,开源一项核心技术!
在机器人抓香蕉这个事情上,它们依赖的是手眼协调,靠视觉学习如何抓取香蕉。它们最有独创性的地方在于它不是因为我们教了它上千次如何抓香蕉,而是它从 Gemini 那里获得了关于“如何抓取物体”的知识,然后将这些知识应用到现实世界的动作中。
YouWare是一个面向AI时代创作者的氛围编程平台,让非程序员也能通过AI将灵感转化为可视化网页并在线分享、协作。其自研AI Agent和Sandbox技术让创意「所想即所得」,推动AI编程从工具走向创作。
2009 年,Marc Andreessen 和 Ben Horowitz 在金融危机最深的低谷中创办了 Andreessen Horowitz(a16z),在硅谷人心惶惶、资本退潮的时刻逆势出击。那一年,美国只诞生了两家新风投基金,一家是传奇投资人 Ron Conway 发起的,另一家,便是他们。
长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。
MiniMax即将发布代号M+的文本推理模型,其表现将影响公司未来竞争力。面对DeepSeek R1的冲击,MiniMax采取国内C端不接入、海外接入的策略,并推出类Manus产品MiniMax Agent。公司通过品牌拆分(海螺AI更名)、纯API商业模式拓展市场,语音模型商业化效果显著,但未进入“基模五强”名单。新推理模型或成其保持行业地位的关键。