
苹果大模型新成果:GPT-4o扮演用户,在场景中考察大模型工具调用,网友:Siri也要努力 | 开源
苹果大模型新成果:GPT-4o扮演用户,在场景中考察大模型工具调用,网友:Siri也要努力 | 开源苹果团队,又发布了新的开源成果——一套关于大模型工具调用能力的Benchmark。
苹果团队,又发布了新的开源成果——一套关于大模型工具调用能力的Benchmark。
我最近有一个很大的习惯转变:最早有问题是问百度,后来问小红书,现在我第一个想到的是先问下AI搜索。 当下AI搜索产品也有不少了,用了一圈下来,最后还是留下了三款能常驻我的使用序列里的产品。
AI 视频生成公司 HeyGen 最近完成了 6000 万美元的 A 轮融资,公司估值已达 5 亿美元。此次融资由 Benchmark 领投,Conviction、Thrive Capital 和 Bond Capital 参与。截至目前,HeyGen 已累计筹到 7400 万美元。
本文根据极客公园创始人&总裁 张鹏在 Founder Park AGI Palyground 2024 上的演讲整理。
Claude 3.5 Sonnet的图表推理能力,比GPT-4o高出了27.8%。 针对多模态大模型在图表任务上的表现,陈丹琦团队提出了新的测试基准。 新Benchmark比以往更有区分度,也让一众传统测试中的高分模型暴露出了真实能力。
还有12款大模型全军覆没……
刚刚AI搜索又出新产品了,这次是前百度高管离职后创业融资6千万美元,推出的首个AI产品——Genspark。
AI搜索不是救世主,但是一种新选择。
AI搜索的创业门槛正在变高
瑞士领先的生物计算初创公司FinalSpark推出了首个在线平台Neuroplatform,使全球研究人员能够全天候访问16个人脑类器官,FinalSpark旨在开发世界上第一个生物处理器。这种生物处理器功耗比传统数字处理器低一百万倍,有可能减少计算机过度使用造成的环境影响。