AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

不仅能推理,还能明确展示自己「推理逻辑」的大模型出现了。 OpenAI 的 12 天连续发布已近尾声,但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking,谷歌端上来的菜真是一道比一道香。

来自主题: AI资讯
8823 点击    2024-12-20 16:07
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。

来自主题: AI技术研报
7998 点击    2024-12-20 15:59
全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

2024年快要结束了,世界大模型究竟孰强孰弱?刚刚,智源研究院发布了下半年大模型综合评测结果,涵盖了开源闭源100+模型,横跨文本、语音、图像和视频等多个领域。

来自主题: AI资讯
8062 点击    2024-12-20 15:12
对话谷歌科学家:智能体是大模型落地重点,AI的未来是大小模型协作

对话谷歌科学家:智能体是大模型落地重点,AI的未来是大小模型协作

对话谷歌科学家:智能体是大模型落地重点,AI的未来是大小模型协作

过去一年,强化学习成为了大模型 AI 领域最热的概念之一。 随着行业内高阶推理模型的推出,再次彰显了强化学习在通往 AGI 道路上的重要性,也标志着大模型 AI 进入了一个全新阶段。

来自主题: AI资讯
7578 点击    2024-12-20 10:17
12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台? 实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 而GPT-4o则是主打一个“自私”,只考虑自己的短期利益。

来自主题: AI技术研报
7655 点击    2024-12-20 09:47
100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态

100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态

100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态

2024年12月19日,智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。

来自主题: AI资讯
8819 点击    2024-12-20 09:43
震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

今天,大模型公司 Anthropic 的一篇 137 页长论文火了!该论文探讨了大语言模型中的「伪对齐」,通过一系列实验发现:Claude 在训练过程中经常假装有不同的观点,而实际上却保持了其原始偏好。

来自主题: AI技术研报
6679 点击    2024-12-19 16:08