AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%

自动学会工具解题,RL扩展催化奥数能力激增17%

在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。不过,当今的大模型在使用工具方面还存在一些局限,比如预先确定了工具的使用模式、限制了对最优策略的探索、实现透明度不足等。

来自主题: AI技术研报
9305 点击    2025-04-02 10:09
途牛“AI助手小牛”正式上线

途牛“AI助手小牛”正式上线

途牛“AI助手小牛”正式上线

4月1日,途牛旅游网自主研发的“AI助手小牛”旅游应用Agent正式上线途牛旅游APP、“AI助手小牛”小程序。“AI助手小牛”结合旅行垂直应用场景与开源大模型(DeepSeek、通义千问),实现了机票、酒店、火车票快捷查询、预订服务,能够为用户提供智能、专业的“0搭售"旅游服务方案。

来自主题: AI资讯
7944 点击    2025-04-02 09:33
实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

数学题, 一直是检验 AI 实力的 “硬核考场” —— 公式推导、逻辑链条、抽象思维缺一不可 。最近,我好了几天时间对国内外 7 款大厂模型展开了一场 “数学高考 ”,用阿里全球数学竞赛 + 中国奥赛真题实测它们的智商上限。

来自主题: AI产品测评
9615 点击    2025-04-01 14:25
刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

如今,有越来越多的网友发现,Gemini 2.5 Pro已经成为全球大模型中名副其实的冠军,刷爆各类基准测试和智商测试!它的智商达到130,其中数学方面已经强于大多数研究生,甚至几句提示,就能模拟宇宙规律。

来自主题: AI资讯
8476 点击    2025-03-31 19:59
亲测!推荐一款懂 IoT 物联网的「AI 专业搜索」大模型,无限制免费用

亲测!推荐一款懂 IoT 物联网的「AI 专业搜索」大模型,无限制免费用

亲测!推荐一款懂 IoT 物联网的「AI 专业搜索」大模型,无限制免费用

最近,基于乐鑫ESP32-S3核心板开发AI聊天机器人火爆物联网领域,深圳华强北挣得盆满锅满,作为 IoT 老司机眼中满是羡慕,幸好有问小白,帮我快速掌握ESP-IDF框架开发,协助我只用了3天就手搓出一个智能AI玩具!

来自主题: AI资讯
7845 点击    2025-03-31 09:31
全球首个1型糖尿病专病大模型正式发布

全球首个1型糖尿病专病大模型正式发布

全球首个1型糖尿病专病大模型正式发布

3月29日,国家“四大慢病”重大专项核心成果——全球首个1型糖尿病专病大模型在合肥成功发布。该成果标志着安徽省在慢病防治领域首次实现国家级重大科研项目成果转化,正式迈入卫生健康科技创新“国家队”行列。

来自主题: AI资讯
7497 点击    2025-03-30 21:44
“计算机视觉被GPT-4o终结了”(狗头)

“计算机视觉被GPT-4o终结了”(狗头)

“计算机视觉被GPT-4o终结了”(狗头)

一夜之间,CV被大模型“解决”了(狗头)。万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被开发出来。万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被开发出来。

来自主题: AI资讯
7202 点击    2025-03-30 10:43
揭秘京东布局AI的底层逻辑

揭秘京东布局AI的底层逻辑

揭秘京东布局AI的底层逻辑

和腾讯、字节通过元宝、豆包发力AI to C市场不同,2024年京东在AI端重点发力言犀大模型、数字人、智能体平台、智能编码助手JoyCoder等B端产品。截至2024年底,京东平台上已经有80万商家使用了京东AI工具。

来自主题: AI资讯
7703 点击    2025-03-30 10:27
17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

AI社区掀起用大模型玩游戏之风!例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。

来自主题: AI技术研报
8574 点击    2025-03-29 10:19