AI资讯新闻榜单内容搜索-GPT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT
多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

多步推理碾压GPT-4o,无需训练性能提升10%!斯坦福开源通用框架OctoTools

OctoTools通过标准化工具卡和规划器,帮助LLMs高效完成复杂任务,无需额外训练。在16个任务中表现优异,比其他方法平均准确率高出9.3%,尤其在多步推理和工具使用方面优势明显。

来自主题: AI技术研报
6900 点击    2025-03-12 14:47
刚刚,OpenAl 发布 Agent 工具包,网友:谢谢 Manus AI

刚刚,OpenAl 发布 Agent 工具包,网友:谢谢 Manus AI

刚刚,OpenAl 发布 Agent 工具包,网友:谢谢 Manus AI

就在刚刚,OpenAI 发布了一系列专为构建 AI Agents 设计的新工具和 API,帮助开发者更容易创建能自动完成任务的 AI Agents(智能体)。

来自主题: AI资讯
9962 点击    2025-03-12 10:12
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

在32道高等数学测试中,LLM表现出色,平均能得分90.4(按百分制计算)。GPT-4o和Mistral AI更是几乎没错!向量计算、几何分析、积分计算、优化问题等,高等AI模型轻松拿捏。研究发现,再提示(Re-Prompting)对提升准确率至关重要。

来自主题: AI技术研报
9295 点击    2025-03-11 18:38
1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区?

1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区?

1000 token/s的「扩散LLM」凭什么倒逼AI走出舒适区?

ChatGPT 平地一声雷,打乱了很多人、很多行业的轨迹和节奏。这两年模型发布的数量更是数不胜数,其中文本大模型就占据了 AIGC 赛道的半壁江山。关注我的家人们永远都是抢占 AI 高地的冲锋者。

来自主题: AI技术研报
8237 点击    2025-03-11 11:36
1.5B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍

1.5B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍

1.5B硬刚GPT-4o,CMU祭出LCPO提示可控思考!每token性能较S1暴涨2倍

CMU团队用LCPO训练了一个15亿参数的L1模型,结果令人震惊:在数学推理任务中,它比S1相对提升100%以上,在逻辑推理和MMLU等非训练任务上也能稳定发挥。更厉害的是,要求短推理时,甚至击败了GPT-4o——用的还是相同的token预算!

来自主题: AI技术研报
5884 点击    2025-03-10 10:22
二次增长!ChatGPT周活用户数据翻倍到2亿!一文梳理OpenAI的流量暴涨之路。DeepSeek紧随其后!

二次增长!ChatGPT周活用户数据翻倍到2亿!一文梳理OpenAI的流量暴涨之路。DeepSeek紧随其后!

二次增长!ChatGPT周活用户数据翻倍到2亿!一文梳理OpenAI的流量暴涨之路。DeepSeek紧随其后!

知名风险投资公司 Andreessen Horowitz (a16z) 周四刚刚发布了新报告。报告发现,ChatGPT 用了 9 个月的时间从 2023 年 11 月的每周 1 亿活跃用户增长到 2024 年 8 月的 2 亿,但现在该应用程序只用了不到六个月的时间就再次将这一数字翻了一番。

来自主题: AI资讯
9120 点击    2025-03-07 16:30