AI资讯新闻榜单内容搜索-ai

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ai
你的Prompt已达性能极限?试试这个0成本的优化 | 马里兰大学最新

你的Prompt已达性能极限?试试这个0成本的优化 | 马里兰大学最新

你的Prompt已达性能极限?试试这个0成本的优化 | 马里兰大学最新

上下文学习(In-Context Learning, ICL)、few-shot,经常看我文章的朋友几乎没有人不知道这些概念,给模型几个例子(Demos),它就能更好地理解我们的意图。但问题来了,当您精心挑选了例子、优化了顺序,结果模型的表现还是像开“盲盒”一样时……有没有可能,问题出在一个我们谁都没太在意的地方,这些例子,到底应该放在Prompt的哪个位置?

来自主题: AI资讯
5618 点击    2025-08-02 12:37
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4

谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4

谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4

谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。

来自主题: AI资讯
8138 点击    2025-08-02 11:41
OpenAI回应ChatGPT用多了会变傻

OpenAI回应ChatGPT用多了会变傻

OpenAI回应ChatGPT用多了会变傻

ChatGPT用多了会变傻?官方回应来了! OpenAI教育主管Leah Belsky明确表示:AI本质上是一个工具,关键在于如何使用它。

来自主题: AI资讯
5518 点击    2025-08-01 17:05
Manus AI 上线以来最大更新:100 个 Agent 为你打工,但缺点是太烧钱了

Manus AI 上线以来最大更新:100 个 Agent 为你打工,但缺点是太烧钱了

Manus AI 上线以来最大更新:100 个 Agent 为你打工,但缺点是太烧钱了

一个 Agent(智能体)不够用?Manus 干脆给你拉来 100 个。 今天凌晨,Manus 推出了一项新功能:Manus Wide Research。这项功能的核心亮点在于,用户只需一键即可开启大规模并行 Agent 协作,轻松处理原本需要耗费数小时、动用数百个数据源的复杂调研任务。

来自主题: AI资讯
6158 点击    2025-08-01 16:51
GPT-5真身曝光,首测编程惊艳全网!一句话秒生游戏,OpenAI双雄备战AGI

GPT-5真身曝光,首测编程惊艳全网!一句话秒生游戏,OpenAI双雄备战AGI

GPT-5真身曝光,首测编程惊艳全网!一句话秒生游戏,OpenAI双雄备战AGI

GPT-5更近了!今天,神秘模型Horizon Alpha火遍全网,编码首测性能逆天,各种三方基准实测相继放出。就在发布前夕,OpenAI核心大脑专访坦言模型还有瓶颈,但坚信Scaling Law没有尽头。

来自主题: AI资讯
5730 点击    2025-08-01 16:44
全球首款通用AI科研智能体问世:我一个文科生用它写了份CRISPR基因编辑综述报告

全球首款通用AI科研智能体问世:我一个文科生用它写了份CRISPR基因编辑综述报告

全球首款通用AI科研智能体问世:我一个文科生用它写了份CRISPR基因编辑综述报告

就在一夜之间,用 AI 帮忙搞科研,不是再只是想想了。 最近,科研圈里越来越多的人在讨论一种叫 SciMaster 的「AI 科学助手」,有让它做实验的,有让他帮忙开题的,还有跟他聊科幻的。

来自主题: AI技术研报
6378 点击    2025-08-01 16:33
Ilya之后,两位90后撑起OpenAI核心研究

Ilya之后,两位90后撑起OpenAI核心研究

Ilya之后,两位90后撑起OpenAI核心研究

Ilya之后,谁是支撑起OpenAI研究的人? GPT-5发布前夕,奥特曼公开了他背后的两位90后得力干将。

来自主题: AI资讯
5709 点击    2025-08-01 16:17
中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先

中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先

中国在AI领域超越美国已是板上钉钉?吴恩达:美国无法保持领先

中国在人工智能领域已经成为全球竞争的重要力量。根据斯坦福 2025 年 AI 指数报告,美国虽然仍领先于顶级模型数量,但中国正在迅速缩小差距 —— 在 MMLU、HumanEval 等基准测试中的差距已从几乎双位数下降到几乎持平。

来自主题: AI资讯
6078 点击    2025-08-01 16:12
思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理,7B模型媲美闭源大尺寸模型

近期,随着OpenAI-o1/o3和Deepseek-R1的成功,基于强化学习的微调方法(R1-Style)在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现,但在通用多模态数据上的应用研究仍有待深入。

来自主题: AI技术研报
6667 点击    2025-08-01 16:08