AI资讯新闻榜单内容搜索-o1

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: o1
DeepSeek 推理模型预览版上线,解密 o1 推理过程

DeepSeek 推理模型预览版上线,解密 o1 推理过程

DeepSeek 推理模型预览版上线,解密 o1 推理过程

今天,DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。所有用户均可登录官方网页 (chat.deepseek.com),一键开启与 R1-Lite 预览版模型的超强推理对话体验。DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。

来自主题: AI资讯
10046 点击    2024-11-20 23:11
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格

如何解决模型生成幻觉一直是人工智能(AI)领域的一个悬而未解的问题。为了测量语言模型的事实正确性,近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型事实正确性这一领域,目前该领域存在数据过时、评测不准和覆盖不全等问题。例如现在大家广泛使用的知识评测集还是 CommonSenseQA、CMMLU 和 C-Eval 等选择题形式的评测集。

来自主题: AI技术研报
7429 点击    2024-11-20 15:02
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等出品,首个多模态版o1开源模型来了—— 代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。 在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。

来自主题: AI技术研报
5321 点击    2024-11-19 21:01
狂欢背后的冷思考:Open AI“网红化”搅动AI圈

狂欢背后的冷思考:Open AI“网红化”搅动AI圈

狂欢背后的冷思考:Open AI“网红化”搅动AI圈

Open AI作为AI时代的科技先锋,每一个动向都备受关注。但是吃多了“网红化”带来的流量红利,Open AI似乎很难像学者一样老实待在实验室了。

来自主题: AI资讯
5113 点击    2024-11-19 10:28
NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队给出理论解释

NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队给出理论解释

NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强?北大、MIT团队给出理论解释

自我纠错(Self Correction)能力,传统上被视为人类特有的特征,正越来越多地在人工智能领域,尤其是大型语言模型(LLMs)中得到广泛应用,最近爆火的OpenAI o1模型[1]和Reflection 70B模型[2]都采取了自我纠正的方法。

来自主题: AI技术研报
4454 点击    2024-11-18 14:54
杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

杨植麟发布Kimi新模型:数学对标o1,中考高考考研成绩全第一

kimi全面开放一周年之际,创始人杨植麟亲自发布新模型—— 数学模型k0-math,对标OpenAI o1系列,主打深入思考。 在MATH、中考、高考、考研4个数学基准测试中,k0-math成绩超过o1-mini和o1-preview。

来自主题: AI资讯
6912 点击    2024-11-16 21:16
17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。

17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。

17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。

这两天,我被这个Claude3.5这个神级Prompt惊呆了。 佩服的五体投地。 非常简单的话说,就是它用Prompt把o1级别的思维链,复刻到了Claude3.5里,而且思考逻辑更详细、更像人,甚至思考过程都跟o1一样,可以展开折叠。

来自主题: AI资讯
7178 点击    2024-11-15 20:28
谷歌杀回来了!新版Gemini跑分超o1登顶第一,CEO:这才哪到哪儿

谷歌杀回来了!新版Gemini跑分超o1登顶第一,CEO:这才哪到哪儿

谷歌杀回来了!新版Gemini跑分超o1登顶第一,CEO:这才哪到哪儿

鲨疯了!谷歌新版Gemini超越o1,强势登顶竞技场总榜第一! 在经6000+网友匿名投票后,不仅数学成绩和学霸o1相当,还拿下其它5个单项第一。

来自主题: AI资讯
5839 点击    2024-11-15 20:21