AI资讯新闻榜单内容搜索-o1

首个自主机器学习AI工程师，刚问世就秒了OpenAI o1，Kaggle大师拿到饱

多智能体系统，可自动化整个 ML 工作流程，节省数千小时工时。

来自主题: AI资讯

10136 点击 2024-11-16 15:33

17岁高中生写了个神级Prompt，直接把Claude强化成了满血o1。

这两天，我被这个Claude3.5这个神级Prompt惊呆了。佩服的五体投地。非常简单的话说，就是它用Prompt把o1级别的思维链，复刻到了Claude3.5里，而且思考逻辑更详细、更像人，甚至思考过程都跟o1一样，可以展开折叠。

来自主题: AI资讯

10548 点击 2024-11-15 20:28

谷歌杀回来了！新版Gemini跑分超o1登顶第一，CEO：这才哪到哪儿

鲨疯了！谷歌新版Gemini超越o1，强势登顶竞技场总榜第一！在经6000+网友匿名投票后，不仅数学成绩和学霸o1相当，还拿下其它5个单项第一。

来自主题: AI资讯

6681 点击 2024-11-15 20:21

李飞飞吴佳俊团队新作：推出具身智能决策能力评价基准，o1-preview登顶 | NeurIPS

大模型的具身智能决策能力，终于有系统的通用评估基准了。

来自主题: AI技术研报

8997 点击 2024-11-14 20:48

AI斩获6枚金牌！华为Kaggle大师级智能体诞生，自主解决数据科学难题

继 OpenAI o1 成为首个达到 Kaggle 特级大师的人工智能（AI）模型后，另一个 Kaggle 大师级 AI 也诞生了。

来自主题: AI技术研报

6275 点击 2024-11-14 20:36

一个有意思的Prompt演员框架，LLMs被当成演员；提示被当成剧本；LLM输出被当成表演，o1从76%提高到87%

如何更好地设计提示词（Prompt）一直是大家关注的焦点。最近，一个独特的研究视角引起了广泛关注：将LLMs视为“演员”，将提示词视为“剧本”，将模型输出视为“表演”。

来自主题: AI技术研报

4403 点击 2024-11-13 14:19

o1不是唯一路径！MIT新研究：在测试时训练，模型推理能力最高升至5.8倍

o1不是通向大模型推理的唯一路径！ MIT的新研究发现，在测试时对大模型进行训练，可以让推理水平大幅提升。

来自主题: AI技术研报

4160 点击 2024-11-12 13:17

o1/Claude集体翻车！陶哲轩等60+顶尖数学家合力提出新数学基准，大模型正确率通通不足2%

让大模型集体吃瘪，数学题正确率通通不到2%！

来自主题: AI技术研报

8237 点击 2024-11-12 11:07

全球首个法律o1大模型发布，System2范式下慢思考法律专家｜港科大&北大

OpenAI o1风格的推理大模型，有行业垂直版了。HK-O1aw，是由香港生成式人工智能研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR) 联合北京大学对齐团队（PKU-Alignment Team）推出的全球首个慢思考范式法律推理大模型。

来自主题: AI资讯

5280 点击 2024-11-09 15:34

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LLM进化出复杂推理能力

近日，一篇文章在推特上爆火，利用纯提示方法让普通LLM摇身一变，成为具备复杂推理能力的OpenAI o1。

来自主题: AI资讯

4181 点击 2024-11-07 21:08

AI资讯新闻榜单内容搜索-o1

​首个自主机器学习AI工程师，刚问世就秒了OpenAI o1，Kaggle大师拿到饱

17岁高中生写了个神级Prompt，直接把Claude强化成了满血o1。

谷歌杀回来了！新版Gemini跑分超o1登顶第一，CEO：这才哪到哪儿

李飞飞吴佳俊团队新作：推出具身智能决策能力评价基准，o1-preview登顶 | NeurIPS

AI斩获6枚金牌！华为Kaggle大师级智能体诞生，自主解决数据科学难题

一个有意思的Prompt演员框架，LLMs被当成演员；提示被当成剧本；LLM输出被当成表演，o1从76%提高到87%

o1不是唯一路径！MIT新研究：在测试时训练，模型推理能力最高升至5.8倍

o1/Claude集体翻车！陶哲轩等60+顶尖数学家合力提出新数学基准，大模型正确率通通不足2%

全球首个法律o1大模型发布，System2范式下慢思考法律专家｜港科大&北大

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LLM进化出复杂推理能力

首个自主机器学习AI工程师，刚问世就秒了OpenAI o1，Kaggle大师拿到饱