AI资讯新闻榜单内容搜索-14

DeepSeek R1遇难题142次"I give up"，研究还称需增加推理时机控制机制

最新大语言模型推理测试引众议，DeepSeek R1常常在提供错误答案前就“我放弃”了？？ Cursor刚刚参与了一项研究，他们基于NPR周日谜题挑战（The Sunday Puzzle），构建了一个包含近600个问题新基准测试。

来自主题: AI技术研报

7602 点击 2025-02-14 17:41

2月11日，在阿联酋迪拜举办的World Governments Summit 2025峰会上，百度创始人李彦宏与阿联酋AI部长奥马尔·苏丹·奥拉马（Omar Sultan AI Olama）对谈时表示，尽管技术进步、成本降低，但仍需持续投入AI基础设施，以确保处于技术创新的最前沿。

来自主题: AI资讯

8682 点击 2025-02-12 11:53

OpenAI感受到不小的危机，甚至开始走营销的“捷径”。近日OpenAI以 60 秒的广告首次亮相超级碗(全国橄榄球联盟的年度冠军赛)，这则广告上半年的投放成本约为 1400 万美元。

来自主题: AI资讯

8551 点击 2025-02-10 20:36

DeepSeek火的一塌糊涂，其访问量暴涨614%，已成全球第二大爆火应用。马斯克剧透，xAI将发布比R1更好的模型。

来自主题: AI资讯

8043 点击 2025-02-09 21:38

DeepSeek带火知识蒸馏，原作者现身爆料：原来一开始就不受待见。称得上是“蒸馏圣经”、由Hinton、Oriol Vinyals、Jeff Dean三位大佬合写的《Distilling the Knowledge in a Neural Network》，当年被NeurIPS 2014拒收。

来自主题: AI技术研报

8126 点击 2025-02-07 15:43

昨日，AI 社区最大的新闻当属 OpenAI 发布的全新智能体 Deep Research 了！作为一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体，Deep Research 旨在帮助用户进行深入、复杂的信息查询与分析。

来自主题: AI资讯

9744 点击 2025-02-05 11:34

谈到大模型的“国货之光”，除了DeepSeek之外，阿里云Qwen这边也有新动作——首次将开源Qwen模型的上下文扩展到1M长度。

来自主题: AI资讯

9815 点击 2025-01-27 14:18

要花1450元才能玩到Operator，让本来满满期待的大伙，一下难受住了。而交了钱的各位，开始兴奋的晒出各种测试结果。有网友分享，Operator通过浏览网页在3分钟之内帮打找到了附近牙医诊所，回报了地址和电话。

来自主题: AI资讯

12046 点击 2025-01-24 21:36

最近需要整理一些 AI IDE 的资料，读了好几篇海外独角兽的文章，对 cursor 的访谈那篇印象深刻，但我个人更喜欢用 windsurf，作为对比，我找来了 windsurf 的访谈，时间是2024 年 12 月 14 日，正好满一个月，希望对大家有用！

来自主题: AI资讯

7942 点击 2025-01-14 09:52

本文根据智联招聘集团执行副总裁李强在刺猬公社第五届新内容探索者大会上的发言整理：我分享的大部分内容，来自于智联招聘3.6亿的求职用户和累计合作的将近1400万家企业给出的答案。

来自主题: AI资讯

8439 点击 2025-01-11 11:09