AI资讯新闻榜单内容搜索-Ark

AI基准测试集体塌房，最高84%都是坏题｜斯坦福最新研究

基准测试（Benchmarks）在人工智能的发展进程中扮演着至关重要的角色，构成了评价生成式模型（Generative Models）性能的事实标准。对于从事模型训练与评估的AI研究者而言，GSM8K、MMLU等数据集的数据质量直接决定了评估结论的可靠性。

来自主题: AI技术研报

8188 点击 2025-11-28 09:28

黄仁勋送马斯克的3万块个人超算，要借Mac Studio才能流畅运行？首批真实体验来了

2000 亿参数、3 万块人民币、128GB 内存，这台被称作「全球最小超算」的机器，真的能让我们在桌面上跑起大模型吗？向左滑动查看更多内容，图片来自 x@nvidia 前段时间，黄仁勋正式把这台超

来自主题: AI资讯

8123 点击 2025-11-23 19:43

真格天使项目「Genspark」宣布完成 2.75 亿美元 B 轮融资，打造新一代 AI 智能体平台

11 月 21 日，AI 初创公司 Genspark 正式宣布完成 2.75 亿美元 B 轮融资。上线仅五个月，Genspark 年化收入已突破 5000 万美元，跻身行业增长最快的 AI 企业之一。

来自主题: AI资讯

8571 点击 2025-11-21 17:09

“宁可砍掉自己的手，也不用AI！”独立开发者怒怼Nexon CEO「所有公司都在用AI」言论

近期，《Arc Raiders》宣布即将推出双人合作模式，以及类似《Helldivers 2》的社区任务活动——但在玩家还没来得及为新玩法兴奋之前，这款游戏的开发商 Embark Studios 却陷入了另一场更棘手的争议：再度被曝使用生成式 AI 进行游戏配音。

来自主题: AI资讯

6870 点击 2025-11-21 10:15

NeurIPS 2025｜当AI学会"炒股"：用千个虚拟投资者重现金融市场涌现现象

市场不是机器，而是人群；不是公式，而是故事。TwinMarket让AI学会讲述这些故事。 1994年，美国圣塔菲研究所（Santa Fe Institute）推出了一个野心勃勃的项目：人工股票市场（A

来自主题: AI技术研报

7569 点击 2025-11-16 10:40

一年省万元？全球首款AI健身伴侣上线

随着全球用户健康意识的不断提升，健身成为最高频的生活习惯之一，如何让健身更有效、科学并预防损伤是一门专业技能，因而健身教练的市场也水涨船高，一年上万的费用随处可见，对于用户来说，私教定制一方面价格比较贵，另一方面在时间上的自由度更低，无法随时随地进行。而现在全球首款AI健身伴侣BodyPark ATOM即将上线KS，助于用户更高效、更智能地训练。

来自主题: AI资讯

9466 点击 2025-11-11 16:41

Cursor 首度揭秘："训练即产品"，用强化学习让 AI 编程快 4 倍的秘密武器

Sasha Rush 在分享开头就提到，Cursor Composer 在他们的内部 benchmark 上的表现几乎与最好的 Frontier 模型（前沿模型）持平，并且优于去年夏天发布的所有模型。它的表现明显好于最好的开源模型，以及那些被标榜为"快速"的模型。

来自主题: AI技术研报

8338 点击 2025-11-11 11:12

他发明了价值万亿的AGI，如今穷困潦倒

1997年首提AGI的马克·古布鲁德（Mark Gubrud），从地下室论文到被遗忘的命名者；而今AGI成巨头博弈与数千亿美元资本的关键开关，微软与OpenAI以其为合同枢纽与控制权杠杆，标准却愈发模糊。

来自主题: AI资讯

6944 点击 2025-11-05 09:56

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

刚刚，OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。目前，Aardvark还处于beta测试阶段。OpenAI称，Aardvark开创了「防御者优先」的新范式：作为自主安全研究智能体，随代码不断演化，为团队提供持续保护（continuous protection）。

来自主题: AI资讯

8548 点击 2025-10-31 15:34

Cursor 联创宣布离职，公开声明仅写了 72 个单词

美国当地时间 10 月 29 日，据外媒消息，AI 编码工具 Cursor 背后的公司 Anysphere 的联合创始人 Arvid Lunnemark 已离职。Cursor 最初由四位联合创始人创立，除了 Lunnemark 之外，还有 Aman Sanger、Michael Truell 和 Sualeh Asif。

来自主题: AI资讯

7357 点击 2025-10-31 09:39

AI资讯新闻榜单内容搜索-Ark

AI基准测试集体塌房，最高84%都是坏题 ｜斯坦福最新研究

黄仁勋送马斯克的3万块个人超算，要借Mac Studio才能流畅运行？首批真实体验来了

真格天使项目「Genspark」宣布完成 2.75 亿美元 B 轮融资，打造新一代 AI 智能体平台

“宁可砍掉自己的手，也不用AI！”独立开发者怒怼Nexon CEO「所有公司都在用AI」言论

NeurIPS 2025｜当AI学会"炒股"：用千个虚拟投资者重现金融市场涌现现象

一年省万元？全球首款AI健身伴侣上线

Cursor 首度揭秘："训练即产品"，用强化学习让 AI 编程快 4 倍的秘密武器

他发明了价值万亿的AGI，如今穷困潦倒

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

Cursor 联创宣布离职，公开声明仅写了 72 个单词

AI基准测试集体塌房，最高84%都是坏题｜斯坦福最新研究