AI资讯新闻榜单内容搜索-模型

率先突破大规模多类数据损坏问题！中科大离线强化学习新方式入选NeurIPS 2024

机器人控制和自动驾驶的离线数据损坏问题有解了！中科大王杰教授团队 (MIRA Lab) 提出了一种变分贝叶斯推断方法，有效地提升了智能决策模型的鲁棒性。

来自主题: AI技术研报

5126 点击 2024-10-20 11:43

苹果一篇论文得罪大模型圈？Transformer不会推理，只是高级模式匹配器！所有LLM都判死刑

苹果研究者发现：无论是OpenAI GPT-4o和o1，还是Llama、Phi、Gemma和Mistral等开源模型，都未被发现任何形式推理的证据，而更像是复杂的模式匹配器。无独有偶，一项多位数乘法的研究也被抛出来，越来越多的证据证实：LLM不会推理！

来自主题: AI技术研报

5596 点击 2024-10-19 16:32

大模型训练遭投毒损失千万美元？Anthropic惊人发现：LLM植入炸弹，代码库暗藏bug！

最近，大模型训练遭恶意攻击事件已经刷屏了。就在刚刚，Anthropic也发布了一篇论文，探讨了前沿模型的巨大破坏力，他们发现：模型遇到危险任务时会隐藏真实能力，还会在代码库中巧妙地插入bug，躲过LLM和人类「检查官」的追踪！

来自主题: AI技术研报

5076 点击 2024-10-19 16:24

2024年，每一个大模型都躲不过容嬷嬷和紫薇 | 焦点分析

连最积极搞AI的李彦宏，在这件事上也迟疑了。 “百度不碰Sora类的视频生成方向。”李彦宏在近期的2024年Q3总监会上说道。原因在于，10年、20年都可能难以商业化应用。从OpenAI Sora横空出世，再到6月的快手可灵全量上线，视频生成成为2024年最火热的AI话题。

来自主题: AI资讯

5893 点击 2024-10-19 16:17

惊天大瓜！字节实习生往GPU集群注入病毒，导致模型都白训…

就在昨天，微信群里出现了一个消息，迅速攀升至热榜第二名：一名字节实习生攻击GPU集群。

来自主题: AI资讯

11472 点击 2024-10-19 14:52

红杉资本对话Harmonic联创：数学即推理，合成数据是模型的新燃料，计算资源和自博弈是进步的关键

数学界对AI在数学中应用的看法存在分歧，但年轻一代更支持AI和验证工具。Vlad指出，通过递归自我改进，AI有潜力在数学和其他复杂问题上取得重大突破。随着AI在模式识别和自我改进方面的进步，它可能参与解决大型数学难题，如黎曼猜想。同时，数学家仍将在引导AI方向、规划研究领域和解释结果方面起关键作用。

来自主题: AI资讯

9693 点击 2024-10-19 14:48

深度 | OpenAI新董事兼CMU机器学习系主任：虽然数据有限，但AI性能不会停滞不前；LLM行业很可能会整合

虽然数据有限，但AI性能不会停滞不前，我们当前的算法还没有从我们拥有的数据中最大限度地提取信息，还有更多的推论、推断和其他过程我们可以应用到我们当前的数据上，以提供更多的价值。

来自主题: AI资讯

8598 点击 2024-10-19 14:41

又快又准，即插即用！清华8比特量化Attention，两倍加速于FlashAttention2，各端到端任务均不掉点！

来自主题: AI技术研报

11291 点击 2024-10-19 14:15

SAM 2.1上新、Lingua代码库发布，一大波Meta开源工具来袭

今天，Meta 分享了一系列研究和模型，这些研究和模型支撑 Meta 实现高级机器智能（AMI）目标，同时也致力于开放科学和可复现性。

来自主题: AI技术研报

8820 点击 2024-10-19 14:07

Bengio团队新论文！KL正则化有漏洞，强化学习新策略：不要做我可能不会做的事情

在强化学习中，当智能体的奖励机制与设计者的意图不一致时，可能会导致不理想的行为，而KL正则化作为一种常用的解决方案，通过限制智能体的行为来防止这种情况，但智能体在某些情况下仍可能表现出意料之外的行为；为了提高智能体的可靠性，研究人员提出了新的理论方案，通过改变指导原则来增强智能体在未知情况下的谨慎性。

来自主题: AI技术研报

7471 点击 2024-10-19 13:55