AI资讯新闻榜单内容搜索-GE

DeepSeek加持，北大通院几何模型达IMO金牌水平！32个CPU核心和1块4090就能实现满血解题

国产AI几何模型性能达IMO金牌水平，打平谷歌DeepMind最新AlphaGeometry系列——

来自主题: AI技术研报

10834 点击 2025-02-18 14:33

告别生硬翻译腔：构建 AI 驱动的多轮评审润色流程

在深入学习和阅读智能体（Agent）相关的英文技术文章时，我发现传统的翻译软件和方法往往难以将这些文章准确、流畅地转换成地道的中文。逐字逐句的直译不仅导致"翻译腔"严重，还会使句子结构生硬，专业术语处理不当，这让读者理解起来非常吃力。

来自主题: AI资讯

4860 点击 2025-02-18 11:04

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

Scale AI 等提出的新基准再次暴露了大语言模型的弱点。

来自主题: AI技术研报

10774 点击 2025-02-17 14:49

大模型都喜欢拍马屁，Gemini最能拍！斯坦福：这不安全、不可靠

问题挺严重，大模型说的话可不能全信。

来自主题: AI技术研报

7929 点击 2025-02-15 16:20

编程不再是专业技能！Replit「Agent」引爆编程革命，零基础也能轻松上手

Replit凭借创新的AI编程平台「Agent」，在短短半年内实现了5倍的收入增长。通过采用Claude 3.5 Sonnet模型和多智能体架构，Replit为编程行业带来了前所未有的革新，推动了一个人人皆可参与的编程时代。

来自主题: AI资讯

8558 点击 2025-02-14 18:45

Gemini再度“破防”！长期记忆被黑客篡改，方法竟和一年前如出一辙

Gemini的提示词注入防线，又被黑客给攻破了。

来自主题: AI资讯

9162 点击 2025-02-14 13:03

完成B+轮融资，收入过亿的FancyTech说：每个阶段都需要再找一次PMF

涌现（Emergence），是生成式AI浪潮的一个关键现象：当模型规模扩大至临界点，AI会展现出人类一般的智慧，能理解、学习甚至创造。

来自主题: AI资讯

10078 点击 2025-02-14 11:49

小红书&上交多模态大模型新基准，Gemini 1.5 Pro准确率仅48%

多模态大模型理解真实世界的水平到底如何？

来自主题: AI技术研报

6414 点击 2025-02-13 09:49

8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

推理大语言模型（LLM），如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域已超越人类专家，并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习（Reinforcement Learning）和推理规模（Inference scaling）。

来自主题: AI技术研报

7491 点击 2025-02-12 11:33

苹果选阿里，三星选智谱，“AI手机”究竟成不成，就指望最卷的中国市场了

先是三星宣布智谱的Agentic GLM成为其新手机Galaxy S25的AI能力来源，紧接着The Information爆料，在经历了近一年的模型测试与合作伙伴探索后，苹果终于敲定了中国市场的合作伙伴：阿里巴巴。这意味着，中国iPhone用户很可能在今年迎来一个由国产大模型驱动的iPhone。

来自主题: AI资讯

11151 点击 2025-02-12 10:57