AI资讯新闻榜单内容搜索-模型

中国模型打服硅谷：Airbnb联创CEO感叹又快又好又便宜！把ChatGPT合作都拒了

当OpenAI为ChatGPT各种造势时，中国模型也在凭实力圈粉老外。最近，爱彼迎（Airbnb）联合创始人兼CEO Brian Chesky的一番公开表态掀起波澜：要知道Brian Chesky和奥特曼还是挚友，但当涉及自家应用产品整合时，他却没给老朋友留面子，直言OpenAI提供的连接工具还“没有完全准备好”。

来自主题: AI资讯

9094 点击 2025-10-23 12:46

智源开源EditScore：为图像编辑解锁在线强化学习的无限可能

随着多模态大模型的不断演进，指令引导的图像编辑（Instruction-guided Image Editing）技术取得了显著进展。然而，现有模型在遵循复杂、精细的文本指令方面仍面临巨大挑战，往往需要用户进行多次尝试和手动筛选，难以实现稳定、高质量的「一步到位」式编辑。

来自主题: AI技术研报

11073 点击 2025-10-23 12:28

AI模型守法率提升11%，港科大首次用法案构建安全benchmark

香港科技大学KnowComp实验室提出基于《欧盟人工智能法案》和《GDPR》的LLM安全新范式，构建合规测试基准并训练出性能优异的推理模型，为大语言模型安全管理提供了新方向。

来自主题: AI技术研报

10138 点击 2025-10-23 12:20

X上63万人围观的Traning-Free GRPO：把GRPO搬进上下文空间学习

年初的 DeepSeek-R1，带来了大模型强化学习（RL）的火爆。无论是数学推理、工具调用，还是多智能体协作，GRPO（Group Relative Policy Optimization）都成了最常见的 RL 算法。

来自主题: AI技术研报

7968 点击 2025-10-23 11:41

SIGGRAPH Asia 2025｜电影级运镜一键克隆！港中文&快手可灵团队发布CamCloneMaster

作为视频创作者，你是否曾梦想复刻《盗梦空间》里颠覆物理的旋转镜头，或是重现《泰坦尼克号》船头经典的追踪运镜？

来自主题: AI技术研报

9034 点击 2025-10-23 11:32

攻克长文档与多模态挑战，Paper2Video实现学术视频的自动化生产

学术展示视频作为科研交流的重要媒介，制作过程仍高度依赖人工，需要反复进行幻灯片设计、逐页录制和后期剪辑，往往需要数小时才能产出几分钟的视频，效率低下且成本高昂，这凸显了推动学术展示视频自动化生成的必要性。

来自主题: AI技术研报

9671 点击 2025-10-23 11:25

比Transformer更强的架构来了？浙大新作Translution，一统卷积和自注意力

近日，范鹤鹤（浙江大学）、杨易（浙江大学）、Mohan Kankanhalli（新加坡国立大学）和吴飞（浙江大学）四位老师提出了一种具有划时代意义的神经网络基础操作——Translution。该研究认为，神经网络对某种类型数据建模的本质是：

来自主题: AI技术研报

10000 点击 2025-10-23 10:59

只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型。

整个Hugging Face的趋势版里，前4有3个OCR，甚至Qwen3-VL-8B也能干OCR的活，说一句全员OCR真的不过分。然后在我上一篇讲DeepSeek-OCR文章的评论区里，有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比，也有很多人都在问，能不能再解读一下百度那个OCR模型（也就是PaddleOCR-VL）。

来自主题: AI资讯

11524 点击 2025-10-23 10:58

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

太卷了，DeepSeek-OCR刚发布不到一天，智谱就开源了自家的视觉Token方案——Glyph。既然是同台对垒，那自然得请这两天疯狂点赞DeepSeek的卡帕西来鉴赏一下：

来自主题: AI技术研报

9460 点击 2025-10-22 23:58

OpenAI设立秘密项目，招募华尔街专家训练AI构建金融模型，时薪上千元

10月21日消息，据最新披露的文件显示，OpenAI正在秘密推进一项名为“水星项目”（Project Mercury）的绝密计划，已招募超过100名前投资银行家，协助训练AI系统构建复杂的金融模型，从而取代初级投行员工耗费大量时间的工作。

来自主题: AI资讯

7584 点击 2025-10-22 15:37