AI资讯新闻榜单内容搜索-数据

永别了，人类冠军！AI横扫天文奥赛，GPT-5得分远超金牌选手2.7倍

国际奥赛又一块金牌，被AI夺下了！在国际天文与天体物理奥赛（IOAA）中，GPT-5和Gemini 2.5 Pro完胜人类选手，在理论和数据分析测试中，拿下了最高分。在理论考试上，Gemini 2.5 Pro总体得分85.6%，GPT-5总体得分84.2%；

来自主题: AI资讯

9771 点击 2025-10-12 15:04

告别AI“乱画图表”！港中文团队发布首个结构化图像生成编辑系统

AI竟然画不好一张 “准确” 的图表？AI生图标杆如FLUX.1、GPT-Image，已经能生成媲美摄影大片的自然图像，却在柱状图、函数图这类结构化图像上频频出错，要么逻辑混乱、数据错误，要么就是标签错位。

来自主题: AI技术研报

10385 点击 2025-10-12 15:03

速递｜估值四个月翻四倍：David AI获5000万美元融资，英伟达旗下NVentures参投

图片来源：David AI Labs David AI Labs 这家初创公司通过出售音频数据集来帮助训练人工智能模型，近期在新一轮融资中从投资者处筹集了 5000 万美元——这表明为 AI 开发提供

来自主题: AI资讯

9317 点击 2025-10-12 15:03

听说，大家都在梭后训练？最佳指南来了

既然后训练这么重要，那么作为初学者，应该掌握哪些知识？大家不妨看看这篇博客《Post-training 101》，可以很好的入门 LLM 后训练相关知识。从对下一个 token 预测过渡到指令跟随；监督微调（SFT）基本原理，包括数据集构建与损失函数设计；

来自主题: AI技术研报

7979 点击 2025-10-12 14:59

超越ZIP的无损压缩来了！华盛顿大学让大模型成为无损文本压缩器

当大语言模型生成海量数据时，数据存储的难题也随之而来。对此，华盛顿大学（UW）SyFI实验室的研究者们提出了一个创新的解决方案：LLMc，即利用大型语言模型自身进行无损文本压缩的引擎。

来自主题: AI技术研报

6952 点击 2025-10-12 11:00

国产游戏理解模型刷新SOTA，对话逗逗AI CEO：开源模型+行业数据是突破关键

游戏理解领域模型LynkSoul VLM v1，在游戏场景中表现显著超过了包括GPT-4o、Claude 4 Sonnet、Gemini 2.5 Flash等一众顶尖闭源模型。背后厂商逗逗AI，亦在现场吸引了不少关注的目光。

来自主题: AI资讯

9529 点击 2025-10-11 17:25

OpenAI算力账单曝光：70亿美元支出，大部分钱花在了“看不见的实验”

来扒一扒OpenAI算力支出的天价账单——据Epoch AI统计的数据显示，去年OpenAI在计算资源上支出了70亿美元。由于公司当时还没有大量的算力，所以这笔天价账单基本都是以向微软租用云算力的形式支付出去的，并不包括对数据中心的前期投入。

来自主题: AI资讯

11028 点击 2025-10-11 17:12

19岁名校退学投身AI创业，融资1.1亿用“赏金猎人”模式革新AI数据

“我最近刚满 19 岁，从加拿大滑铁卢大学计算机学院退学（创业），致力于创建最高质量的编码数据引擎，为最强大的大模型提供支持。”不久前，出生于加拿大的亚裔女孩 Serena Ge 在自己的个人网站上写

来自主题: AI资讯

9323 点击 2025-10-11 12:12

全球首个真实世界具身多模态数据集，它石智航交卷，比特斯拉还早6个月

全球首个真实世界具身多模态数据集，它来了！刚刚，它石智航发布全球首个大规模真实世界具身VLTA（Vision-Language-Tactile-Action）多模态数据集World In Your Hands（WIYH）。

来自主题: AI技术研报

10583 点击 2025-10-11 12:06

谷歌月Tokens消耗量领跑全球了：1300000000000000（别数了是千万亿）

1.3千万亿，一个令人咂舌的数字。这就是谷歌每月处理的Tokens用量。据谷歌“宣传委员”Logan Kilpatrick透露，这一数据来自谷歌对旗下各平台的内部统计。那么在中文世界里，1.3千万亿Tokens约2.17千万亿汉字。换算成对话量，一本《红楼梦》的字数在70-80万左右，相当于一个月内所有人和谷歌AI聊了近30亿本《红楼梦》的内容。

来自主题: AI资讯

9240 点击 2025-10-10 23:21