AI资讯新闻榜单内容搜索-预训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 预训练
谷歌风雨飘摇,市值蒸发数千亿美元!Gemini Spark能救场吗?

谷歌风雨飘摇,市值蒸发数千亿美元!Gemini Spark能救场吗?

谷歌风雨飘摇,市值蒸发数千亿美元!Gemini Spark能救场吗?

Transformer之父走了,诺奖得主走了,预训练核心走了——一周内,四个人离开谷歌。最新的一张牌Gemini Spark能挽回谷歌士气吗?

来自主题: AI资讯
9172 点击    2026-07-02 11:06
AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口「很小」

AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口「很小」

AGI倒计时,OpenAI首席研究官重磅表态:留给人类的窗口「很小」

OpenAI首席研究官Mark Chen释放了一个强烈信号:OpenAI 并不认为scaling laws已经失效,恰恰相反,预训练、数据工程、推理训练和更长任务链条,仍是通向AGI的主干道路。

来自主题: AI资讯
5346 点击    2026-07-02 10:34
首个通用触觉基础模型FTP-1来了!Sharpa 联合清华大学等高校,用一套策略打通21种传感器与多类具身形态

首个通用触觉基础模型FTP-1来了!Sharpa 联合清华大学等高校,用一套策略打通21种传感器与多类具身形态

首个通用触觉基础模型FTP-1来了!Sharpa 联合清华大学等高校,用一套策略打通21种传感器与多类具身形态

来自 Sharpa、清华大学、UC Berkeley、上海交通大学、ETH Zurich 等机构的研究者提出了首个通用触觉基础策略 FTP-1。它基于约 3,000 小时、来自 26 个数据来源和 21 种触觉传感器的数据进行预训练

来自主题: AI资讯
9230 点击    2026-06-28 11:12
直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

今天几乎所有主流视觉语言模型(VLM)—— 无论是 Qwen-VL、InternVL,还是 LLaVA 系列 —— 都遵循着同一套经典架构:先用预训练视觉编码器(如 CLIP、SigLIP)将图像压缩为特征,再通过投影层把这些特征送入大语言模型。

来自主题: AI技术研报
7510 点击    2026-06-24 16:06
碰撞暴降45.5%、200km 0接管!港大团队:自动驾驶真正的突破不在预训练,在后训练

碰撞暴降45.5%、200km 0接管!港大团队:自动驾驶真正的突破不在预训练,在后训练

碰撞暴降45.5%、200km 0接管!港大团队:自动驾驶真正的突破不在预训练,在后训练

香港大学李弘扬团队联合华为、上海创智学院及清华大学李升波教授团队,发表的最新论文World Engine: Towards the Era of Post-Training for Autonomous Driving给出了系统回答。

来自主题: AI技术研报
8074 点击    2026-06-20 10:24
刚被马斯克收购,Cursor掏出新模型:10万卡加持,和Opus、GPT一样大

刚被马斯克收购,Cursor掏出新模型:10万卡加持,和Opus、GPT一样大

刚被马斯克收购,Cursor掏出新模型:10万卡加持,和Opus、GPT一样大

刚刚被 SpaceX 宣布以 600 亿美元收购的 Cursor,发布大模型了。本周二,Cursor 宣布了一个新的 1.5 万亿 + 参数模型,该模型在超过 10 万块 GPU 上进行了预训练。消息是在旧金山举行的 Cursor Compile 上宣布的,这是 Cursor 举办的首届旗舰大会。

来自主题: AI资讯
9257 点击    2026-06-17 10:59
τ0-WM:最大规模预训练的开源具身世界模型来了

τ0-WM:最大规模预训练的开源具身世界模型来了

τ0-WM:最大规模预训练的开源具身世界模型来了

刚刚,上海创智学院副教授、智元机器人首席科学家罗剑岚带队,发布全球最大规模的开源预训练具身世界模型——τ0-World Model(τ0-WM)。整个τ0-WM参数量达到5B,预训练数据规模高达约3万小时。其中,真机遥操作数据第一次成了绝对主力,占到了1.78万小时。

来自主题: AI技术研报
9586 点击    2026-05-31 19:39
数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

我去搜了下 MiniCPM5-1B 的数据,发现面壁智能刚刚把背后的核心数据集给开源了。一共是两份 L3 级数据集:Ultra-FineWeb-L3 :600B tokens,中英文都有,是目前最大的中文开源合成预训练数据集。

来自主题: AI技术研报
8917 点击    2026-05-30 10:06
刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

2026 年初,国内具身智能赛道掀起了一波开源潮,越来越多团队开始公开自己的视觉-语言-动作(VLA)模型、数据集与训练框架。与此同时,行业竞争也逐渐集中到 benchmark 成绩、任务成功率以及跨任务泛化能力上,尤其是在标准化或已训练任务中的表现。

来自主题: AI技术研报
8427 点击    2026-05-29 09:19