AI资讯新闻榜单内容搜索-模型训练

DeepSeek突然拥抱国产GPU语言！TileLang对标CUDA替代Triton，华为昇腾Day0官宣支持适配

DeepSeek v3.2有一个新改动，在论文里完全没提，只在官方公告中出现一次，却引起墙裂关注。开源TileLang版本算子，其受关注程度甚至超过新稀疏注意力机制DSA，从画线转发的数量就可以看出来。

来自主题: AI技术研报

8727 点击 2025-09-30 10:42

原文作者：David Adam 本篇《自然》长文共3702字，干货满满，预计阅读时间12分钟，时间不够建议可以先“浮窗”或者收藏哦。研究表明，电子伙伴类应用有利有弊——但科学家们担心长期依赖性。绘

来自主题: AI技术研报

6863 点击 2025-09-30 10:41

DeepMind公开了有关Veo 3视频模型最新论文！论文提出了「帧链」（Chain-of-Frames，CoF），认为视频模型也可能像通用大模型一样具备推理能力。零样本能力的涌现，表明视频模型的「GPT-3时刻」来了。

来自主题: AI技术研报

6709 点击 2025-09-29 22:09

就在最近，由耶鲁大学唐相儒、王昱婕，上海交通大学徐望瀚，UCLA万冠呈，牛津大学尹榛菲，Eigen AI金帝、王瀚锐等团队联合开发的Eigen-1多智能体系统实现了历史性突破

来自主题: AI技术研报

8054 点击 2025-09-29 15:14

人们感到AI理解自己，因为AI提供优于人类的倾听和理性建议，如认知共情总结混乱想法或询问需求。形象如语音和触觉增强情感连接，但过度依赖AI可能加剧孤独感。心理学角度区分情绪与认知共情，未来需身体互动和共同成长建立真实关系。

来自主题: AI资讯

6707 点击 2025-09-29 15:08

VLA模型通常建立在预训练视觉语言模型（VLM）之上，仅基于2D图像-文本数据训练，缺乏真实世界操作所需的3D空间理解能力。

来自主题: AI技术研报

6829 点击 2025-09-29 14:53

在三维重建不断走向工程化的今天，前馈式3D Gaussian Splatting（Feed-Forward 3DGS）正火速走向产业化。然而，现有的前馈3DGS方法主要采用“像素对齐”（pixel-aligned）策略——即将每个2D像素单独映射到一个或多个3D高斯上。

来自主题: AI技术研报

6163 点击 2025-09-29 14:49

最近，千寻智能的研究人员注意到，基于模仿学习的视觉运动策略中也存在类似现象，并在论文《Do You Need Proprioceptive States in Visuomotor Policies?》中对此进行了深入探讨。

来自主题: AI技术研报

7428 点击 2025-09-29 14:31

Transformer作者Llion Jones带着自己的初创公司Sakana AI，又来搞事情了。（doge）最新推出的开源框架——ShinkaEvolve，可以让LLM在自己写代码优化自己的同时，还能同时兼顾效率，be like为进化计算装上一个“加速引擎”。

来自主题: AI技术研报

8183 点击 2025-09-29 11:01

我想聊个反向操作：咱们普通人，如何用有限的资源，轻松驯服一个 AI 模型，让它变成我们专属的垂直领域小能手？主角，就是最近华为刚刚开源的一个大小仅为 1B 的模型 openPangu-Embedded-1B，它不仅全面领先同规格模型，甚至与更大规模的 Qwen3-1.7B 也难分伯仲。

来自主题: AI资讯

8983 点击 2025-09-29 10:57