图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理
图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫语言领域。
自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫语言领域。
据最新报道,OpenAI正计划与阿联酋首都阿布扎比的科技公司G42展开一项规模空前的合作计划:在沙漠中建设一个耗电达5千兆瓦的10平方英里数据中心园区。这一规模若实现,将成为全球最大AI基础设施之一。
太疯狂了,AlphaGo的「第37步」时刻,已经来临。谷歌的AlphaEvolve,让我们从此进入AI创造科学的时代,人类科研将彻底颠覆!背后的研究者也首次接受采访,揭秘研究过程中的一些惊人细节。
经过对多种开源存储系统的评估对比,我们选择了 JuiceFS 。我们的架构采用 Redis 进行高性能元数据管理,同时构建了自有 MinIO 集群作为底层对象存储,这一架构完美解决了模型训练场景中的数据读写瓶颈、元数据访问延迟以及计算资源之间的存储互通问题。
最近,人们对AI谈得最多的是deepseek(简称DS)。这匹来自中国本土的黑马,闯入全球视野,一度扰乱美国股市,在 AI 领域掀起了一场轩然大波。
从编程开始,今年智能体要卷飞了!!!
GPT-5将会集大成于一体?!
OpenAI 扩大与 CoreWeave 合作,签署 40 亿美元新云服务协议
没想到前脚刚吐槽扣子空间MCP扩展少、没自定义功能,后脚更新就解决了!现在通过扣子工作流平台,能按需集成工作流和插件到个人空间。
AI 应用的付费模式,看起来只是付费模式,但本质上,是 AI 产品的价值到底是什么的问题。
那个曾经一码难求的 Manus 已经可以全面注册了。从此以后,到处求购邀请码的时代一去不复回。
FastVLM—— 让苹果手机拥有极速视觉理解能力
统一图像理解和生成,还实现了新SOTA。
ChatGPT「舔狗化」事件背后,暴漏目前AI仍是「黑箱」。 一场关于「机制可解释性」的路线分歧,正撕裂AI研究最核心的价值共识。谷歌认怂,Anthropic死磕——AI还能被「看懂」吗?
AI眼镜,究竟为什么这么热?
教AI学会使用工具,带图推理就能变得更强?!
ACL 2025录用结果新鲜出炉,8000多篇总投稿量破纪录。今年竞争异常激烈,高分被拒者一大片,还有创新论文因评审标准脱节受挫。
强化学习(RL)+真实搜索引擎,可以有效提升大模型检索-推理能力。
AI市场风起云涌!Poe最新报告揭晓:OpenAI的GPT-4o称霸文本生成,谷歌的Gemini 2.5 Pro领跑推理,Kling在视频领域异军突起,企业如何在这场AI竞赛中抢占先机?
该工作由南洋理工大学陶大程教授团队与武汉大学罗勇教授、杜博教授团队等合作完成。
在红杉AI峰会上,奥特曼畅谈了AI未来:2025年智能体开始实用、2026年推动科学发现、2027年机器人进入现实世界。他回顾了OpenAI成果从实验室到ChatGPT的演进,并提出「核心AI订阅」愿景。
前谷歌 CEO&董事长 Eric Schmidt 近日在 TED 上表示, AI 被严重低估了,它不仅是语言工具,而是未来战略规划、科学发现乃至国家安全与地缘政治格局的核心力量。
根据路透社报道,法律科技初创公司Harvey 正洽谈由 Kleiner Perkins 和 Coatue 领投的一轮融资,估值达 50 亿美元,拟筹集资金超 2.5 亿美元。
AI宝宝说话视频(AI talking baby)正在席卷TikTok。最近,在X和TikTok等海外社交媒体平台上,有一个非常火爆的AI内容创作趋势,那就是AI baby podcast(AI宝宝播客)。相关视频动辄超千万播放,几十万乃至上百万的点赞,一些专门制作此类内容的账号也迅速蹿红,其中一个代表性账号“babypodcast”,13天涨粉超22万。
Lovart 值得关注,它是 AI 应用层团队产品创新能力的印证和延续,这是 Manus 之后最火的 Agent,从通用领域,成功地向垂直赛道落地了 Agent 产品形态。
数字生命最靠谱的项目底座。就在这几天一个项目火了,就是叫做weclone。总的来说基于微信聊天记录来生成你的数字分身,现在开源了整个项目的技术是使用python来完成的,并且支持阿里同义千问2.5,现在已经有8.7K收藏了。
AI在职场普及导致专业能力被解构,领导过度依赖AI修改员工工作成果,削弱专业判断。案例显示,文案、设计、媒体等行业面临AI生成内容适配性差、决策主观化等问题,技术平权虽提升效率却引发专业性被藐视、思考能力退化等争议,类比互联网发展预示AI可能重塑社会协作模式。
OpenAI最强AI编程智能体真的来了!Codex震撼上线,由o3优化版codex-1加持,多任务并行,半小时干完数天软件工程任务。
刚刚,鹅厂把文生图卷出了新高度——发布混元图像2.0模型(Hunyuan Image 2.0),首次实现毫秒级响应,边说边画,实时生成!用户一边描述,它紧跟着绘制,整个过程那叫一个丝滑。不用等待,专治各种没有耐心。