AI资讯新闻榜单内容搜索-TIM

单个tokenizer胜任图像视频理解生成！南大&腾讯混元HYDRA打通多模态统一难题

南大王利民团队&腾讯混元的HYDRA系列（HYDRA，HYDRA-X）工作挑战了这个惯例，用一个基于ViT的统一视觉Tokenizer，帮助原生多模态模型更好地“看懂”和“创作”。训练一个基于ViT的Unified Tokenizer，使其同时具有理解和生成的能力，进而同时作为理解和生成的Autoencoder，来支持原生多模态模型（Unified Multimodal Models）的训练。

来自主题: AI技术研报

8191 点击 2026-06-28 11:13

沿着何恺明团队「漂移模型」再走一步：奖励只需排名，单步文生图偏好优化提速3.51倍

来自西湖大学和香港中文大学（深圳）的团队沿着这一思路提出 Drifting Preference Optimization（DrPO），把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中，奖励只负责对候选图像排序，不参与反向传播。具体而言，针对同一个文本提示词，当前模型生成一组候选图像。高分样本在特征空间中产生吸引，低分样本产生排斥，并结合参考模型约束给出模型的更新方向。

来自主题: AI技术研报

7621 点击 2026-06-21 10:33

蚂蚁EGSS算法破解Test Time Scaling困局 | ACL 2026

更聪明的计算远比更多的计算更有效。

来自主题: AI技术研报

6648 点击 2026-06-17 14:06

BudgetMem：给Runtime Agent Memory装上「预算路由器」，让记忆系统学会按需分配运行成本

当 LLM Agent 处理长期对话、多轮交互和复杂文档时，Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文，并支撑跨时间的推理能力。

来自主题: AI技术研报

8528 点击 2026-06-15 09:20

看完爆火的 Anthropic 官方提示词课，我连夜做了个「提示词全局优化器」｜已开源

其实大概半年前，我就有这个需求了。那阵子我也注意到，阿里、字节这些平台都各自出了提示词优化器。但它们都得专门跑到对应的网站上去用，对我来说不够顺手。所以这回干脆借着深度复盘了 Anthropic 的 Prompt 讲座，用 Codex vibe coding 了一个全局提示词优化器。

来自主题: AI资讯

9405 点击 2026-06-04 22:09

YC 如何进行 AI-Native 组织改造：Agent 能力要向所有人开放

YC 一直走在 AI-Native 组织改造的前沿。过去一年多，YC 的合伙人、Optimizely 创始人 Pete Koomen 在内部主导搭建了一套覆盖全员的 Agent 系统。在一年时间里，演化成了 350+ 工具的内部注册表、一个全员可见的 Agent 对话系统，甚至每晚还会自动阅读当天所有对话、改进自身技能。

来自主题: AI资讯

8944 点击 2026-06-03 09:01