
字节Seed开源长线记忆多模态Agent,像人一样能听会看
字节Seed开源长线记忆多模态Agent,像人一样能听会看字节Seed发布全新多模态智能体框架——M3-Agent。 像人类一样能听会看、具备长期记忆,并且免费开源!?
字节Seed发布全新多模态智能体框架——M3-Agent。 像人类一样能听会看、具备长期记忆,并且免费开源!?
在大语言模型(LLMs)领域,自回归(AR)范式长期占据主导地位,但其逐 token 生成也带来了固有的推理效率瓶颈。此前,谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量,向业界展现了扩散大语言模型(dLLMs)在推理速度上的巨大潜力。
服装视频广告太烧钱?卡点变装太难拍? 字节跳动智能创作团队联合清华大学最新推出一款全能的视频换装模型 DreamVVT,为视频虚拟试穿领域带来了突破性进展。
假如你还没有尝试用AI来提升效率,那一定要抽点时间来研究下,你会打开新世界的大门! 如果你用过,但觉得AI并没有传说中的那么神奇,不妨看看今天的文章,或许能帮助你更得心应手的驾驭AI。
首次实现“训练-推理不对称”,字节团队提出全新的语言模型训练方法:Post-Completion Learning (PCL)。 在训练时让模型对自己的输出结果进行反思和评估,推理时却仅输出答案,将反思能力完全内化。
在今年三月份,清华 AIR 和字节联合 SIA Lab 发布了 DAPO,即 Decoupled Clip and Dynamic sAmpling Policy Optimization(解耦剪辑和动态采样策略优化)。
强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。
近日,一项由北京大学、字节跳动 Seed 团队及香港大学联合进行的研究,提出了一种名为「SWE-Swiss」的完整「配方」,旨在高效训练用于解决软件工程问题的 AI 模型。研究团队推出的 32B 参数模型 SWE-Swiss-32B,在权威基准 SWE-bench Verified 上取得了 60.2% 的准确率,在同尺寸级别中达到了新的 SOTA。
2025年初在硅谷创立 Ouraca Inc.,专注打造新一代“AI native” 的终身学习产品线。首款产品 Aibrary正式版即将上线:是全球首个专为个人成长打造的 Agentic AI,它不仅帮助你获取知识,更陪你思考,激发动机,引导行动,让成长真正发生。通过个性化播客、认知引导与行动建议,Aibrary 将书籍与专家洞见转化为你专属的学习旅程。
4月底我们曾经在《融了3个亿的张月光,就做出了个“AI播客播放器”?》选题中观察过由前妙鸭相机产品负责人张月光开发的AI播客产品ChatPods,当时我们认为,想用AI做成一个泛播客工具/平台比较困难。而最近,又有AI领域的知名从业者离职创业,选择的方向恰恰也是AI播客。