Gemini 的 PPT 生成:使用技巧及模板提示词
Gemini 的 PPT 生成:使用技巧及模板提示词Gemini APP 前几天上线了 PPT 生成的能力,我昨天尝试了一下发现相当可以啊。
Gemini APP 前几天上线了 PPT 生成的能力,我昨天尝试了一下发现相当可以啊。
近期,Google DeepMind 发布新一代具身大模型 Gemini Robotics 1.5,其核心亮点之一便是被称为 Motion Transfer Mechanism(MT)的端到端动作迁移算法 —— 无需重新训练,即可把不同形态机器人的技能「搬」到自己身上。不过,官方技术报告对此仅一笔带过,细节成谜。
扩散大语言模型得到了突飞猛进的发展,早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一个商业级扩散大型语言模型,同期人民大学发布第一个开源 8B 扩散大语言模型 LLaDA,5 月份 Gemini Diffusion 也接踵而至。
今天翻 GitHub Trending 的时候,看到一个不怎么眼熟的项目占据榜单第一。 仔细一看,是个多 Agent 舆情分析助手,名字叫「微舆 BettaFish」。再往下拉,发现它 star 已经过万了,而且还是最近十几天突然暴涨。
这篇论文提出了一种颠覆性的协作模式,即通过强化学习训练一个“小模型”作为智能代理(Agent),让它自动学会如何写出完美的Prompt,一步步引导任何一个“大模型”完成复杂推理,实现了真正的“AI指挥AI”。
当下的文本生成图像扩散模型取得了长足进展,为图像生成引入布局控制(Layout-to-Image, L2I)成为可能。
Transformer 语言模型具有单射性,隐藏状态可无损重构输入信息。
传统智能体系统难以兼顾稳定性和学习能力,斯坦福等学者提出AgentFlow框架,通过模块化和实时强化学习,在推理中持续优化策略,并使小规模模型在多项任务中超越GPT-4o,为AI发展开辟新思路。
用外卖的打法做AI模型?美团这是跟“又快又稳”杠上了(doge)。
2025 年被广泛视为 AI 走向深度应用的关键元年,在这一年里,以多模态生成、Agent 为代表的 AI 技术不断探索更多样、更高效、更贴合用户需求的应用形态。其中重要性愈加凸显的一点是:AI 正在走向产业级价值的系统性兑现。