
把「Her」装进一张卡里
把「Her」装进一张卡里这条人机交互的进化之路,出门问问从未真正放弃。今年,大模型基础能力再次实现飞跃,像 ChatGPT、DeepSeek、豆包这样的 AI 工具,正在成为越来越多职场人工作中的常用助手。
这条人机交互的进化之路,出门问问从未真正放弃。今年,大模型基础能力再次实现飞跃,像 ChatGPT、DeepSeek、豆包这样的 AI 工具,正在成为越来越多职场人工作中的常用助手。
AI不一定是“邪恶”的,但它也远非“中立无害”。 过去几年里,我们习惯了通过 ChatGPT 等 AI 产品提问、聊天、生成代码。
多亏了DeepSeek,开源运动在AI时代更强了
Thinking模式当道,教师模型也该学会“启发式”教学了—— 由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI,带着他们的新方法来了!
6月23日,山西临汾市人民医院发布了《基于DeepSeek AI大模型的智慧医疗应用系统建设项目》,预算金额为1569.264万元,预计采购时间为2025年9月。临汾市人民医院拟采购基于DeepSeek的智慧医疗项目建设一套,其建设内容包含:
大家周末好呀!MiniMax 本周也像之前OpenAI 和 DeepSeek开启了一次为期 5 天的发布周,发布了不少干货。
罗永浩透露,自己的团队曾试了美国大量AI邮件工具项目,虽然他们客户端和网页版都接入了AI,但都做得很差,而在中国也很少有人做这个方向。此外,在DeepSeek爆火之前,罗永浩还见了其创始人梁文峰,梁文峰给他介绍了很多AI圈的资源,也解答了团队遇到的技术问题。
强化学习可以提升LLM推理吗?英伟达ProRL用超2000步训练配方给出了响亮的答案。仅15亿参数模型,媲美Deepseek-R1-7B,数学、代码等全面泛化。
大语言模型(LLMs)在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调(RLFT),通过自我生成的推理链(CoT)优化模型,提升决策能力。实验表明,RLFT可增加模型探索性,缩小知行差距,但探索策略仍有改进空间。
自年初起,DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世,展现出令人惊叹的智能水平,但它们为什么突然变得这么聪明?东京大学联合Google DeepMind的研究者们终于找到了答案。