
对话Linux基金会创始人:AI基础模型注定全面开源,战场只在应用端
对话Linux基金会创始人:AI基础模型注定全面开源,战场只在应用端多亏了DeepSeek,开源运动在AI时代更强了
多亏了DeepSeek,开源运动在AI时代更强了
Thinking模式当道,教师模型也该学会“启发式”教学了—— 由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI,带着他们的新方法来了!
今天,Gemini 家族迎来了一个新成员:Gemini Robotics On-Device。这是谷歌 DeepMind 首个可以直接部署在机器人上的视觉-语言-动作(VLA)模型,可以帮助机器人更快、更高效地适应新任务和环境,同时无需持续的互联网连接。
6月23日,山西临汾市人民医院发布了《基于DeepSeek AI大模型的智慧医疗应用系统建设项目》,预算金额为1569.264万元,预计采购时间为2025年9月。临汾市人民医院拟采购基于DeepSeek的智慧医疗项目建设一套,其建设内容包含:
想搞一门副业,却卡在想法一团浆糊?全网首个交互版Deep Research悄然上线,化身AI最强辅助,让零散灵感秒变超硬核行动方案。
大家周末好呀!MiniMax 本周也像之前OpenAI 和 DeepSeek开启了一次为期 5 天的发布周,发布了不少干货。
罗永浩透露,自己的团队曾试了美国大量AI邮件工具项目,虽然他们客户端和网页版都接入了AI,但都做得很差,而在中国也很少有人做这个方向。此外,在DeepSeek爆火之前,罗永浩还见了其创始人梁文峰,梁文峰给他介绍了很多AI圈的资源,也解答了团队遇到的技术问题。
强化学习可以提升LLM推理吗?英伟达ProRL用超2000步训练配方给出了响亮的答案。仅15亿参数模型,媲美Deepseek-R1-7B,数学、代码等全面泛化。
大语言模型(LLMs)在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调(RLFT),通过自我生成的推理链(CoT)优化模型,提升决策能力。实验表明,RLFT可增加模型探索性,缩小知行差距,但探索策略仍有改进空间。
自年初起,DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世,展现出令人惊叹的智能水平,但它们为什么突然变得这么聪明?东京大学联合Google DeepMind的研究者们终于找到了答案。