
用动作分块突破RL极限,伯克利引入模仿学习,超越离线/在线SOTA
用动作分块突破RL极限,伯克利引入模仿学习,超越离线/在线SOTA如今,强化学习(Reinforcement Learning,RL)在多个领域已取得显著成果。
如今,强化学习(Reinforcement Learning,RL)在多个领域已取得显著成果。
Vevo Therapeutics(现为Tahoe)与Arc研究所,两家分别在生物技术商业转化和非营利性基础研究领域领先的机构,于2025年2月联合发布了一项里程碑式的成果:全球最大的单细胞药物扰动数据集Tahoe-100M。
公开信息显示,前百川智能联合创始人焦可的新项目「来福」近日已悄然登陆苹果 App Store。产品定位为“AI 私人电台”,由北京耳朵时间科技有限公司出品,该公司法人及实控人正是焦可本人。
你有没有想过,那些支撑着全球商业运转的 ERP 系统,其实还停留在 90 年代?想象一下,你每个月都要花 15 天来完成财务结账,需要雇佣专业顾问才能搞定系统实施,还要在 Excel 表格中手动处理几百个尽调请求。
2025年7月12日,在Cursor中文社区在杭州举办的线下meetup上,硅星人主编王兆洋作为嘉宾分享了把Cursor用在内容创作上的实践。
Kimi K2上线12小时,OpenAI就无限期推迟了下周的开源计划,给出的理由假到我都不想戳破他。
Kimi K2 发布了 2 天,我也测了足足 2 天。如果仔细观察 Kimi 这次的官方发布稿,不难发现 K2 强调的重点:Agent 与 Coding 能力。
首个能跨领域精准预测人类认知的基础模型诞生!
您是否也曾经想过这样的场景:产品经理把idea直接扔给AI编程,然后就能得到完美能用的代码?来自德国弗劳恩霍夫研究所和杜伊斯堡-埃森大学的研究者们刚刚给我们泼了一盆冷水。
AI也要氛围阅读,Karpathy提出PDF论文已不适合AI时代,呼吁以Git、Markdown等结构化格式重塑科研写作。他认为未来99%的注意力将来自AI,科研成果应为AI优化。