
我逛了逛 Kimi 的「AI 小红书 」, OpenAI 也想做的 「AI 社交圈」会更好刷吗?
我逛了逛 Kimi 的「AI 小红书 」, OpenAI 也想做的 「AI 社交圈」会更好刷吗?现在,AI 产品仅仅只靠机器人尬聊,已经留不住用户了,这是显而易见的新共识。
现在,AI 产品仅仅只靠机器人尬聊,已经留不住用户了,这是显而易见的新共识。
今天凌晨4点,路透社消息,OpenAI一位高管在谷歌垄断案庭审中作证,将收购其浏览器Chrome。目前,谷歌在美国正遭遇反垄断审判,如果上诉失败不仅Chrome会被拆分,其数字广告业务也会被剥离,会对谷歌进行大重组。
加州一位AI博士,学生签证忽然被吊销!他从未有过犯罪记录,但在美国深造之路已被斩断。许多OpenAI、谷歌的顶尖学者都透露在考虑离开美国。这场AI竞赛中,美国或将彻底崩塌。
OpenAI 最近发布了三份针对企业客户的研究报告,本次挑选了其中的「A Practical guide to building AI agents」一篇进行了翻译。除非已经是 Agent 资深开发大佬,否则强烈建议 AI 行业的大家都来读一下这篇报告。
当前,强化学习(RL)方法在最近模型的推理任务上取得了显著的改进,比如 DeepSeek-R1、Kimi K1.5,显示了将 RL 直接用于基础模型可以取得媲美 OpenAI o1 的性能不过,基于 RL 的后训练进展主要受限于自回归的大语言模型(LLM),它们通过从左到右的序列推理来运行。
就在昨天,深耕语音、认知智能几十年的科大讯飞,发布了全新升级的讯飞星火推理模型 X1。不仅效果上比肩 DeepSeek-R1,而且我注意到一条官方发布的信息——基于全国产算力训练,在模型参数量比业界同类模型小一个数量级的情况下,整体效果能对标 OpenAI o1 和 DeepSeek R1。
最近,一位 X 网友向 OpenAI CEO Sam Altman 提问:「我很好奇,人们在和模型互动时频繁说『请』和『谢谢』,到底会让 OpenAI 多花多少钱的电费?」尽管没有精确的统计数据,但 Altman 还是半开玩笑地给出了一个估算——千万美元。他也顺势补了一句,这笔钱到底还是「花得值得」的。
一句话看懂:o3以深度推理与工具调用能力领跑复杂任务,GPT-4.1超长上下文与精准指令执行适合API开发,而o4-mini则堪称日常任务的「性价比之王」。
o3和o4-mini视觉推理突破,竟未引用他人成果?一名华盛顿大学博士生发出质疑,OpenAI研究人员对此回应:不存在。
OpenAI新模型发布后,大家体感都幻觉更多了。甚至有人测试后发出预警:使用它辅助编程会很危险。当大家带着疑问仔细阅读System Card,发现OpenAI官方也承认了这个问题,与o1相比o3幻觉率是两倍,o4-mini更是达到3倍。