
奥特曼:我承认GPT-5发布搞砸了
奥特曼:我承认GPT-5发布搞砸了奥特曼终于承认他搞砸了。 要说最近AI圈的大型翻车现场,GPT-5的发布绝对能排得上号。
奥特曼终于承认他搞砸了。 要说最近AI圈的大型翻车现场,GPT-5的发布绝对能排得上号。
GPT-5发布半月,却被连连吐槽。如今,一张基准与GPT-4对比基准测试图,证明了Scaling Law没有撞墙。七年间,从GPT-1到GPT-5十四个花式Prompt对决,实力差一目了然。
奥特曼称GPT-5「比人聪明」,但OpenAI首席运营官Lightcap澄清:这不是AGI。这只是能力过剩的冰山一角——我们仍有十年产品可建,模型越智能,融合越要精妙。GPT-5标志着从纯智商到反思能力的全面跃进。
没等到Deepseek R2,DeepSeek悄悄更新了V 3.1。官方群放出的消息就提了一点,上下文长度拓展至128K。128K也是GPT-4o这一代模型的处理Token的长度。因此一开始,鲸哥以为从V3升级到V 3.1,以为是不大的升级,鲸哥体验下来还有惊喜。
首个满分选手的出现,标志着AI医疗的又一个里程碑。 近日,美国初创公司OpenEvidence宣布,其开发的全新AI系统在美国医师执照考试(USMLE)中获得了100%的满分。
我们每天花在群聊上的时间越来越多,却也越来越感到疲惫和混乱。想想看,那些无尽的消息提醒、找不到的重要信息、永远进行不下去的决策讨论,还有复制粘贴ChatGPT回答的尴尬时刻。这些看似日常的群聊烦恼,其实暗示着一个更深层的问题:AI革命已经改变了我们与机器的交互方式,但我们最重要的社交空间——群聊,却依然停留在十年前的状态。
在人工智能技术迅速迭代的当下,一种新的幻觉机制正在悄然成型。
随着ChatGPT,DeepSeek等一批AI大模型被人们越来越多运用到日常生活和工作中,用ChatGPT解答疑问,编写程序,创作音乐和写作,成为了越来越多人的日常。
GPT-5是一个分水岭,终于学会了「推理」。联创Greg Brockman最新访谈畅谈了OpenAI AGI之路,未来AI可以做到边用边学,在超临界模式下推导出N阶后果。
自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B/20B),Sebastian Raschka博士将我们带回硬核拆机现场,回溯了从GPT-2到gpt-oss的大模型演进之路,并将gpt-oss与Qwen3进行了详细对比。