
实测OpenAI的o1:真没吹牛,奥数题高考题都能信手拈来了?
实测OpenAI的o1:真没吹牛,奥数题高考题都能信手拈来了?好家伙,OpenAI 终于上新了!
好家伙,OpenAI 终于上新了!
好羡慕!原来早在8月份,陶哲轩就已经用上了OpenAI o1。
大模型下半场,新范式开启?
OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其原因是由于构建足够庞大的逻辑数据集 <问题,明确的正确答案> ,再加上类似 AlphaGo 中 MCTS 和 RL 的方法直接搜索,只要提供足够的计算量用于搜索,总可以搜到最后的正确路径。然而,这样只是建立起问题和答案之间的更好的联系,如何泛化到更复杂的问题场景,技术远不止这么简单。
最近的公司会议上,奥特曼向全体员工承认,明年OpenAI或将摆脱非营利组织结构。o1的问世,直接诞生了新的Scaling Law,更是在医疗性能上表现出色。不过,o1能拯救OpenAI 1500亿美元的估值,和今年50亿美元的亏损吗?
当大模型开始思考
OpenAI o1,在IQ测试中拿到了第一名!大佬Maxim Lott,给o1、Claude-3 Opus、Gemini、GPT-4、Grok-2、Llama-3.1等进行了智商测试,结果表明,o1稳居第一名。
蹭下热度谈谈 OpenAI o1 的价值意义及 RL 的 Scaling law。
警告!不要在ChatGPT里问最新o1模型是怎么思考的——只要尝试几次,OpenAI就会发邮件威胁撤销你的使用资格。
备受瞩目的“草莓”模型现已问世,OpenAI 宣称该模型能够应对更为复杂的查询需求,当然,其使用成本也相对较高。