
o3拿下25%高分震惊数学教授,2025 IMO金牌或被AI收入囊中!
o3拿下25%高分震惊数学教授,2025 IMO金牌或被AI收入囊中!AI真的可以做数学了吗?来自帝国理工学院教授Kevin Buzzard在最新博文中深刻探讨了这个问题。甚至,他预测道,2025年AI能够拿下IMO金牌级水平。
AI真的可以做数学了吗?来自帝国理工学院教授Kevin Buzzard在最新博文中深刻探讨了这个问题。甚至,他预测道,2025年AI能够拿下IMO金牌级水平。
在与专用国际象棋引擎Stockfish测试中,只因提示词中包含能力「强大」等形容词,o1-preview入侵测试环境,直接修改比赛数据,靠「作弊」拿下胜利。这种现象,表明AI安全任重道远。
我本来以为今年的模型考核就到这儿了,没想到老朋友智谱在 2024 年最后一天又整活儿了,突然就发布了 GLM 系列的类 o1 模型——GLM-Zero-Preview。
2024 年的最后一天,智谱 GLM 模型家族迎来了一位新成员——GLM-Zero 的初代版本 GLM-Zero-Preview,主打深度思考与推理。
AI初创团队狸谱,过去半年间,他们接连推出两款新奇的AI小游戏,在二次元圈和AI圈颇受关注。我们联系到狸谱产品增长负责人Levi,聊了聊AI赛道“一波流”产品的魅力,以及他们打造这些破圈小游戏背后的产品增长经验。
o1-preview在医疗诊断中远超人类,赛博看病指日可待?
不仅能推理,还能明确展示自己「推理逻辑」的大模型出现了。 OpenAI 的 12 天连续发布已近尾声,但它的热度显然已经被谷歌夺去了许多。从 Gemini 2.0 Flash 到 Veo 2 到今天的 Gemini 2.0 Flash Thinking,谷歌端上来的菜真是一道比一道香。
程序员的危机要来了?
Devin 是一种全新的 AI 编程,他和 Cursor 还有 Windsurf 的区别在于,Devin 不需要你来操作,你只需要告诉他要做什么。
还记得Devin吗?号称全球第一位人工智能软件工程师,今天终于正式发布了