
AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行
AI版华尔街之狼!o3-mini靠「神之押注」狂赚9倍,DeepSeek R1最特立独行AI能像科幻电影中的先知一样预测未来吗?一个名为「Prophet Arena」的全新基准测试,正通过预测真实世界事件来评估AI的「预言」能力。
AI能像科幻电影中的先知一样预测未来吗?一个名为「Prophet Arena」的全新基准测试,正通过预测真实世界事件来评估AI的「预言」能力。
不久之后,我们阅读的各种新闻网站的首页,也许都是AI编排的。 8月12日,以AI搜索为主赛道的公司Perplexity,提出以345亿美元收购谷歌Chrome浏览器。这一数字甚至高于Perplexity目前180亿美元的估值。
大家好,我是 AI牛马! 作为一个常年和代码打交道的技术博主,最头疼的就是接到“把这个老项目重构成 React”的需求。手动扒页面、抠样式、改交互……动不动就耗上几天。直到在 GitHub 发现 Open Lovable 这个神器,我才知道:原来克隆网站,AI 真的能比人快 10 倍!
在大语言模型(LLMs)领域,自回归(AR)范式长期占据主导地位,但其逐 token 生成也带来了固有的推理效率瓶颈。此前,谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量,向业界展现了扩散大语言模型(dLLMs)在推理速度上的巨大潜力。
7月30日小规模上线测试后,soon很快在游戏圈掀起热议,它可以让你“一句话生成一个游戏”,而且是真正能玩的那种。
智东西8月17日报道,今天,世界人形机器人运动会医药场景药物分拣比赛决赛落下帷幕。从初赛到复赛,银河通用Galbot队全程零遥操作、完全自主运行,预赛、复赛及决赛均为第一,最终以10分22秒用时,336分的总赋分夺得本场赛事冠军。
自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B/20B),Sebastian Raschka博士将我们带回硬核拆机现场,回溯了从GPT-2到gpt-oss的大模型演进之路,并将gpt-oss与Qwen3进行了详细对比。
Genie 3来了!这或许是最接近「模拟世界」的AI魔法。只需一句话,它就能生成一个动态、可互动的世界——角色能互动、下水会溅起水花,甚至还能记住一分钟前的细节。DeepMind研究者直言:Genie 3是通向AGI的关键一步。
目前三星正被各方压力拉扯,资源被摊得很薄,营收增长停滞,利润空间被压缩到不舒服。芯片业务的下滑尤其扎心——2024年第二季度半导体部门运营利润只有4000亿韩元,而分析师的预期是2.73万亿韩元,这差距不是一星半点。
作者测试了智谱GLM-4.5V(开启/关闭推理)、豆包、Kimi、元宝和ChatGPT-5在识别十张奇葩卫生间标识上的表现。评测模拟紧急如厕场景,按识别正确性评分。结果智谱普通模式得分最高(86分),ChatGPT-5和智谱推理模式次之(78分),豆包和元宝70分,Kimi垫底(38分),揭示了各AI视觉能力的差异及局限性。