
刚刚,Ilya一个神秘动作!OpenAI全员狂欢:AGI来了
刚刚,Ilya一个神秘动作!OpenAI全员狂欢:AGI来了Ilya「换头」全网炸锅,难道内部已实现「超级智能」?另一边,OpenAI研究员集体高潮,惊呼感受AGI,究竟在憋着什么大招?
Ilya「换头」全网炸锅,难道内部已实现「超级智能」?另一边,OpenAI研究员集体高潮,惊呼感受AGI,究竟在憋着什么大招?
“投资可以很简单很有趣。” 这是一个9岁开始炒股、10年前押中英伟达的投资老手——赖蕴琦Vakee,想传递给所有人的理念。
大模型正在成为AI公司的直接收入增长引擎,全栈AI布局形成的飞轮效应进一步显现,清晰业务模式+技术路径,已是大模型落地战中的关键纲领。
8 月 26 日,由香港投资管理有限公司(下称 “港投公司”)与北京智源人工智能研究院(下称 “智源研究院”)联合主办的首届 “AI 国际人才峰会” 在香港成功举办。香港特别行政区政府财政司司长陈茂波、港投公司行政总裁陈家齐、智源研究院理事长黄铁军等出席并致辞。
这位乒乓球场上的机器人高手,出自清华姚班本科生苏智(师从吴翼教授)的最新论文——《HITTER: A HumanoId Table TEnnis Robot via Hierarchical Planning and Learning》。
谷歌最新图像模型nano banana横空出世,它不仅能融合多张图片拼接出全新画面,还能理解地理、建筑与物理结构,甚至将二维地图转化为三维景观。凭借Gemini的世界知识与交错生成技术,模型实现了「有记忆」的多轮创作,带来极高一致性与创造力。nano banana正在重塑AI图像生成的边界,也引发了「AI创意伙伴」未来的无限遐想。
Grok首个编码模型终于来了!从0构建,编程实力超强,直接冲进SWE-bench前五,仅次于OpenAI Codex-1。背后核心团队同时被爆出,华人学者占多半。
在人类经济活动数字化的浪潮中,互联网和移动互联网走完了前两步,正在浮现中的AI经济,可能带来更大的变化。
2025 年 8 月 29 日,由清华大学计算机系崔鹏教授团队联合稳准智能共同研发的结构化数据通用大模型「极数」(LimiX)正式宣布开源。
最近,a16z的合伙人们发布了一篇深度分析文章,系统梳理了Computer Use(计算机使用)技术的发展现状和未来前景。他们认为,这项技术正在将AI agent从概念推向现实,让AI真正具备了处理端到端数字工作流的能力。
“生命不息,折腾不止”,全球首富马斯克一直在身体力行地践行这句话。在不久前刚折腾完“DOGE”后,最近他又盯上了苹果。本月初马斯克突然对苹果发起猛烈抨击,指责后者App Store排行榜偏向OpenAI,从而降低了以自家Grok为代表的其他AI应用的曝光机会。
近日,Meta 研究者 Lucas Beyer 在 𝕏 上发起的一个投票吸引了众多围观。说是围观,是因为他给出的四个选项都是当今或过去的 AI 大厂,显然,并不是每个人都有在这些大厂的面试经历,但这并不妨碍全球 AI 开发者的好奇心。
香蕉也能变礼服?Google 真的做到了! 在最新一期谷歌开发者节目里,Google DeepMind 团队首次全面展示了 Gemini 2.5 Flash Image —— 一款拥有原生图像生成与编辑能力的最新模型。
微软紧跟OpenAI的节奏,在同一天也亲自下场发布了微软自研的两个大模型:语音模型MAI-Voice-1和通用模型MAI-1-preview。对于这位老大哥,亲自下场做的第一个AI大模型,效果究竟怎么样?
针对OpenAI最新开源的GPT-OSS,这一篇面向零基础小白用户的手把手式的详细训练教程或许能帮助你完成你的第一个GPT训练项目。
大厂在 AI Agent 上的每一步动作,都值得紧盯。因为没人能预测,一个看似小小的产品,最终会被扩展到多大规模,串联出怎样的「新业务体系」。
刚刚,《时代》周刊发布了 2025 年度 AI 领域最具影响力的 100 人名单。
最近刷视频号时意外发现,评论区多了位「万能 AI 助手」——@腾讯元宝。使用方法很简单,微信搜索「元宝」,添加带 AI 后缀的那个账号为通讯录好友,就可以在视频号评论区 @ 它了。
Framer 是一家荷兰公司,专门开发网页设计自动化工具,目前已完成一轮估值达 20 亿美元的融资。
小某书最新起号方式,还得看AI(doge)。 这两天打开一看,几乎全被各种精致逼真的手办图刷屏了
根据麻省理工学院NANDA 计划最新发布的报告显示,企业开展的生成式 AI 试点项目失败率高达 95%。但最先进的企业并未完全放弃这项技术,而是开始尝试能够持续学习并接受监督的自主 AI 系统。
近日,上海交大和上海人工智能实验室的研究发现,AI 的风险正从个体失控转向群体性的恶意共谋(Collusion)——即多个智能体秘密协同以达成有害目标。Agent 不仅可以像人类团队一样协作,甚至在某些情况下,还会展现出比人类更高效、更隐蔽的「团伙作案」能力。
说个热知识,现在的大模型,也可以轻松被投广告了。 我们之前也确实发现过这类现象,当时是在研究一家做 GEO(生成式引擎优化)的公司。通过在网上堆出大量正面内容,把某个特定品牌、网站、课程甚至微商产品,默默地塞进了大模型推荐结果里。
不卷参数的专业模型,会不会被通用大模型取代? 在医疗领域,这个疑问正在被打破。
Nano Banana我之前预告过说要写,今天终于写完了。Nano Banana就是现在谷歌的gemini-2.5-flash-image-preview(看你这么厉害,后续就晋升缩写为NB吧),确实是很不错,我尝试了多种玩法,现在分享给大家,今天废话少说,但是案例管饱,来来一起往下看!
OpenAI凌晨发布最新生产级别语音模型和API。Realtime API实现语音直接处理,支持图像输入、远程MCP服务器与SIP打电话,极大简化语音智能体构建;而新一代语音到语音模型gpt-realtime,在音质、理解力、指令遵循和函数调用上全面提升,语音几乎媲美真人,还能多语种切换与细腻表达。
本月初,AI 圈翘首以盼的 GPT-5 终于问世,在数学、实际编程、多模态理解、推理等多个领域实现了新的 SOTA。今日,国产 AI 厂商元石科技重磅推出「All in One」旗舰模型 —— 问小白 5,成为其迄今为止最智能、最快捷、最实用的 AI 系统。尤其值得强调的是:问小白 5 的各项基准测试榜单成绩最接近 GPT-5,这使其成为当前国产大模型中最具代表性的对标者。
在 AI 大模型席卷编程世界之前,很多开发者做 Side Project 靠的就是“死磕”:查文档、踩坑、调试,一个小游戏能折腾三个月。而如今,大模型不仅能写样例代码,还能帮你快速迁移业务逻辑、实现复杂规则。本文作者就用亲身经历对比了“没用大模型时花 3 个月 vs 用大模型只花 3 天”的真实差距。
速度比 GPT-5 快三倍,便宜六倍。 本周四,马斯克的 xAI 正式推出了旗下的最新代码模型 Grok Code Fast 1。
刚刚,风头被中国机器人盖过的波士顿动力,又整了个大活!前后空翻我还能理解,这侧空翻?(不是哥们,你真会啊!)他们先在仿真环境中进行强化学习,一旦策略出现问题,那么他们就将其部署在真机上进行测试,观察问题,然后反复测试迭代,加强Spot的稳定性。