
自回归+扩散!Salesforce开源统一多模态模型BLIP3-o,图像理解与生成全拿下
自回归+扩散!Salesforce开源统一多模态模型BLIP3-o,图像理解与生成全拿下OpenAI 的 GPT-4o 在图像理解、生成和编辑任务上展现了顶级性能。流行的架构猜想是:
OpenAI 的 GPT-4o 在图像理解、生成和编辑任务上展现了顶级性能。流行的架构猜想是:
OpenAI、苹果押注AI coding后,创业公司还有机会吗?
OpenAI至少已经是第二次与苹果旧将合作了。上次是Humane的AI Pin,以惨败收场;这次是io,已经有了原型,目标出货1亿台。
苹果元老级人物、前首席设计官初创公司,OpenAI斥巨资收入囊中!
在Google I/O的第二天,硅星人有机会和Google CEO Sundar Pichai交流。在这场小范围的沟通中,Pichai及Google的多名核心业务负责人回答了从搜索到广告再到AI等多个问题。今年是Pichai执掌Google的第十年,过去三年带领Google从OpenAI的冲击中走出,如今看来很可能成为他CEO生涯至今打过的最重要一仗。
就在刚刚,OpenAI 正式官宣,将以接近 65 亿美元(折合人民币 468.16 亿元)的价格收购由 OpenAI CEO Sam Altman 与前苹果首席设计官 Jony Ive 联合创办的 AI 设备初创公司 io。
当OpenAI、谷歌还在用Sora等AI模型「拍视频」,英伟达直接用视频生成模型让机器人「做梦」学习!新方法DreamGen不仅让机器人掌握从未见过的新动作,还能泛化至完全陌生的环境。利用新方法合成数据直接暴涨333倍。机器人终于「做梦成真」了!
AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。
今夜,谷歌彻底杀疯!2小时发布会,Gemini提及95次点亮全场。Gemini 2.5家族全系升级,Pro深度思考模型正刷榜。全新Imagen 4生成细节超逼真,Veo 3首次实现音视频融合。
一份隐藏了部分关键信息的法庭文件,给我们展示了 OpenAI 的很多独家信息,特别是对 ChatGPT 的发展、如何定位自己的竞争对手以及自己的护城河在哪等。