我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!
我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas,就跟孔雀开屏一样 ~ 谷歌最近的大动作是发布了 Gemini 2.0 嘛!2.0 比 1.5 版本快一倍,而且是原生的多模态大模型,能输入和生成语言、声音、图片、视频等。
搜索
OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas,就跟孔雀开屏一样 ~ 谷歌最近的大动作是发布了 Gemini 2.0 嘛!2.0 比 1.5 版本快一倍,而且是原生的多模态大模型,能输入和生成语言、声音、图片、视频等。
在探索迈向AGI(通用人工智能)物理世界的路径中,通用机器人被视作关键载体。
大模型的出现,让汽车行业来到了「AI定义汽车」的新拐点。
因为流匹配的公式很简单,并且生成样本的路径很直接,最近越来越受研究者们的欢迎,于是很多人都在问: 「到底是扩散模型好呢?还是流匹配好?」
来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法CityGaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。
Sora来了,集视频生成和编辑于一体,已经开放给所有人使用了。
李飞飞最新采访来了,继续延伸她在NeurIPS有关视觉智能的话题。
本期我们请到了具身智能初创企业千寻智能Spirit AI的两位创始人,千寻智能于2024年2月成立,不到1年时间,千寻智能已接连完成三轮融资。其最近一次融资,在2024年10 月完成交割,而且千寻新一轮融资也在火爆进行中,据说已经进入收尾阶段。
我们距离AGI还有多远?智能体、智能体自动化的5个级别与自主工作的6个level
最近,Apollo Research团队发布了一项令人深思的研究。这项研究揭示了一个惊人的发现:当前主流的前沿AI模型已经具备了基本的"策划"(Scheming)能力。