AI资讯新闻榜单内容搜索-TIM

14 项任务测下来，GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力？

2023-2024年，以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型（Multimodal LLMs）已经在文本和图像等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。

来自主题: AI技术研报

9990 点击 2024-05-10 23:32

今年 3 月，以构建大型开源社区而闻名的 AI 初创公司 Hugging Face，挖角前特斯拉科学家 Remi Cadene 来领导一个新的开源机器人项目 ——LeRobot，引起了轰动。

来自主题: AI技术研报

8630 点击 2024-05-08 11:05

特斯拉人形机器人又解锁了新技能！昨日，Tesla Optimus 官方发布了新的 demo 视频，展示了二代 Optimus 人形机器人的最新进展。

来自主题: AI技术研报

12348 点击 2024-05-06 17:44

Google RT-2、Figure 01 机器人、特斯拉 Optimus 等的新演示让「具身智能」这一概念成为了机器人和大模型领域的热门话题

来自主题: AI资讯

6455 点击 2024-04-22 21:02

近，来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用，并提出了一个全新的视角

来自主题: AI技术研报

9014 点击 2024-04-14 13:07

TimesFM针对时序数据设计，输出序列长于输入序列，在1000亿时间点数据进行预训练后，仅用200M参数量就展现出超强零样本学习能力！

来自主题: AI技术研报

6173 点击 2024-03-15 15:42

Sora出世前，他们拿着一篇如今被ICLR 2024接收的论文，十分费劲地为投资人、求知者讲了大半年，却处处碰壁。

来自主题: AI资讯

7230 点击 2024-03-07 14:05

现在世界上最受关注的技术团队是哪一支？Sora团队，已经来到聚光灯中心。

来自主题: AI资讯

8778 点击 2024-02-19 11:22

最近，谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。

来自主题: AI技术研报

9039 点击 2024-02-05 14:33

随着多模态大语言模型（Multimodal Large Language Model，MLLM）的快速发展，以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中，这使得借助多模态 agent 实现手机操作助手成为了可能。

来自主题: AI资讯

9538 点击 2024-02-04 13:39