AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

NeurIPS 2024 | 哈工深提出新型智能体Optimus-1,横扫Minecraft长序列任务

在 Minecraft 中构造一个能完成各种长序列任务的智能体,颇有挑战性。现有的工作利用大语言模型 / 多模态大模型生成行动规划,以提升智能体执行长序列任务的能力。

来自主题: AI技术研报
5733 点击    2024-12-06 17:58
满血版o1深夜震撼上线,奥特曼怼脸演示超强推理!终极Pro版每月1450元

满血版o1深夜震撼上线,奥特曼怼脸演示超强推理!终极Pro版每月1450元

满血版o1深夜震撼上线,奥特曼怼脸演示超强推理!终极Pro版每月1450元

就在刚刚,满血版o1震撼上线了!它首次将多模态和新的推理范式结合起来,更智能、更快速。同时推出的还有200美元/月的专业版ChatGPT Pro。奥特曼亲自和Jason Wei等人做了演示,同时放出的,还有49页完整论文。据网友预测,GPT-4.5可能也要来了。

来自主题: AI资讯
9481 点击    2024-12-06 08:06
银海眼科段俊国教授科研团队助力国内首个眼科AI大模型“伏羲慧眼”

银海眼科段俊国教授科研团队助力国内首个眼科AI大模型“伏羲慧眼”

银海眼科段俊国教授科研团队助力国内首个眼科AI大模型“伏羲慧眼”

近日,眼科医学领域迎来了一项重大突破,由北京同仁眼科中心主任、河南省医学科学院院长王宁利教授领衔的科研团队携手成都中医药大学眼科学院/附属银海眼科医院段俊国教授科研团队等多个团队共同研发出了国内首个多模态、多任务眼科AI大模型——“伏羲慧眼”。

来自主题: AI资讯
6032 点击    2024-12-05 09:11
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解,动态调整下一步检索策略

阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解,动态调整下一步检索策略

阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解,动态调整下一步检索策略

多模态检索增强生成(mRAG)也有o1思考推理那味儿了! 阿里通义实验室新研究推出自适应规划的多模态检索智能体。 名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。

来自主题: AI资讯
6513 点击    2024-12-04 16:57
亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

围剿英伟达,数十万颗自研二代芯片超算在建!亚马逊祭出地表最强全家桶,多模态Nova击败GPT-4o。

来自主题: AI资讯
5407 点击    2024-12-04 16:06
奇绩创坛2024秋季路演,这60个AI创业项目拿到钱了

奇绩创坛2024秋季路演,这60个AI创业项目拿到钱了

奇绩创坛2024秋季路演,这60个AI创业项目拿到钱了

2024 年 12 月 1 月下午,奇绩创坛在北京中关村国际创新中心举办了 2024 年秋季创业营路演日,共有 60 家奇绩投资并加速的公司参与了路演。前沿创新信号:大模型(49 家),多模态(28 家),数据(24 家),具身智能(14 家),仿真(4 家)。

来自主题: AI资讯
8308 点击    2024-12-02 23:41
关于计算机视觉中的自回归模型,这篇综述一网打尽了

关于计算机视觉中的自回归模型,这篇综述一网打尽了

关于计算机视觉中的自回归模型,这篇综述一网打尽了

随着计算机视觉领域的不断发展,自回归模型作为一种强大的生成模型,在图像生成、视频生成、3D 生成和多模态生成等任务中展现出了巨大的潜力。然而,由于该领域的快速发展,及时、全面地了解自回归模型的研究现状和进展变得至关重要。本文旨在对视觉领域中的自回归模型进行全面综述,为研究人员提供一个清晰的参考框架。

来自主题: AI技术研报
7147 点击    2024-12-01 14:21
多模态慢思考:分解原子步骤以解决复杂数学推理

多模态慢思考:分解原子步骤以解决复杂数学推理

多模态慢思考:分解原子步骤以解决复杂数学推理

AtomThink 是一个包括 CoT 注释引擎、原子步骤指令微调、政策搜索推理的全流程框架,旨在通过将 “慢思考 “能力融入多模态大语言模型来解决高阶数学推理问题。量化结果显示其在两个基准数学测试中取得了大幅的性能增长,并能够轻易迁移至不同的多模态大模型当中。

来自主题: AI技术研报
5496 点击    2024-11-30 16:45
清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS'24

清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS'24

清华新VLA框架加速破解具身智能止步实验室“魔咒”,LLM开销节省4-6倍 | NeurIPS'24

计算、存储消耗高,机器人使用多模态模型的障碍被解决了! 来自清华大学的研究者们设计了DeeR-VLA框架,一种适用于VLA的“动态推理”框架,能将LLM部分的相关计算、内存开销平均降低4-6倍。

来自主题: AI技术研报
6318 点击    2024-11-30 16:29
千亿市值上市公司高管离职创业AI CRM,首轮红杉资本投资

千亿市值上市公司高管离职创业AI CRM,首轮红杉资本投资

千亿市值上市公司高管离职创业AI CRM,首轮红杉资本投资

CRM作为企业软件中最大的板块之一,其价值毋庸置疑。传统CRM的本质是关系型数据库,在AI尤其是多模态技术的加成下,CRM从结构化数据向半结构化/非结构化数据的转变势在必行。

来自主题: AI资讯
5850 点击    2024-11-30 16:24