AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律

Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律

Adobe黑科技:视频扩散降维图像编辑,ObjectMover秒懂物理规律

论文第一作者为余鑫,香港大学三年级博士生,通讯作者为香港大学齐晓娟教授。主要研究方向为生成模型及其在图像和 3D 中的应用,发表计算机视觉和图形学顶级会议期刊论文数十篇,论文数次获得 Oral, Spotlight 和 Best Paper Honorable Mention 等荣誉。此项研究工作为作者于 Adobe Research 的实习期间完成。

来自主题: AI技术研报
9279 点击    2025-03-30 10:46
专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

专抓AI“看图说谎”,谷歌哥大用三类陷阱触发幻觉,打造可随技术发展动态演进的评估框架

幻觉(Hallucination),即生成事实错误或不一致的信息,已成为视觉-语言模型 (VLMs)可靠性面临的核心挑战。随着VLMs在自动驾驶、医疗诊断等关键领域的广泛应用,幻觉问题因其潜在的重大后果而备受关注。

来自主题: AI技术研报
7153 点击    2025-03-29 15:36
与真格戴雨森聊 Agent:各行业都会遭遇 “李世石时刻”,Attention is not all you need

与真格戴雨森聊 Agent:各行业都会遭遇 “李世石时刻”,Attention is not all you need

与真格戴雨森聊 Agent:各行业都会遭遇 “李世石时刻”,Attention is not all you need

晚点:过去将近 6 个月,AI 领域最重要的两件事,一是 OpenAI 去年 9 月 o1 发布,另一个是近期 DeepSeek 在发布 R1 后掀起全民狂潮。我们可以从这两个事儿开始聊。你怎么看 o1 和 R1 分别的意义?

来自主题: AI资讯
9458 点击    2025-03-29 00:33
轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动

轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动

轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动

轨迹可控的视频生成来了,支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。研究人员提出了MagicMotion,一种创新的图像到视频生成框架,共同第一作者为复旦大学研究生李全昊、邢桢,通讯作者为复旦大学吴祖煊副教授。

来自主题: AI技术研报
6454 点击    2025-03-27 09:17
姚班天才范浩强创业公司曝光!旷视三剑客携2亿天使轮进军具身智能赛道

姚班天才范浩强创业公司曝光!旷视三剑客携2亿天使轮进军具身智能赛道

姚班天才范浩强创业公司曝光!旷视三剑客携2亿天使轮进军具身智能赛道

在AI领域,最强“小强”指向明确:IOI奥赛金牌得主、清华姚班天才、旷视6号员工——范浩强。公司原力灵机,去年12月17日在海淀区注册,刚刚从水下空降般浮出水面,同日宣布近期完成2亿元天使轮融资,投资方包含君联资本、九坤创投、启明创投。

来自主题: AI资讯
7928 点击    2025-03-26 16:01
Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型

Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型

Stable Diffusion变身3D神器!一个LoRA将2D图像转3D模型

在Stable Diffusion当中,只需加入一个LoRA就能根据图像创建3D模型了?

来自主题: AI技术研报
7385 点击    2025-03-26 14:56
AI-Native游戏应该如何落地?看看这12款游戏是怎么做的

AI-Native游戏应该如何落地?看看这12款游戏是怎么做的

AI-Native游戏应该如何落地?看看这12款游戏是怎么做的

最近 Steam AI 驱动的游戏数量也在逐渐增多,涵盖了派对游戏、恋爱模拟等各个品类,很多游戏的玩法创新都能让人眼前一亮。

来自主题: AI资讯
7534 点击    2025-03-26 11:34
GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

在ChatGPT上,当你画图的选项变成这个的时候,就说明用的不是Dalle3了,而是4o。目前,有两个渠道可以使用4o Image Generation。一个事ChatGPT,一个是单独的那个Sora的网站。

来自主题: AI资讯
10445 点击    2025-03-26 08:10
简单吧,Agent优化就两种路径,有参数优化和无参数优化,你选哪种 | 最新综述

简单吧,Agent优化就两种路径,有参数优化和无参数优化,你选哪种 | 最新综述

简单吧,Agent优化就两种路径,有参数优化和无参数优化,你选哪种 | 最新综述

本文基于一项系统性研究《A Survey on the Optimization of Large Language Model-based Agents》,该研究由华东师大和东华大学多位人工智能领域的研究者共同完成。研究团队通过对大量相关文献的分析,构建了一个全面的LLM智能体优化框架,涵盖了从理论基础到实际应用的各个方面。您有兴趣可以找来读一下这篇综述。

来自主题: AI技术研报
5700 点击    2025-03-25 16:33
速递|韩企FuriosaAI芯片硬刚Meta:8亿美金不卖,计划融资4800万美元

速递|韩企FuriosaAI芯片硬刚Meta:8亿美金不卖,计划融资4800万美元

速递|韩企FuriosaAI芯片硬刚Meta:8亿美金不卖,计划融资4800万美元

据当地媒体报道,韩国 AI 应用芯片初创公司 FuriosaAI 拒绝了 Meta 的 8 亿美元收购,选择继续专注于开发和生产其 AI 芯片。

来自主题: AI资讯
7471 点击    2025-03-25 15:25