AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造

谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造

谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造

谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。据外媒 The Information 本周四报道,拉里・佩奇成立了名为 Dynatomics 的创业公司,旨在用人工智能颠覆制造业。

来自主题: AI资讯
8493 点击    2025-03-07 14:10
风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

StyleStudio能解决风格迁移中风格过拟合、文本对齐差和图像不稳定的问题,通过跨模态AdaIN技术融合文本和风格特征、用教师模型稳定布局、引入基于风格的无分类器引导,实现精准控制风格元素,提升生成图像的质量和稳定性,无需额外训练,使用门槛更低!

来自主题: AI技术研报
3058 点击    2025-03-07 11:04
开启空间智能问答新时代:Spatial-RAG框架来了

开启空间智能问答新时代:Spatial-RAG框架来了

开启空间智能问答新时代:Spatial-RAG框架来了

当涉及到空间推理任务时,LLMs 的表现却显得力不从心。空间推理不仅要求模型理解复杂的空间关系,还需要结合地理数据和语义信息,生成准确的回答。为了突破这一瓶颈,研究人员推出了 Spatial Retrieval-Augmented Generation (Spatial-RAG)—— 一个革命性的框架,旨在增强 LLMs 在空间推理任务中的能力。

来自主题: AI技术研报
5746 点击    2025-03-07 10:34
DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络(Multi-head Latent Attention, MLA)是其经济推理架构的核心之一,通过对键值缓存进行低秩压缩,显著降低推理成本 [1]。

来自主题: AI技术研报
5341 点击    2025-03-07 10:24
心理学上有个实验:普通人大部分的焦虑,被一封AI回信“接住”了

心理学上有个实验:普通人大部分的焦虑,被一封AI回信“接住”了

心理学上有个实验:普通人大部分的焦虑,被一封AI回信“接住”了

这项最新研究,由北京师范大学和南开大学的研究者们共同完成,于2025年发表于Internet Interventions 上,你只需要写一封信,写给自己,然后让ChatGPT 来给你一点反馈。不用约时间、也不用担心费用,只要在屏幕上敲下几行字,焦虑竟然真的能减少。

来自主题: AI资讯
6164 点击    2025-03-06 09:50
老罗要做AIOS,挖来小米前50号员工

老罗要做AIOS,挖来小米前50号员工

老罗要做AIOS,挖来小米前50号员工

在启动 AIOS 之前,老罗最急迫的事情是融到下一笔钱。

来自主题: AI资讯
9723 点击    2025-03-05 14:46
全球征集开源 AI 项目共赴巴黎!GOSIM AI Spotlight 邀你开源创新面对面

全球征集开源 AI 项目共赴巴黎!GOSIM AI Spotlight 邀你开源创新面对面

全球征集开源 AI 项目共赴巴黎!GOSIM AI Spotlight 邀你开源创新面对面

GOSIM 是致力于为创新项目搭建全球化的开放、多元、包容的合作与发展平台。2025 年 5 月 6 - 7 日,GOSIM AI Paris 2025 大会将于在法国巴黎 Station F 举行,诚邀全球顶尖的 AI 专家、技术开发者、学者和开源创新者齐聚法国巴黎,共同探讨 AI 技术的未来发展。

来自主题: AI资讯
6498 点击    2025-03-05 09:01
北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

本文构建了新的多轮组合图像检索数据集和评测基准FashionMT。其特点包括:(1)回溯性:每轮修改文本可能涉及历史参考图像信息(如保留特定属性),要求算法回溯利用多轮历史信息;(2)多样化:FashionMT包含的电商图像数量和类别分别是MT FashionIQ的14倍和30倍,且交互轮次数量接近其27倍,提供了丰富的多模态检索场景。

来自主题: AI技术研报
7550 点击    2025-03-05 08:46
Mercury:颠覆性扩散大语言模型如何重塑AI生成领域

Mercury:颠覆性扩散大语言模型如何重塑AI生成领域

Mercury:颠覆性扩散大语言模型如何重塑AI生成领域

2025年2月27日,由前扩散模型领域顶尖研究者创立的Inception Labs正式发布了全球首个商业级扩散大语言模型(dLLM)——“Mercury”。这一里程碑式产品不仅在生成速度、硬件效率和成本控制上实现突破,更标志着自然语言处理技术从自回归(Autoregressive)范式向扩散(Diffusion)范式的重大跃迁。

来自主题: AI资讯
9206 点击    2025-03-04 13:02