AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
“3SB大战”12周年,三个老伙伴要决战大模型之巅?

“3SB大战”12周年,三个老伙伴要决战大模型之巅?

“3SB大战”12周年,三个老伙伴要决战大模型之巅?

日前,360周鸿祎在第二十七届哈佛中国论坛炮轰百度李彦宏“开源不如闭源”的言论,称其胡说八道。有网友评论:当年的那个老周仿佛回来了

来自主题: AI技术研报
3570 点击    2024-04-19 20:40
李彦宏不寒碜:不赚钱,做大模型干吗?

李彦宏不寒碜:不赚钱,做大模型干吗?

李彦宏不寒碜:不赚钱,做大模型干吗?

一位行业领袖对技术路线的断言甚至是“拉踩”,其影响,或许将远超公众预判

来自主题: AI技术研报
5803 点击    2024-04-19 18:59
CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

CVPR 2024高分论文:全新生成式编辑框架GenN2N,统一NeRF转换任务

来自香港科技大学,清华大学的研究者提出了「GenN2N」,一个统一的生成式 NeRF-to-NeRF 转换框架,适用于各种 NeRF 转换任务,例如文字驱动的 NeRF 编辑、着色、超分辨率、修复等,性能均表现极其出色!

来自主题: AI技术研报
7783 点击    2024-04-19 17:17
开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4

开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4

开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4

ChatGPT 拉开了大模型竞赛的序幕,Meta 似乎要后来居上了。 本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama 3。

来自主题: AI技术研报
4573 点击    2024-04-19 17:14
谁才是最强的?清华给海内外知名大模型做了场综合能力评测

谁才是最强的?清华给海内外知名大模型做了场综合能力评测

谁才是最强的?清华给海内外知名大模型做了场综合能力评测

在 2023 年的 “百模大战” 中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。

来自主题: AI技术研报
7642 点击    2024-04-19 11:29
生成式AI如何告别色情、版权困扰?基于权重显著性的机器遗忘算法有奇效

生成式AI如何告别色情、版权困扰?基于权重显著性的机器遗忘算法有奇效

生成式AI如何告别色情、版权困扰?基于权重显著性的机器遗忘算法有奇效

近期,硅谷 AI 公司 OpenAI 可谓是话题度拉满,先是一出「宫斗戏」引起舆论哗然,后是公布 Sora 效果炸裂受到了全网的一致好评。在这期间,一桩诉讼案件同样引爆了热点 —— 因 ChatGPT 涉嫌侵犯纽约时报著作权,OpenAI 及微软被起诉并要求支付巨额版权费 [1]。

来自主题: AI技术研报
6777 点击    2024-04-19 11:08
从文字模型到世界模型!Meta新研究让AI Agent理解物理世界

从文字模型到世界模型!Meta新研究让AI Agent理解物理世界

从文字模型到世界模型!Meta新研究让AI Agent理解物理世界

LLM已经可以理解文本和图片了,也能够根据它们的历史知识回答各种问题,但它们或许对周围世界当前发生的事情一无所知

来自主题: AI技术研报
5147 点击    2024-04-18 15:52
Sam Altman最新采访:模型性能不是长期差异化的关键

Sam Altman最新采访:模型性能不是长期差异化的关键

Sam Altman最新采访:模型性能不是长期差异化的关键

这是OpenAI CEO Sam Altman和COO Brad Lightcap的最新采访。作为OpenAI的首席运营官,Brad Lightcap的工作是负责推动公司销售、市场营销、合作伙伴关系和业务发展。

来自主题: AI技术研报
8395 点击    2024-04-18 13:27
打破AI计算生态系统的瓶颈,Foundry获8000万美元新融资

打破AI计算生态系统的瓶颈,Foundry获8000万美元新融资

打破AI计算生态系统的瓶颈,Foundry获8000万美元新融资

目前,GPU芯片紧缺成为AI行业面临的问题,另一方面,因为传统云服务计算架构与AI计算负载的不匹配,大量GPU计算资源没有被充分利用。

来自主题: AI技术研报
5128 点击    2024-04-18 13:23
无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖

无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖

无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖

Karger 算法可以在时间为 O (m log^3n) 的图中找到一个最小割点,他们将这个时间称之为近线性时间,意思是线性乘以一个多对数因子

来自主题: AI技术研报
8100 点击    2024-04-17 20:21
Meta无限长文本大模型来了:参数仅7B,已开源

Meta无限长文本大模型来了:参数仅7B,已开源

Meta无限长文本大模型来了:参数仅7B,已开源

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案

来自主题: AI技术研报
6619 点击    2024-04-17 20:17
首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

首个国产音乐SOTA模型来了!专为中文优化,免费用,不限曲风

前段时间,X 平台知名 AI 博主 Aran Komatsuzaki 自己写了一首歌,专门用来表达对另一位 AI 科学家 ——Gary Marcus 的不满

来自主题: AI技术研报
5073 点击    2024-04-17 20:03
看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

看懂网飞版「三体」!Reka Core登场:挑战GPT-4、Claude 3

近日,由DeepMind、谷歌和Meta的研究人员创立的AI初创公司Reka,推出了他们最新的多模态语言模型——Reka Core

来自主题: AI技术研报
5353 点击    2024-04-17 19:11
用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

多任务机器人学习在应对多样化和复杂情景方面具有重要意义。然而,当前的方法受到性能问题和收集训练数据集的困难的限制

来自主题: AI技术研报
6761 点击    2024-04-17 18:16
智慧与“长文本”并存,360 开源最长模型,吊打“弱智吧”!

智慧与“长文本”并存,360 开源最长模型,吊打“弱智吧”!

智慧与“长文本”并存,360 开源最长模型,吊打“弱智吧”!

继之前公开课之后(周鸿祎:2024 年 AI 产业发展的 16 个趋势。)红衣大叔兑现诺言,开源了 7B 系列大模型

来自主题: AI技术研报
8026 点击    2024-04-17 18:03
脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑机接口最新进展登上Nature子刊,深度学习三巨头之一的LeCun都来转发。

来自主题: AI技术研报
7684 点击    2024-04-17 17:06
Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

Pika联创参与新研究:Diffusion能抢GPT的活了!成功挑战自回归文本范式

纵观生成式AI领域中的两个主导者:自回归和扩散模型。 一个专攻文本等离散数据,一个长于图像等连续数据。 如果,我们让后者来挑战前者的主场,它能行吗?

来自主题: AI技术研报
10031 点击    2024-04-17 17:02
技术Blog | 超强端侧多模态大模型MiniCPM-V 2.0: 具备领先OCR和理解能力

技术Blog | 超强端侧多模态大模型MiniCPM-V 2.0: 具备领先OCR和理解能力

技术Blog | 超强端侧多模态大模型MiniCPM-V 2.0: 具备领先OCR和理解能力

MiniCPM 系列的最新多模态版本 MiniCPM-V 2.0。该模型基于 MiniCPM 2.4B 和 SigLip-400M 构建,共拥有 2.8B 参数。MiniCPM-V 2.0 具有领先的光学字符识别(OCR)和多模态理解能力

来自主题: AI技术研报
7433 点击    2024-04-16 22:20
李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结

来自主题: AI技术研报
5079 点击    2024-04-16 21:53
模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

现今,机器学习(ML),更具体地说,深度学习已经改变了从金融到医疗等广泛的行业。在当前的 ML 范式中,训练数据首先被收集和策划,然后通过最小化训练数据上的某些损失标准来优化 ML 模型

来自主题: AI技术研报
5985 点击    2024-04-16 21:48
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat,大语言模型(LLM)在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报
5904 点击    2024-04-16 18:08
陶哲轩力荐!史上最全「数学AI资源」清单出炉

陶哲轩力荐!史上最全「数学AI资源」清单出炉

陶哲轩力荐!史上最全「数学AI资源」清单出炉

史上最全的「数学人工智能资源」清单出炉了。 陶哲轩,信奉AI将在2026年成为人类数学家的重要合著者,一早便转发了这份清单。

来自主题: AI技术研报
5981 点击    2024-04-15 17:29
还在卷长文本?谷歌最新论文直接把文本干到…无限长了

还在卷长文本?谷歌最新论文直接把文本干到…无限长了

还在卷长文本?谷歌最新论文直接把文本干到…无限长了

通过这项技术,能使transformer大模型在有限的计算资源 条件下,处理无限长度的输入。

来自主题: AI技术研报
6123 点击    2024-04-15 15:15