AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。

来自主题: AI技术研报
6566 点击    2024-04-09 15:57
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

Stability AI推出Stable LM 2 12B模型,作为其新模型系列的进一步升级,该模型基于七种语言的2万亿Token进行训练,拥有更多参数和更强性能,据称在某些基准下能超越Llama 2 70B。

来自主题: AI技术研报
8527 点击    2024-04-09 15:44
AI攻克费马大定理?数学家放弃5年职业生涯,将100页证明变代码

AI攻克费马大定理?数学家放弃5年职业生涯,将100页证明变代码

AI攻克费马大定理?数学家放弃5年职业生涯,将100页证明变代码

困扰全世界几个世纪的「臭名昭著」谜题——费马大定理,或将被AI攻克?一位英国数学家宣布,即将启动用Lean重现费马大定理证明过程的项目,将100页证明变成代码。从此,世界顶尖数学难题的证明将成为「众包」项目,你我都可以进去添几笔。

来自主题: AI技术研报
8813 点击    2024-04-09 15:29
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。

来自主题: AI技术研报
6622 点击    2024-04-09 15:14
AI大模型搜索之战开启,胜出黑马竟是ta?

AI大模型搜索之战开启,胜出黑马竟是ta?

AI大模型搜索之战开启,胜出黑马竟是ta?

距离AI「杀死」搜索引擎,到底还差几步?

来自主题: AI技术研报
6744 点击    2024-04-09 14:52
AI治理观察:Sora或者ChatGPT生成的内容版权究竟归谁?

AI治理观察:Sora或者ChatGPT生成的内容版权究竟归谁?

AI治理观察:Sora或者ChatGPT生成的内容版权究竟归谁?

行业狂飙之际,版权利益争夺渐酣今年2月,美国OpenAI公司发布了首个视频生成模型“Sora”,再次掀起全球追进生成式人工智能的热潮。然而,据《纽约时报》近日报道,科技巨头OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型,这一行为可能侵犯了YouTube创作者的版权。

来自主题: AI技术研报
9696 点击    2024-04-09 11:19
用AI软件识别毒蘑菇?AI犯错后,人吃下了毒鹅膏,差点要了命……

用AI软件识别毒蘑菇?AI犯错后,人吃下了毒鹅膏,差点要了命……

用AI软件识别毒蘑菇?AI犯错后,人吃下了毒鹅膏,差点要了命……

AI还教人烹饪毒鹅膏 如今,AI技术正在被广泛地用于我们生活中的方方面面,但是有科学家提醒大家,目前还是先不要把你的健康托付给一些APP,因为它们很有可能会犯错,甚至有可能要了人的命。

来自主题: AI技术研报
8294 点击    2024-04-09 11:14
大模型投资2024:阿里腾讯,争做一号“金主”

大模型投资2024:阿里腾讯,争做一号“金主”

大模型投资2024:阿里腾讯,争做一号“金主”

宁可犯错,不愿错过​。 以国内大模型初创企业主要投资方的身份,腾讯和阿里再次站在了“金主爸爸”的位置。

来自主题: AI技术研报
7761 点击    2024-04-09 11:09
GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

小孩子都会的脑筋急转弯推理题,GPT-4和Claude 3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。然而,他当天就被光速打脸了!网友用高能的prompt,让GPT-4和Claude 3几乎达到百分百的正确率。

来自主题: AI技术研报
5972 点击    2024-04-09 10:32
AI颠覆数学研究!菲尔兹奖得主、华裔数学家领衔11篇顶刊论文|陶哲轩转赞

AI颠覆数学研究!菲尔兹奖得主、华裔数学家领衔11篇顶刊论文|陶哲轩转赞

AI颠覆数学研究!菲尔兹奖得主、华裔数学家领衔11篇顶刊论文|陶哲轩转赞

毫无疑问,数学家的工作方式,正在被AI颠覆!陶哲轩转发的这期美国数学学会通报,大咖云集,星光璀璨。针对AI改变数学的议题,他们中有降临派,也有怀疑论者。而陶哲轩也直接高呼:这个领域太快了,现在我没发表的论文已经不够看了!

来自主题: AI技术研报
5376 点击    2024-04-09 10:08
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」

训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」

训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」

全网高质量数据集告急!OpenAI、Anthropic等AI公司正在开拓新方法,训练下一代AI模型。

来自主题: AI技术研报
4861 点击    2024-04-09 09:55
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各个领域的实用性和灵活性,也为更多视觉场景下的应用探索了新的道路。

来自主题: AI技术研报
5895 点击    2024-04-08 15:49
无需训练,这个新方法实现了生成图像尺寸、分辨率自由

无需训练,这个新方法实现了生成图像尺寸、分辨率自由

无需训练,这个新方法实现了生成图像尺寸、分辨率自由

近日,来自香港中文大学 - 商汤科技联合实验室等机构的研究者们提出了FouriScale,该方法在利用预训练扩散模型生成高分辨率图像方面取得了显著提升。

来自主题: AI技术研报
7875 点击    2024-04-08 15:41
GPU 经济学:算力背后的成本与未来

GPU 经济学:算力背后的成本与未来

GPU 经济学:算力背后的成本与未来

算力供需平衡预计到2030年才能实现

来自主题: AI技术研报
6294 点击    2024-04-08 10:30
牙科AI史上最大融资诞生,行业开始逆袭

牙科AI史上最大融资诞生,行业开始逆袭

牙科AI史上最大融资诞生,行业开始逆袭

牙科AI加速渗透:抉择与挑战 口腔行业重磅融资来袭!

来自主题: AI技术研报
8494 点击    2024-04-08 10:25
阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里的通义千问(Qwen),终于拼齐了1.5系列的最后一块拼图—— 正式开源Qwen 1.5-32B。

来自主题: AI技术研报
7811 点击    2024-04-08 10:09
抱抱脸Open了OpenAI的秘密武器,网易参与复现

抱抱脸Open了OpenAI的秘密武器,网易参与复现

抱抱脸Open了OpenAI的秘密武器,网易参与复现

OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。

来自主题: AI技术研报
6271 点击    2024-04-08 09:55
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

Llama提速500%!谷歌美女程序员手搓矩阵乘法内核

近日,天才程序员Justine Tunney发推表示自己更新了Llamafile的代码,通过手搓84个新的矩阵乘法内核,将Llama的推理速度提高了500%!

来自主题: AI技术研报
6105 点击    2024-04-07 17:49
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了!它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的自拍照或者隐私聊天,该怎么办?

来自主题: AI技术研报
7609 点击    2024-04-07 17:48
二次元专用超分AI模型APISR:在线可用,入选CVPR

二次元专用超分AI模型APISR:在线可用,入选CVPR

二次元专用超分AI模型APISR:在线可用,入选CVPR

《龙珠》、《神奇宝贝》、《新世纪福音战士》等上个世纪开播的动漫是很多人童年回忆的一部分,它们曾给我们带来了充满了热血、友情与梦想的视觉之旅。某些时候,我们会突然有重温这些童年回忆的冲动,但我们却可能会略带遗憾地发现这些童年回忆的分辨率非常低,根本无法在客厅的 4K 大屏电视上创造出良好的视觉体验,以至于可能阻碍我们与在高分辨率数字世界中成长的孩子分享这些童年回忆。

来自主题: AI技术研报
7945 点击    2024-04-07 17:46
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。

来自主题: AI技术研报
5433 点击    2024-04-07 17:46
谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡

Gecko 是一种通用的文本嵌入模型,可用于训练包括文档检索、语义相似度和分类等各种任务。文本嵌入模型在自然语言处理中扮演着重要角色,为各种文本相关任务提供了强大的语义表示和计算能力。

来自主题: AI技术研报
7437 点击    2024-04-07 17:45
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。此外,Octopus v2 比 Llama7B + RAG 方案快 36 倍。

来自主题: AI技术研报
8385 点击    2024-04-07 17:44