AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。

来自主题: AI技术研报
4275 点击    2024-04-09 16:10
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。

来自主题: AI技术研报
7085 点击    2024-04-09 15:14
低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

EdgeNet可以处理从干净的自然图像或嘈杂的对抗性图像中提取的边缘,产生鲁棒的特征,具有轻量级、即插即用等特点,能够无缝集成到现有的预训练深度网络中,训练成本低。

来自主题: AI资讯
11304 点击    2024-04-08 16:17
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各个领域的实用性和灵活性,也为更多视觉场景下的应用探索了新的道路。

来自主题: AI技术研报
6224 点击    2024-04-08 15:49
无需训练,这个新方法实现了生成图像尺寸、分辨率自由

无需训练,这个新方法实现了生成图像尺寸、分辨率自由

无需训练,这个新方法实现了生成图像尺寸、分辨率自由

近日,来自香港中文大学 - 商汤科技联合实验室等机构的研究者们提出了FouriScale,该方法在利用预训练扩散模型生成高分辨率图像方面取得了显著提升。

来自主题: AI技术研报
8388 点击    2024-04-08 15:41
北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

北大&火山引擎夺冠!CLIC视频压缩挑战赛结果公布,中国团队表现亮眼

随着以深度学习为代表的新一代人工智能技术不断取得突破,学术界与工业界逐渐意识到人工智能技术在图像、视频压缩领域的巨大应用潜力。

来自主题: AI资讯
6865 点击    2024-04-08 15:16
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了!它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的自拍照或者隐私聊天,该怎么办?

来自主题: AI技术研报
7902 点击    2024-04-07 17:48
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD

GPT-4V 的推出引爆了多模态大模型的研究。GPT-4V 在包括多模态问答、推理、交互在内的多个领域都展现了出色的能力,成为如今最领先的多模态大模型。

来自主题: AI技术研报
5976 点击    2024-04-07 17:46
ICLR 2024 | 联邦学习后门攻击的模型关键层

ICLR 2024 | 联邦学习后门攻击的模型关键层

ICLR 2024 | 联邦学习后门攻击的模型关键层

联邦学习使多个参与方可以在数据隐私得到保护的情况下训练机器学习模型。但是由于服务器无法监控参与者在本地进行的训练过程,参与者可以篡改本地训练模型,从而对联邦学习的全局模型构成安全序隐患,如后门攻击。

来自主题: AI技术研报
5878 点击    2024-04-06 15:16
「有效上下文」提升20倍!DeepMind发布ReadAgent框架

「有效上下文」提升20倍!DeepMind发布ReadAgent框架

「有效上下文」提升20倍!DeepMind发布ReadAgent框架

模仿人类阅读过程,先分段摘要再回忆,谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能,有效上下文提升了3-20倍。

来自主题: AI技术研报
8551 点击    2024-04-06 14:48