AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
“梗王”大模型,靠讲笑话登上CVPR | 中山大学

“梗王”大模型,靠讲笑话登上CVPR | 中山大学

“梗王”大模型,靠讲笑话登上CVPR | 中山大学

谁能想到,只是让大模型讲笑话,论文竟入选了顶会CVPR!

来自主题: AI资讯
10174 点击    2024-04-11 17:20
ZOMI酱:从艺术生到大模型训练专家

ZOMI酱:从艺术生到大模型训练专家

ZOMI酱:从艺术生到大模型训练专家

技术阿甘在不停奔跑。

来自主题: AI资讯
8953 点击    2024-04-11 16:15
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。

来自主题: AI资讯
7550 点击    2024-04-11 10:18
Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

近日,朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验(50,000 条任务,总计 4,200,000 GPU 小时)总结了 12 条定律,为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯
5964 点击    2024-04-10 19:11
7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

对代码大模型而言,比能做编程题更重要的,是看是能不能适用于企业级项目开发,是看在实际软件开发场景中用得顺不顺手、成本高不高、能否精准契合业务需求,后者才是开发者关心的硬实力。

来自主题: AI资讯
6986 点击    2024-04-10 17:50
杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

在社交活动中,大语言模型既可以是你的合作伙伴(partner),也可以成为你的导师(mentor)。在人类的社交活动中,为了更有效地在工作和生活中与他人沟通,需要一定的社交技能,比如解决冲突。

来自主题: AI技术研报
7448 点击    2024-04-09 16:16
纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

「Real men program in C.」 众所周知,大语言模型还在快速发展,应该有很多可以优化的地方。我用纯 C 语言来写,是不是能优化一大截? 也许很多人开过这样的脑洞,现在有大佬实现了。

来自主题: AI技术研报
3807 点击    2024-04-09 16:10
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。

来自主题: AI技术研报
6652 点击    2024-04-09 15:14
低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法

EdgeNet可以处理从干净的自然图像或嘈杂的对抗性图像中提取的边缘,产生鲁棒的特征,具有轻量级、即插即用等特点,能够无缝集成到现有的预训练深度网络中,训练成本低。

来自主题: AI资讯
10882 点击    2024-04-08 16:17
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态大模型在各个领域的实用性和灵活性,也为更多视觉场景下的应用探索了新的道路。

来自主题: AI技术研报
5929 点击    2024-04-08 15:49