AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

谷歌又放大招了,发布下一代 Transformer 模型 Infini-Transformer。

来自主题: AI技术研报
10605 点击    2024-04-13 16:44
MIT等首次深度研究「集成LLM」预测能力:可媲美人类群体准确率

MIT等首次深度研究「集成LLM」预测能力:可媲美人类群体准确率

MIT等首次深度研究「集成LLM」预测能力:可媲美人类群体准确率

在实践中,人类预测的准确性依赖于「群体智慧」(wisdom of the crowd)效应,即通过聚集一群个体预测者,对未来事件的预测准确率会显著提高

来自主题: AI资讯
7070 点击    2024-04-13 14:53
“梗王”大模型,靠讲笑话登上CVPR | 中山大学

“梗王”大模型,靠讲笑话登上CVPR | 中山大学

“梗王”大模型,靠讲笑话登上CVPR | 中山大学

谁能想到,只是让大模型讲笑话,论文竟入选了顶会CVPR!

来自主题: AI资讯
10426 点击    2024-04-11 17:20
ZOMI酱:从艺术生到大模型训练专家

ZOMI酱:从艺术生到大模型训练专家

ZOMI酱:从艺术生到大模型训练专家

技术阿甘在不停奔跑。

来自主题: AI资讯
9198 点击    2024-04-11 16:15
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

纯C语言训练GPT,1000行代码搞定!,不用现成的深度学习框架,纯手搓。 发布仅几个小时,已经揽星2.3k。

来自主题: AI资讯
8023 点击    2024-04-11 10:18
Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

近日,朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验(50,000 条任务,总计 4,200,000 GPU 小时)总结了 12 条定律,为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯
6514 点击    2024-04-10 19:11
7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

7B超越百亿级,北大开源aiXcoder-7B最强代码大模型,企业部署最佳选择

对代码大模型而言,比能做编程题更重要的,是看是能不能适用于企业级项目开发,是看在实际软件开发场景中用得顺不顺手、成本高不高、能否精准契合业务需求,后者才是开发者关心的硬实力。

来自主题: AI资讯
7518 点击    2024-04-10 17:50
杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

在社交活动中,大语言模型既可以是你的合作伙伴(partner),也可以成为你的导师(mentor)。在人类的社交活动中,为了更有效地在工作和生活中与他人沟通,需要一定的社交技能,比如解决冲突。

来自主题: AI技术研报
7913 点击    2024-04-09 16:16