AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

大模型中,线性层的低比特量化已经逐步落地。然而,对于注意力模块,目前几乎各个模型都还在用高精度(例如 FP16 或 FP32)的注意力运算进行训练和推理。并且,随着大型模型需要处理的序列长度不断增加,Attention(注意力运算)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
9001 点击    2024-12-27 09:44
o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型

o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型

o3挑战ARC-AGI,遇见大网格就懵圈?英国工程师:ARC-AGI不适合大模型

o3在超难推理任务ARC-AGI上的成绩,属实给人类带来了不少震撼。 但有人专门研究了它不会做的题之后,有了更有趣的发现—— o3之所以不会做这些题,原因可能不是因为太难,而是题目的规模太大了。

来自主题: AI资讯
7432 点击    2024-12-26 15:49
2025年,中国AI的趋势与思考

2025年,中国AI的趋势与思考

2025年,中国AI的趋势与思考

两年前,ChatGPT横空出世,掀起一场超强的“AI旋风”;最近,OpenAI用连续12天的发布会再次让全球进入“AI狂欢”。但不同于两年前的震惊、兴奋与困惑,今天的学界和产业界对于AGI路线有了更多的“中国思考”。

来自主题: AI资讯
8343 点击    2024-12-25 09:19
Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

Meta、斯坦福等:AI的下一个前沿,正是陶哲轩说的形式化数学推理

对 AI 研究者来说,数学既是一类难题,也是一个标杆,能够成为衡量 AI 技术的发展重要尺度。近段时间,随着 AI 推理能力的提升,使用 AI 来证明数学问题已经成为一个重要的研究探索方向。

来自主题: AI技术研报
8059 点击    2024-12-24 15:37
行人、车辆、动物等ReID最新综述!武大等全面总结Transformer方法 | IJCV 2024

行人、车辆、动物等ReID最新综述!武大等全面总结Transformer方法 | IJCV 2024

行人、车辆、动物等ReID最新综述!武大等全面总结Transformer方法 | IJCV 2024

研究人员对基于Transformer的Re-ID研究进行了全面回顾和深入分析,将现有工作分类为图像/视频Re-ID、数据/标注受限的Re-ID、跨模态Re-ID以及特殊Re-ID场景,提出了Transformer基线UntransReID,设计动物Re-ID的标准化基准测试,为未来Re-ID研究提供新手册。

来自主题: AI技术研报
6171 点击    2024-12-24 15:22
GPT - 5 卡壳了。。。

GPT - 5 卡壳了。。。

GPT - 5 卡壳了。。。

OpenAI 代号为 Orion 的新 AI 项目遇到了一个又一个问题。

来自主题: AI资讯
9099 点击    2024-12-24 10:01
LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破

LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破

LeCun八年前神预言,大模型路线再颠覆?OpenAI宣告:强化学习取得稳定性突破

只需几十个样本即可训练专家模型,强化微调RLF能掀起强化学习热潮吗?具体技术实现尚不清楚,AI2此前开源的RLVR或许在技术思路上存在相似之处。

来自主题: AI资讯
9150 点击    2024-12-23 15:58
时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

时序预测再出新范式!华东师大提出DUET:「双向聚类」新设计,性能刷新SOTA!| KDD 2025

研究团队在最新时间序列预测基准评测TFB的25个数据集上进行了广泛验证,证明了DUET的卓越性能,为各行业的时间序列预测任务提供了全新的解决方案。

来自主题: AI技术研报
7283 点击    2024-12-23 15:44
某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

某机构:JSON 输出会让 AI 变笨!大佬:是你们太菜了

近期,知名研究机构 Appier AI Research 和国立台湾大学,联合发表了一篇论文

来自主题: AI技术研报
7592 点击    2024-12-23 15:31