AI资讯新闻榜单内容搜索-模型训练

图神经网络加持，突破传统推荐系统局限！北大港大联合提出SelfGNN：有效降低信息过载与数据噪声影响

SelfGNN框架结合了图神经网络和个性化自增强学习，能够捕捉用户行为的多时间尺度模式，降低噪声影响，提升推荐系统鲁棒性。

来自主题: AI技术研报

7246 点击 2024-07-09 16:12

Anthropic首席执行官表示，当前AI模型训练成本是10亿美元，未来三年，这个数字可能会上升到100亿美元甚至1000亿美元。要知道，GPT-4o这个曾经最大的模型也只用了1亿美元。千亿美刀，究竟花在了哪里？

来自主题: AI资讯

9935 点击 2024-07-09 01:10

给大模型加上第三种记忆格式，把宝贵的参数从死记硬背知识中解放出来！

来自主题: AI技术研报

7909 点击 2024-07-09 00:24

大模型产业发展，需要可信中立的数据深加工平台，如何填补空白？

来自主题: AI资讯

10446 点击 2024-07-07 16:10

在训练大型语言模型（LLM）时，Adam(W) 基本上已经成为了人们默认使用的优化器。

来自主题: AI技术研报

9783 点击 2024-07-06 19:01

一转眼，2024 年已经过半。我们不难发现，AI 尤其是 AIGC 领域出现一个越来越明显的趋势：文生图赛道进入到了稳步推进、加速商业落地的阶段，但同时仅生成静态图像已经无法满足人们对生成式 AI 能力的期待，对动态视频的创作需求前所未有的高涨。

来自主题: AI资讯

11018 点击 2024-07-06 18:56

近日，来自谷歌DeepMind的研究人员，推出了专门用于评估大语言模型时间推理能力的基准测试——Test of Time（ToT），从两个独立的维度分别考察了LLM的时间理解和算术能力。

来自主题: AI技术研报

10262 点击 2024-07-05 16:35

大模型当上福尔摩斯，学会对视频异常进行检测了。来自华中科技大学、百度、密歇根大学的研究团队，提出了一种可解释性的视频异常检测框架，名为Holmes-VAD。

来自主题: AI技术研报

8280 点击 2024-07-05 01:04

苍蝇再小也是肉，聚沙成塔。

来自主题: AI资讯

6144 点击 2024-07-03 14:23

当前大语言模型（LLM）的评估方法受到数据污染问题的影响，导致评估结果被高估，无法准确反映模型的真实能力。北京大学等提出的KIEval框架，通过知识基础的交互式评估，克服了数据污染的影响，更全面地评估了模型在知识理解和应用方面的能力。

来自主题: AI技术研报

6128 点击 2024-07-02 18:25