
超10万亿Tokens的高质量数据集是怎么炼成的?专访中国电信天翼AI阮宜龙
超10万亿Tokens的高质量数据集是怎么炼成的?专访中国电信天翼AI阮宜龙正所谓“得数据者得天下”,这家央企算是把高质量数据集给玩明白了——超过10万亿tokens的通用大模型语料数据,以及覆盖14个关键行业的专业数据集,总存储量高达350TB!
来自主题: AI资讯
7054 点击 2025-09-26 10:59
正所谓“得数据者得天下”,这家央企算是把高质量数据集给玩明白了——超过10万亿tokens的通用大模型语料数据,以及覆盖14个关键行业的专业数据集,总存储量高达350TB!
超级智能体,央企出手了!