AI资讯新闻榜单内容搜索-数据集

训出GPT-5短缺20万亿token！OpenAI被曝计划建「数据市场」

全网高质量数据集告急！OpenAI、Anthropic等AI公司正在开拓新方法，训练下一代AI模型。

来自主题: AI技术研报

4524 点击 2024-04-09 09:55

你的自拍和聊天记录，正被硅谷大厂砸数十亿美元疯抢！

2026年的数据荒越来越近，硅谷大厂们已经为AI训练数据抢疯了！它们纷纷豪掷十数亿美元，希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过，如果有一天AI忽然吐出了我们的自拍照或者隐私聊天，该怎么办？

来自主题: AI技术研报

7126 点击 2024-04-07 17:48

ICLR 2024 | 联邦学习后门攻击的模型关键层

联邦学习使多个参与方可以在数据隐私得到保护的情况下训练机器学习模型。但是由于服务器无法监控参与者在本地进行的训练过程，参与者可以篡改本地训练模型，从而对联邦学习的全局模型构成安全序隐患，如后门攻击。

来自主题: AI技术研报

4564 点击 2024-04-06 15:16

「有效上下文」提升20倍！DeepMind发布ReadAgent框架

模仿人类阅读过程，先分段摘要再回忆，谷歌新框架ReadAgent在三个长文档阅读理解数据集上取得了更强的性能，有效上下文提升了3-20倍。

来自主题: AI技术研报

7524 点击 2024-04-06 14:48

CVPR 2024满分论文｜英伟达开源大模型FoundationPose称霸BOP排行榜

FoundationPose模型使用RGBD图像对新颖物体进行姿态估计和跟踪，支持基于模型和无模型设置，在多个公共数据集上大幅优于针对每个任务专门化的现有方法.

来自主题: AI技术研报

6567 点击 2024-04-05 16:27

让智能体像孩子一样观察别人学习动作，跨视角技能学习数据集EgoExoLearn来了

在探索人工智能边界时，我们时常惊叹于人类孩童的学习能力 —— 可以轻易地将他人的动作映射到自己的视角，进而模仿并创新。当我们追求更高阶的人工智能的时候，无非是希望赋予机器这种与生俱来的天赋。

来自主题: AI技术研报

4031 点击 2024-04-05 15:37

山东工艺美术学院入选“北数所”首批100个AI大模型高质量训练数据集

3月29日，以“数据驱动，智绘未来”为主题的2024北京AI原生产业创新大会暨北京数据基础制度先行区成果发布会举办。会上，北京国际大数据交易所（以下简称“北数所”）牵头正式发布首批100个人工智能大模型高质量训练数据集，经联盟牵头推荐，中关村数字媒体产业联盟成员单位新华网、山东工艺美术学院、中国搜索、中文在线、北京服装学院、硅星人等院校、企业的高质量数据集入选。

来自主题: AI资讯

9012 点击 2024-04-05 11:17