AI资讯新闻榜单内容搜索-数据集

万亿token！史上最大多模态数据集诞生

开源多模态大模型或将开始腾飞。

来自主题: AI技术研报

7066 点击 2024-07-27 19:29

牛津剑桥的9次投毒导致模型崩溃的论文，已经遭到了诸多吐槽：这也能上Nature？学术圈则对此进行了进一步讨论，大家的观点殊途同归：合成数据被很多人视为灵丹妙药，但天下没有免费的午餐。

来自主题: AI技术研报

5384 点击 2024-07-27 17:38

伴随着人工智能的高速发展，用户或创作者与平台间围绕AI侵权的纠纷时有发生。

来自主题: AI资讯

9144 点击 2024-07-27 14:07

苹果最新杀入开源大模型战场，而且比其他公司更开放。推出7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。大模型，AI，苹果AI，苹果开源模型

来自主题: AI资讯

7685 点击 2024-07-23 00:14

小模型成趋势？

来自主题: AI技术研报

10059 点击 2024-07-21 14:19

近日，《连线》杂志联合ProofNews联合发表一篇调查文章，指责苹果、Anthropic等科技巨头未经许可使用YouTube视频训练AI模型。但训练数据的使用边界究竟在哪里？创作者、大公司和开发者正在陷入知识产权的罗生门……

来自主题: AI资讯

9954 点击 2024-07-19 12:21

自从 Devin（首个全自动 AI 软件工程师）提出以来，针对软件工程的 AI Agent 的设计成为研究的焦点，越来越多基于 Agent 的 AI 自动软件工程师被提出，并在 SWE-bench 数据集上取得了不俗的表现、自动修复了许多真实的 GitHub issue。

来自主题: AI技术研报

2738 点击 2024-07-15 14:06

来自微软、MIT等机构的学者提出了一种创新的训练范式，攻破了大模型的推理缺陷。他们通过因果模型构建数据集，直接教模型学习公理，结果只有67M参数的微型Transformer竟能媲美GPT-4的推理能力。

来自主题: AI技术研报

8851 点击 2024-07-14 13:52

生成式 AI 碰撞上自动驾驶技术，会产生怎样的火花？过去，生成式 AI 在业界已经被用来解决自动驾驶的长尾问题。目前，学界开始尝试在算法仿真领域引入多 Agent 数据集来增强仿真的效果。

来自主题: AI资讯

5032 点击 2024-07-14 11:05

6月，IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文，数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限，让我们能够对模型做出进一步改进，并逐渐了解使用ChatGPT写代码的最佳姿势。

来自主题: AI技术研报

4816 点击 2024-07-09 00:54