AI资讯新闻榜单内容搜索-大模型训练

三篇论文解决「语义分割的优化和评估」难题！鲁汶/清华/牛津等联合提出全新方法

现有的语义分割技术在评估指标、损失函数等设计上都存在缺陷，研究人员针对相关缺陷设计了全新的损失函数、评估指标和基准，在多个应用场景下展现了更高的准确性和校准性。

来自主题: AI技术研报

3959 点击 2024-02-06 14:47

最近，谷歌的一篇论文在 X 等社交媒体平台上引发了一些争议。

来自主题: AI技术研报

9037 点击 2024-02-05 14:33

来自UCLA的华人团队提出一种全新的LLM自我对弈系统，能够让LLM自我合成数据，自我微调提升性能，甚至超过了用GPT-4作为专家模型指导的效果。

来自主题: AI技术研报

7946 点击 2024-02-02 17:27

不用图像，只用文本就能训练出视觉概念表征？用写代码的方式读懂画面，形状、物体、场景都能懂！

来自主题: AI技术研报

6275 点击 2024-01-31 11:15

使用LLM生成海量任务的文本数据，无需人工标注即可大幅提升文本嵌入的适用度，只需1000训练步即可轻松扩展到100种语言。

来自主题: AI技术研报

9142 点击 2024-01-29 16:40

在认知科学领域，人类通过持续学习改变认知的过程被称为认知迭代（Cognitive Dynamics）。形象地说，认知迭代就像是我们大脑的「软件更新」过程，手机应用通过不断的更新来修复 bug 和增加新功能，我们的大脑也通过不断学习新知识、经验，来改善和优化思考方式。

来自主题: AI技术研报

9578 点击 2024-01-29 12:45

美国计划限制中国客户使用美国云计算厂商的服务训练AI大模型，对中国人工智能产业造成潜在破坏。本文分析了中国科技行业追赶的三个因素。

来自主题: AI资讯

5190 点击 2024-01-29 10:12

如果语言模型是巫师，代码预训练就是魔杖！

来自主题: AI技术研报

8459 点击 2024-01-28 18:36

想要AI生成更长的视频？现在，有人提出了一个效果很不错的免调优方法，直接就能作用于预训练好的视频扩散模型。

来自主题: AI资讯

10621 点击 2024-01-25 15:02

本文对思维链的推理步长进行了控制变量实验，发现推理步长和答案的准确性是线性相关的，这种影响机制甚至超越了问题本身所产生的差异。

来自主题: AI技术研报

3775 点击 2024-01-25 13:53