AI资讯新闻榜单内容搜索-数据集

MPDS：提升电影海报生成效率的新型数据集

MPDS（Movie Posters Dataset）是一个创新的电影海报数据集，旨在解决现有图像生成模型在制作电影海报时面临的挑战。

来自主题: AI技术研报

11980 点击 2024-11-02 17:21

新视角设计下一代时序基础模型，Salesforce推出Moirai-MoE

自去年底以来，时序预测领域正在经历重大转型，从传统的「单一数据集训练单一模型」的模式逐步转向「通用预测基础模型」。

来自主题: AI技术研报

5566 点击 2024-10-31 15:11

大规模、动态「语音增强/分离」新基准！清华发布移动音源仿真平台SonicSim，含950+小时训练数据

清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持，有效降低了数据采集成本，实验证明这些工具能有效提升模型在真实环境中的性能。

来自主题: AI技术研报

5252 点击 2024-10-31 14:41

国产最强语音大模型诞生，MaskGCT宣布开源，声音效果媲美人类

近期，港中大（深圳）联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练，展现出超自然的语音克隆、风格迁移以及跨语言生成能力，同时保持了较强的稳定性。MaskGCT 已在香港中文大学（深圳）与上海人工智能实验室联合开发的开源系统 Amphion 发布。

来自主题: AI技术研报

5974 点击 2024-10-30 13:57

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-Reasoner

TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明，TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上，相较于现有方法具有显著的性能优势。

来自主题: AI技术研报

7008 点击 2024-10-28 18:30

开源模型突破原生多模态大模型性能瓶颈，上海AI Lab代季峰团队出品

原生多模态大模型性能瓶颈，迎来新突破！上海AI Lab代季峰老师团队，提出了全新的原生多模态大模型Mono-InternVL。与非原生模型相比，该模型首个单词延迟最多降低67%，在多个评测数据集上均达到了SOTA水准。

来自主题: AI技术研报

6699 点击 2024-10-25 15:37

arXiv和Hugging Face梦幻联动，一个按钮直达论文、模型、数据集

「这才是开放研究该有的样子。」经常刷 arXiv 的同学，你有没有发现页面上多了个新功能？这个新功能（图中的「Hugging Face」按钮）隐藏在「Code, Data, Media」选项卡下，选中之后就可以直达相关的 Hugging Face 论文、模型和数据集。

来自主题: AI技术研报

4697 点击 2024-10-25 14:22

全球首次！时序大模型突破十亿参数，华人团队发布Time-MoE，预训练数据达3000亿个时间点

Time-MoE采用了创新的混合专家架构，能以较低的计算成本实现高精度预测。研发团队还发布了Time-300B数据集，为时序分析提供了丰富的训练资源，为各行各业的时间序列预测任务带来了新的解决方案。

来自主题: AI技术研报

6293 点击 2024-10-23 13:40

突破视频多模态大模型瓶颈！「合成数据」立大功，项目已开源

视频多模态大模型（LMMs）的发展受限于从网络获取大量高质量视频数据。为解决这一问题，我们提出了一种替代方法，创建一个专为视频指令跟随任务设计的高质量合成数据集，名为 LLaVA-Video-178K。

来自主题: AI技术研报

5565 点击 2024-10-21 14:33

大模型引领6G革命！最新综述探索「未来通信方式」：九大方向，覆盖多模态、RAG等

大语言模型（LLM）正在推动通信行业向智能化转型，在自动生成网络配置、优化网络管理和预测网络流量等方面展现出巨大潜力。未来，LLM在电信领域的应用将需要克服数据集构建、模型部署和提示工程等挑战，并探索多模态集成、增强机器学习算法和经济高效的模型压缩技术。

来自主题: AI技术研报

5948 点击 2024-10-18 13:40