AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳

偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳

偏微分方程有了基础模型:样本需求数量级减少,14项任务表现最佳

偏微分方程(PDEs)被称为物理学的语言,因为它们可以在广泛的时间 - 空间尺度上对各种各样的物理现象进行数学建模。常用的有限差分、有限元等数值方法通常用于近似或模拟偏微分方程。

来自主题: AI技术研报
9054 点击    2024-06-10 14:59
谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

谷歌开源TimesFM:1000亿个时间点训练,入选ICML 2024

在大语言模型突飞猛进的同时,谷歌的研究团队在时序预测方面也取得了突破性的成果——今年2月发表的模型TimesFM,而且放出了模型的代码和权重,让更多开发者体验这种「开箱即用」的零样本预测能力。

来自主题: AI资讯
9833 点击    2024-06-10 14:40
「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

近日,来自密歇根大学的研究人员,开发了一款人工智能工具,可以区分不同含义的狗叫声,并识别狗的年龄、性别和品种。

来自主题: AI资讯
9177 点击    2024-06-10 14:35
FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集

FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集

FineWeb技术报告出炉!揭秘HuggingFace规模最大、质量最高预训练数据集

从大规模网络爬取、精细过滤到去重技术,通过FineWeb的技术报告探索如何打造高质量数据集,为大型语言模型(LLM)预训练提供更优质的性能。

来自主题: AI资讯
10139 点击    2024-06-09 18:06
Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法,用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!

来自主题: AI技术研报
9853 点击    2024-06-08 20:15
轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

轻松构建聊天机器人、准确性新SOTA,RAG有了更强大的AI检索器

检索增强生成 (RAG) 是将检索模型与生成模型结合起来,以提高生成内容的质量和相关性的一种有效的方法。RAG 的核心思想是利用大量文档或知识库来获取相关信息。各种工具支持 RAG,包括 Langchain 和 LlamaIndex。

来自主题: AI技术研报
11146 点击    2024-06-08 15:45