AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
“从头开始训练模型,几乎没有意义”

“从头开始训练模型,几乎没有意义”

“从头开始训练模型,几乎没有意义”

构建支持和增强人类能力的AI工具,而不是试图完全取代人类。

来自主题: AI资讯
7830 点击    2024-08-23 09:44
Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

Emory提出最新PolygonGNN框架:可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架,用于学习包括单一和多重多边形在内的多边形几何体的表征,它通过异质可见图来捕捉多边形内外的空间关系,并利用图神经网络有效处理这些关系,以提高计算效率和泛化能力。该框架在五个数据集上表现出色,证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报
6781 点击    2024-08-21 18:27
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频

现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报
10291 点击    2024-08-21 14:20
清华联合智谱AI重磅发布:中文10000字长文写作模型和提示词技术,或将改变行业

清华联合智谱AI重磅发布:中文10000字长文写作模型和提示词技术,或将改变行业

清华联合智谱AI重磅发布:中文10000字长文写作模型和提示词技术,或将改变行业

虽然大语言模型(LLM)的能力不断突破,但在长文生成方面却一直存在瓶颈。近日,清华大学和智谱AI联合发布的最新研究成果,为解决这一难题提供了创新方案。这项名为"LongWriter"的技术,成功将AI模型的长文生成能力从约2000字提升至10000字以上,同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准,为AI长文创作开辟了新天地。

来自主题: AI资讯
8134 点击    2024-08-20 15:05
AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%

AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%

AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%

AI掌握自我设计的权力,将会怎样?最近,来自UBC等机构研究人员提出了「智能体自动化设计」系统,让元智能体使用搜索算法,自动构建强大的同类。

来自主题: AI技术研报
10630 点击    2024-08-20 14:47
浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

作为基础的视觉语言任务,指代表达理解(referring expression comprehension, REC)根据自然语言描述来定位图中被指代的目标。REC 模型通常由三部分组成:视觉编码器、文本编码器和跨模态交互,分别用于提取视觉特征、文本特征和跨模态特征特征交互与增强。

来自主题: AI技术研报
6711 点击    2024-08-20 14:36