AI资讯新闻榜单内容搜索-模型训练

“从头开始训练模型，几乎没有意义”

构建支持和增强人类能力的AI工具，而不是试图完全取代人类。

来自主题: AI资讯

8095 点击 2024-08-23 09:44

搜索图片有新招了！北大袁粒课题组提出图像检索新方法，输入草图or艺术or低分辨率 | ECCV 2024

从一大堆图片中精准找图，有新招了！论文已经中了ECCV 2024。

来自主题: AI技术研报

7703 点击 2024-08-22 16:49

多亏Transformer，Mamba更强了！仅用1%计算量达新SOTA

Attention is all you need.

来自主题: AI技术研报

11255 点击 2024-08-22 16:44

Emory提出最新PolygonGNN框架：可捕捉通用多边形内外的空间关系 | KDD 2024

PolygonGNN是一种新型框架，用于学习包括单一和多重多边形在内的多边形几何体的表征，它通过异质可见图来捕捉多边形内外的空间关系，并利用图神经网络有效处理这些关系，以提高计算效率和泛化能力。该框架在五个数据集上表现出色，证明了其在捕捉多边形几何体有用表征方面的有效性。

来自主题: AI技术研报

7291 点击 2024-08-21 18:27

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

10634 点击 2024-08-21 14:20

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

本期我们邀请到了纽约大学计算机科学院博士童晟邦带来【多模态大模型：视觉为中心的探索】的主题分享。

来自主题: AI技术研报

12706 点击 2024-08-21 10:39

清华联合智谱AI重磅发布：中文10000字长文写作模型和提示词技术，或将改变行业

虽然大语言模型(LLM)的能力不断突破，但在长文生成方面却一直存在瓶颈。近日，清华大学和智谱AI联合发布的最新研究成果，为解决这一难题提供了创新方案。这项名为"LongWriter"的技术，成功将AI模型的长文生成能力从约2000字提升至10000字以上，同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准，为AI长文创作开辟了新天地。

来自主题: AI资讯

8865 点击 2024-08-20 15:05