AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准

陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准

陈天桥旗下AI公司MiroMind打造全球顶尖预测型大模型,性能登顶行业基准

全球创新企业家、慈善家陈天桥旗下的 MiroMind 团队在这一 AI 未来大考中,连续第二周蝉联冠军。与专注文本输出的生成式模型不同,MiroMind 采用记忆驱动机制,专为预测与决策设计,旨在打造全球最好的预测大模型。

来自主题: AI资讯
6038 点击    2025-09-20 13:52
浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

2025年9月18日,由浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎教授团队联合华为技术有限公司计算产品线共同研发的国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型在“华为全联接大会2025”正式发布。

来自主题: AI技术研报
6371 点击    2025-09-20 13:05
让 llama.cpp 支持多模态向量模型

让 llama.cpp 支持多模态向量模型

让 llama.cpp 支持多模态向量模型

几周前,我们发布了 jina-embeddings-v4 模型的 GGUF 版本,大幅降低了显存占用,提升了运行效率。不过,受限于 llama.cpp 上游版本的运行时,当时的 GGUF 模型只能当作文本向量模型使用而无法支持多模态向量的输出。

来自主题: AI技术研报
7169 点击    2025-09-20 09:42
宝可梦游戏:下一代 AI 的训练场 | Kevin Lu, Thinking Machines

宝可梦游戏:下一代 AI 的训练场 | Kevin Lu, Thinking Machines

宝可梦游戏:下一代 AI 的训练场 | Kevin Lu, Thinking Machines

宝可梦游戏的开放世界、长周期、巨大行动空间和高难度特性,为训练能应对现实世界复杂性(如稀疏奖励、探索挑战)的AI提供了理想沙盒。对比AI的机械尝试和人类的“乐趣驱动”探索,文章阐释人类特有的好奇心美学对于科学发现的关键价值,并探讨AI赋能游戏设计(个性化体验、无限故事/行动空间)以优化人类乐趣的潜力。

来自主题: AI技术研报
7297 点击    2025-09-19 13:53
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花了200万

中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花了200万

中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花了200万

就在最新的Nature新刊中,DeepSeek一举成为首家登上《Nature》封面的中国大模型公司,创始人梁文锋担任通讯作者。纵观全球,之前也只有极少数如DeepMind者,凭借AlphaGo、AlphaFold有过类似荣誉。

来自主题: AI资讯
7936 点击    2025-09-18 16:35
B站出海的强有力支柱:最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

B站出海的强有力支柱:最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

B站出海的强有力支柱:最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

最近在 B 站上,你是否也刷到过一些 “魔性” 又神奇的 AI 视频?比如英文版《甄嬛传》、坦克飞天、曹操大战孙悟空…… 这些作品不仅完美复现了原角色的音色,连情感和韵律都做到了高度还原!更让人惊讶的是,它们居然全都是靠 AI 生成的!

来自主题: AI技术研报
5990 点击    2025-09-18 15:54
6.1B打平40B Dense模型,蚂蚁开源最新MoE模型Ling-flash-2.0

6.1B打平40B Dense模型,蚂蚁开源最新MoE模型Ling-flash-2.0

6.1B打平40B Dense模型,蚂蚁开源最新MoE模型Ling-flash-2.0

今天,蚂蚁百灵大模型团队正式开源其最新 MoE 大模型 ——Ling-flash-2.0。作为 Ling 2.0 架构系列的第三款模型,Ling-flash-2.0 以总参数 100B、激活仅 6.1B(non-embedding 激活 4.8B)的轻量级配置,在多个权威评测中展现出媲美甚至超越 40B 级别 Dense 模型和更大 MoE 模型的卓越性能。

来自主题: AI技术研报
7483 点击    2025-09-18 15:42
OneSearch,揭开快手电商搜索「一步到位」的秘技

OneSearch,揭开快手电商搜索「一步到位」的秘技

OneSearch,揭开快手电商搜索「一步到位」的秘技

还有一个多月,一年一度的“双十一”购物节就要来了! 作为消费者,你通常会如何寻找心仪的商品呢?或许你兴致勃勃地在搜索框里敲下关键词,却发现呈现出来的商品列表总是差强人意。那么,问题究竟出在哪里?

来自主题: AI技术研报
7139 点击    2025-09-18 15:27
腾讯AI Lab首创RL框架Parallel-R1,教大模型学会「并行思维」

腾讯AI Lab首创RL框架Parallel-R1,教大模型学会「并行思维」

腾讯AI Lab首创RL框架Parallel-R1,教大模型学会「并行思维」

自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后,如何让大模型掌握这种并行探索多种推理路径的能力,成为了学界关注的焦点。

来自主题: AI技术研报
6831 点击    2025-09-18 15:04