AI资讯新闻榜单内容搜索-千问

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 千问
华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印

华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印

华为 Pangu 员工自曝:盘古模型套壳、续训、洗水印

华为 Pangu 员工自曝盘古模型并非如内部宣称的是“从旧的135B参数继承改造而来”,而是直接套用阿里千问 1.5 110B 模型进行续训(通过加层、扩增FFN维度、添加PI机制凑参数)。作者指出:

来自主题: AI资讯
10426 点击    2025-07-07 09:58
换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:框架自动生成了五种不同教育范式的系统提示,最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型,评分从0.3920提升至0.4362。

来自主题: AI技术研报
7508 点击    2025-05-19 10:11
用微信聊天记录来做AI数字的你,开源了

用微信聊天记录来做AI数字的你,开源了

用微信聊天记录来做AI数字的你,开源了

数字生命最靠谱的项目底座。就在这几天一个项目火了,就是叫做weclone。总的来说基于微信聊天记录来生成你的数字分身,现在开源了整个项目的技术是使用python来完成的,并且支持阿里同义千问2.5,现在已经有8.7K收藏了。

来自主题: AI资讯
9007 点击    2025-05-17 09:33
“Qwen3之后,我才真正敢投AI应用”

“Qwen3之后,我才真正敢投AI应用”

“Qwen3之后,我才真正敢投AI应用”

2025年4月29日凌晨,距离通义千问Qwen3正式发布还有5小时,X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新,等待第一时间测试和体验这款备受期待的中国大模型新作。

来自主题: AI资讯
8752 点击    2025-05-01 13:57
为什么李飞飞团队经常cue通义千问?

为什么李飞飞团队经常cue通义千问?

为什么李飞飞团队经常cue通义千问?

Qwen 3还未发布,但已发布的Qwen系列含金量还在上升。2个月前,李飞飞团队基于Qwen2.5-32B-Instruct 模型,以不到50美元的成本训练出新模型 S1-32B,取得了与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型数学及编码能力相当的效果。如今,他们的视线再次投向了这个国产模型。

来自主题: AI资讯
8206 点击    2025-04-12 12:02
首个太阳大模型,金乌

首个太阳大模型,金乌

首个太阳大模型,金乌

太阳是地球生命繁衍的基础。

来自主题: AI资讯
10046 点击    2025-04-02 10:29
途牛“AI助手小牛”正式上线

途牛“AI助手小牛”正式上线

途牛“AI助手小牛”正式上线

4月1日,途牛旅游网自主研发的“AI助手小牛”旅游应用Agent正式上线途牛旅游APP、“AI助手小牛”小程序。“AI助手小牛”结合旅行垂直应用场景与开源大模型(DeepSeek、通义千问),实现了机票、酒店、火车票快捷查询、预订服务,能够为用户提供智能、专业的“0搭售"旅游服务方案。

来自主题: AI资讯
8628 点击    2025-04-02 09:33