速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色
7264点击    2026-07-03 11:13

速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色


今天发现阿里刚刚把千问输入法做成了独立客户端,上线了 Mac 版本。


官网链接https://ime.qianwen.com/。


我第一时间下载体验了一遍。结果比我预期更有意思。


安装完成后,不需要登录,免费可用。


Mac 上按下右侧 Option 键,就能在任何应用里直接唤起语音输入。微信、钉钉、Word、浏览器、VS Code,都可以直接调用,不需要切换软件,也不需要打开某个 AI 对话框。


这其实是和过去 AI 产品最大的不同。


过去几年,大模型一直在努力争夺入口。大家都在做 App、做助手、做 Agent,希望用户主动打开自己。而输入法天然就在入口上。它距离用户最近。


我最先在微信里试了一圈。说一句话,文字几乎同步出现,识别速度很快。它还不只是简单转文字,而是在理解之后把口头表达里的停顿词、重复词、口水词被自动去掉,语句顺了一遍,标点也补好了。出来的内容基本可以直接发送。比如,我随口说了一句“就昨天那个采访的那个人不够,可能还得再找两个用户聊一下,嗯,再仔细聊聊看,看看他们实际怎么用的,具体的使用情况。”最终出来的是:“昨天那个采访的人不够,可能还得再找两个用户聊一下,仔细看看他们具体是怎么用的。“


速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色


速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色


为了刁难它,我故意用了比较重的山西方言说了一句:“明天上午一起去小区门口早餐店吃麻辣烫。”结果一次识别成功。没有出现方言转普通话时经常发生的错字和断句问题。


速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色


后来我又故意把句子说得更长一些。中间夹杂停顿、重复和自我纠正。最终输出的文字不仅识别正确,还会根据上下文自动修正部分表达,减少反复修改。比如我说马上要开的会议的一些情况,想到什么说什么,没有逻辑,千问输入法生成了这样,明天上午10 点项目汇报会:1. 材料打印 5 份(参会人 5 个)2. 会后会议纪要抄送全体成员3. 盘点表单独放附件,用 Excel 格式,别用 PDF


速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色


真正让我觉得有意思的是长内容处理能力。我自己平时做采访、写稿,经常会突然冒出一些灵感。于是我在钉钉上试着连续说了一长段选题思路,甚至没有用一二三四这样的结构化表达,这是顺口不断的说,用了很多然后。


速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色


结果,千问输入法居然自动帮我完成了分段、分点和逻辑整理,生成了下面的内容:


速递|千问输入法独立端Mac版本上线, 主打“说话即成稿”, AI自动润色


可以从中看到,出来的是一份已经整理好的结构化内容。基本可以直接发给同事。提示说单次最长支持十分钟连续输入。这意味着聊天、办公、会议记录、采访整理、灵感记录这些高频场景,都开始被重新定义。


另一个让我意外的细节,是场景理解能力。我在微信里使用的时候,它明显更偏日常表达。语气轻松,措辞自然,像真人聊天。切换到钉钉之后,同样一段话,风格马上变得正式,表达更职业化,甚至会主动优化部分工作场景里的措辞。


即便回到最传统的键盘输入场景,它也加入了不少 AI 能力。邻键误触、声母混淆、韵母漏打、拼音错误、编辑距离纠错等问题,都能自动修正。


从技术角度看,千问输入法本质上是在把千问大模型的能力嵌入操作系统级入口。它不再只是一个负责“打字”的输入法,而是让 AI 在输入的第一步就开始参与:语音识别之后,还会进行内容理解、语言优化、自动排版、场景适配和个性化表达。这也解决了传统输入法比较呆板的问题。过去,输入法更多是“你说什么,它写什么”,哪怕语句不通顺、口头禅很多、标点混乱,也会原封不动地输出。


换句话说,输入法开始从“输入工具”升级为“表达助手”。用户需要关注的是自己想表达什么,而不是纠结怎么组织语言、怎么断句、怎么补标点。这也是大模型进入操作系统入口后,带来的一个明显变化。


对于千问而言,这或许也是一个值得关注的新变化。


和聊天机器人、Agent不同,输入法是另一种完全不同的入口。它天然存在于每一次沟通、每一次记录、每一次创作过程中。当大模型进入输入法之后,争夺的已经不只是一个 App 的打开次数,而是用户几乎所有文字表达的起点。AI 不再需要等待用户主动打开,而是在表达发生的瞬间就参与其中。


从这个角度看,千问输入法未必只是一个输入法产品。它更像是千问进入操作系统、进入日常工作流、进入高频表达场景的一张新门票。谁能占据这个入口,谁就更有机会成为用户日常数字生活中最先被调用、也是最难被替代的 AI。


文章来自于微信公众号 “Z Potentials”,作者 “Z Potentials”

AI转型,免费服务,就找AITNT
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md