小米给智能家居做了个“大模型大脑”

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
小米给智能家居做了个“大模型大脑”
7556点击    2025-11-15 11:48

智能家居不够“智能”,怎么办?小米集团给出了智能家居未来探索方案Xiaomi Miloco


该方案基于大模型独特的开发范式,用户可以跟智能家居系统对话沟通,经过大模型的推理计算,自动完成家庭生活中的各类智能需求和规则


小米给智能家居做了个“大模型大脑”


随着人工智能技术的飞速发展,AI大模型在理解人类语言方面取得了显著进展,能够越来越贴合人们日常的交互需求。与AI大模型的优秀表现相比,当下智能家居行业体验却显得不那么“智能”。


目前,多数智能家居系统依赖预设规则引擎,用户必须手动配置诸如“温度>30℃开空调”等等诸多触发条件,使得整个智能家居交互过程显得既机械又繁琐。


如果能把大模型的能力接入进来,则会简单且智能很多。比如你直接说 “当我读书时,帮我打开台灯,播放舒缓的音乐”,系统在识别到读书动作时就会自动完成操作。


小米认为,AI代表未来方向,「大模型+智能家居」是行业大势所趋。


Miloco的出现,重构了家庭智能范式。


同时,Miloco还高度重视隐私安全问题,端侧部署大模型保障用户隐私不被侵犯。


目前,Miloco已面向全社会开放,并在GitHub上线(链接见文末),开发者可部署、体验,参与技术共建。


让智能家居“理解生活”


传统智能家居的体验瓶颈,本质源于“规则预设固化”与“生态协同不足”的双重制约。


用户需手动配置繁琐的自动化规则,且不同品牌设备间缺乏统一联动标准,最终不得不花费大量精力“适配系统”。


而Miloco的核心研发目标,是为家庭赋予一个能理解生活细节的“AI大脑”——


它可以保存你的“雨天关窗”“睡前调温”等场景偏好,能读懂“想睡个好觉”背后对温度、光线、噪音的综合需求,更能实现跨生态设备协作,在持续交互中优化体验,真正做到越用越贴心。


这种“懂生活”的能力,植根于Miloco对大模型技术的场景化落地。


作为智能家居未来探索方案,Miloco将自研大模型能力部署到家庭边缘设备。


结合米家摄像机的实时视觉信息,通过标准化的MCP协议封装,Miloco实现了米家生态与Home Assistant(全球最大开源智能家居社区)生态的无缝打通。


同时,Miloco也支持第三方IoT平台接入,让“用自然语言定义全屋智能”从概念走向实用。


小米大模型打底,四层技术架构


Miloco的全屋智能差异化体验,依托于Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型与四层完整架构的坚实支撑。


它从交互、感知、生态、安全四个维度优化全屋智能的交互逻辑与扩展能力,构建更贴合用户需求的智能家居解决方案。


核心支撑:Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型


作为Miloco智能体验的技术核心,Xiaomi MiMo-VL-Miloco-7B端侧视觉语言大模型为全屋智能赋予了“感知+理解”的核心能力,是实现场景化智能联动的关键所在。


Xiaomi MiMo-VL-Miloco端侧视觉语言模型,基于小米自研MiMo-VL-7B大模型优化构建,凭借强大的视觉-语言融合能力,赋予家庭摄像头“理解画面”的感知力。


它可以轻松实现全屋视觉问答,比如查询“看看画面里有什么”“看看我的猫在哪”;


还支持规则智能触发,比如当有人读书时打开台灯,或者当有人玩手机时发米家通知提醒;

小米给智能家居做了个“大模型大脑”


复杂的联动控制也不在话下,比如看看小孩有没有在玩手机?在玩手机的话音箱播放“该写作业了”;或者根据画面中人的心情状态去设置灯光颜色。


同时,该模型还能完成场景化动态推理,例如检测到当画面里面有人时,根据画面中人的穿衣风格来生成赞美文案,然后用智能音箱播报生成的赞美文案;或者当画面里有人在睡觉,根据画面中人是否盖被子来调整空调的温度。

小米给智能家居做了个“大模型大脑”


这一技术突破推动智能家居从“单一条件触发”的初级阶段,正式迈入“多维度场景感知”的高阶形态。


而这一核心能力的落地与延伸,均依赖于Miloco的四层完整架构体系。


四层完整架构,保障系统稳定与扩展潜力


从用户交互到硬件支撑,Miloco构建了全链路技术体系并实现全部开放——


开发者可修改和扩展体系中任何一层的能力,确保功能稳定落地与未来灵活扩展,更为“开放共创”预留出足以承载无限创意的充足空间。


小米给智能家居做了个“大模型大脑”


  • 用户层:负责用户与系统的交互,当前已支持WebUI交互方式,后续将规划App端接入,进一步降低使用门槛;
  • 应用层:作为系统“决策中枢”,承接用户层需求,负责能力调度、大模型管理、云端服务协同及MCP服务适配;
  • 能力平台层:提供信息源接入、设备控制、空间建模、存储记忆、多模态理解等底层能力,为上层应用提供技术支撑;
  • 硬件层:涵盖算力、存储、网络等基础硬件支持,确保端侧计算高效运行,保障数据处理的实时性与安全性。


Miloco的开放性打破了生态壁垒,开发者可借助其大模型能力,联动 Home Assistant以及第三方平台的设备,探索更具想象力的全屋智能场景。


同时,项目坚持“隐私安全优先”原则,所有视觉数据可在家庭端侧完成计算,不向外部服务器传输,从技术层面保障“家庭隐私不外流”,打消用户数据安全顾虑,真正实现“开放与安全兼顾”。


推动智能家居进入大模型时代


Miloco的发布,是小米将大模型技术落地家庭场景的重要实践,更是对智能家居体验升级的一次探索。


通过端侧大模型与全链路开放的结合,为行业提供了一种新的技术思路——让智能家居告别传统“硬编码规则”的局限,转向“对话式交互+视觉感知”的人机交互新形态。


这种新形态的核心,是从“人适应设备”到“设备适应人”的转变:用户无需学习复杂操作,可通过自然语言轻松设置自动化。


这种形态之下,设备不再是孤立的控制单元,而是能主动理解场景、协同工作的“生活辅助伙伴”。


未来,小米将持续迭代Miloco的技术能力,与全球开发者共同推动全屋智能行业向着更开放、更智能、更贴合用户需求的方向发展。


开源链接:https://github.com/XiaoMi/xiaomi-miloco


文章来自于微信公众号 “量子位”,作者 “量子位”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md