面向大模型的边缘端AI推理芯片
面向大模型的边缘端AI推理芯片
面向大模型的边缘端AI推理芯片
半导体芯片专用设备(退火炉、等离子去胶机等)软件开发框架
聚酯生产装置DCS系统智能化控制
多模态融合交互大模型
极低码率复杂环境数字复刻技术
智融创新工程的技术研发
人工石墨的纯度问题
开发能够精确控制剂量的技术,同时结合新型剂型开发、生物标志物检测等药物输送技术,提高药物的靶向性和疗效。建立结合传统中医药理论与现代科学技术儿童中药研发体系,同时以儿童疾病治疗为导向,依托人工智能、信息学以及网络药理学研发基础,进行产学研转化一体化布局。
人工智能+新材料”设计平台的核心应用正在多个关键领域发挥重要作用,推动着材料性能的优化与制造工艺的革新
当前,AI在SoC芯片设计领域的应用正逐步深化,凭借其在数据分析、模式识别、自动优化等方面的优势,在规范SoC芯片设计的技术范式方面发挥越来越重要的作用。
通过集成先进的AI技术,实现环保管理的智能化和自动化,提高管理效率
提供人工智能领域的网络安全产品解决方案。如图像识别、语种翻译等
1、智能视频分析服务器识别多场景多种异常行为的实时分析并实时报警2、识别的异常行为:打砸ATM机、烟火检测、拉扯抢夺识别、人员摔倒识别、舱内人员行为异常、违规加装识别、ATM设备被破坏识别、面部遮挡识别
当前动画制作(尤其是大型场景)面临效率与质量的双重挑战。传统手工制作复杂场景耗时耗力,而现有AI工具虽能生成基础资产,但在风格一致性、视觉保真度和大规模可控生成方面存在明显短板。例如: 生成内容不稳定:AI生成的资产常出现细节不一致(如衣物褶皱、光影跳跃),需人工反复修正。《哪吒2》中12%的特效镜头因物理失真需人工修复,额外成本达2300万元。 风格统一性难保障:不同批次生成的资产色彩、笔触差异显著,艺术家需大量二次调整,拖慢整体流程。 大规模场景构建效率低:手工创建超大世界细节(如森林植被、城市建筑)成本极高,而现有AI工具缺乏宏观布局与细节生成的协同能力。 因此,亟需开发一套集成AI程序化内容生成(PCG)与实时渲染的动画管线,实现从文本、草图到高质量风格化资产的端到端生成,同时确保视觉质量与艺术风格的高度统一。
当前AI在电影领域的应用多集中于剧本分析、特效生成等单点环节(如AI剪辑工具可自动生成字幕、配乐和转场),但无法实现完整影片的连贯创作。现有技术瓶颈主要体现在三方面: 意图理解障碍:AI难以解析导演的抽象创意(如“孤独中的自由感”),缺乏将情感转化为视觉语言的能力。例如,全球首部AI长片《海上女王郑一嫂》的团队指出,AI生成的分镜头剧本“缺乏创意且传统”,无法捕捉艺术表达的精髓。 叙事连贯性不足:生成视频时易出现角色形象漂移、场景逻辑断裂等问题。例如,现有模型如Sora、Runway仅能生成短片段,长视频中角色一致性低于70%。 风格统一性缺失:AI难以学习并保持导演的个性化视觉风格(如色彩搭配、镜头运动),导致作品风格碎片化。 因此,亟需开发一套端到端的智能导演AI系统,能够理解导演意图、规划叙事逻辑、生成风格统一的连贯影片,实现从“工具”到“创作伙伴”的跨越。
致力于将AI技术深度融入陶瓷制造的核心环节,旨在通过智能化手段提升生产效率、优化烧制工艺,并实现全自动化生产线的实时智能调整。同时,公司希望通过AI质检系统的建设,精准定位生产过程中的问题源头,进一步提高产品质量和生产效益。
旨在通过生理-心理多模态诊断与疗愈方案,满足囚犯、军人、老年人等特殊人群的健康管理需求,填补市场空白,提升司法及健康管理水平。
1、希望解决的主要技术问题: 多模态融合交互大模型通过多种硬件设备(包括话筒、眼动追踪仪、手势传感器等)采集多模态数据(包括声音、文本、明动、手势等),通过多模态大模型实现复杂车载环境下的用户意图理解与响应。 2、需求提出背景及主要应用领域方向: 在面向复杂环境无人车操控方面,多模态人机交互技术支持语音、按键、触屏、手势、视线等多种交互方式,通过多种交耳方式融合,能多维提取用户交互意图,利用各通道优势互补,弥补单通道识别准确率和交互效率不高的问题,也能平衡感官通道之间的使用负担,减轻无人车操控人员的认知负担,使其能够投入更多注意力到决策中。可部署在有人车或单人便携使用,具备对无人车通用化操控能力,有较强的实用性和推广性。 3、技术难点: (1)多模态融合交互的准确性需达到 95%以上; (2)具备声纹识别功能,识别准确率达到 90%以上; (2)需具备对用户自然交互意图的分析与理解能力; (3)适配国产化智能计算平台,完成本地化部署。 4、对主要技术指标、成本、周期等有关要求: 主要技术指标: ①具备语义理解功能,可对用户视觉注意力区域的视频图像信息进行语义分析,理解视觉场景的结构化关系; ②具备知识库检索与更新功能,可对文档、规则、协议、操作习惯等知识库进行检索,并可根据用户输入,动态更新知识库; ③具备自然语音识别和结构化语音指令识别功能,其中自然语音识别准确率≥90%,结构化指令识别准确率≥95%,语音识别延时≤0.5秒; ④具备语音合成功能,支持将文字信息转换为自然流畅的语音输出,语音合成模型支持以汉语为主并混合英语短语的跨语言合成,支持合成音色、语速设置。 ⑤具备多模态融合交互功能,实现语音、手势、眼动、头动等多模态交互指令的融合,生成格式化的指令或文本消息; ⑥具有用户意图理解功能,可根据声音、文本、眼动、手势等交互输入推理用户操作意图,理解用户下达的模糊指令,生成格式化的指令或文本消息; ⑦具备操作推荐功能,为用户提供多样化可选操作推荐,简化用户操作流程; ⑧用户多模态融合交互意图识别准确率≥95%; ⑨ 多模态融合交互意图识别延时≤1秒。