
不接入DeepSeek的App不是好的智能体
不接入DeepSeek的App不是好的智能体广东打响了第一枪。深圳龙岗区的政务系统悄悄上线了DeepSeek-R1全尺寸模型,群众办事时面对的不再是机械的问答机器人,而是一个能理解“我想办落户,但社保断了3个月怎么办”这类复杂问题的AI公务员。东莞紧随其后,把DeepSeek塞进了人工智能大模型中心,号称要让“企业办证速度跑赢奶茶外卖”。更狠的是广州,直接祭出DeepSeek-R1和V3 671B双模型组合
广东打响了第一枪。深圳龙岗区的政务系统悄悄上线了DeepSeek-R1全尺寸模型,群众办事时面对的不再是机械的问答机器人,而是一个能理解“我想办落户,但社保断了3个月怎么办”这类复杂问题的AI公务员。东莞紧随其后,把DeepSeek塞进了人工智能大模型中心,号称要让“企业办证速度跑赢奶茶外卖”。更狠的是广州,直接祭出DeepSeek-R1和V3 671B双模型组合
近年来,多模态大模型(MLLM)在视觉理解领域突飞猛进,但如何让大语言模型(LLM)低成本掌握视觉生成能力仍是业界难题!
马上整整1个月了!这一个月以来,全球大模型市场受DeepSeek搅动,无不方寸大乱。中外大厂、初创公司都头好秃,全被追着问:你们对DeepSeek怎么看?DeepSeek出来你们怎么办?
北京时间2月16日,马斯克宣布,将于太平洋时间周一晚上8点(北京时间2月18日12:00)发布Grok 3大模型,届时将进行现场演示。马斯克称Grok 3有非常强大的推理能力,在测试中的表现超越包括DeepSeek在内的所有已发布的AI大模型模型。5G与6G公众号(ID:angmobile)注意到马斯克表示Grok 3的某些能力之强“让人感到可怕”。
时隔两年,Sydney又回来了!奥特曼官宣了GPT-4o更新后,网友测试发现,ChatGPT不仅「戏精」附体,甚至能深入人心,让人感动落泪。
5天发布5项领先,从此,人人都有了口袋里的健康专家——好伴AI。
问题挺严重,大模型说的话可不能全信。
必须不断地自我迭代,才能在这个时代存在。
蒸馏模型的性能可以量化估算了。
DeepSeek掀起的算力热潮还在持续。中国电信昨日宣布推出了息壤智算一体机-DeepSeek版,在硬件层面以华为昇腾芯片为基础,提供8卡、16卡、32卡等多种规格型号。此前,京东云也发布DeepSeek大模型一体机,支持华为昇腾、海光、寒武纪、摩尔线程、天数智芯等国产AI加速芯片。《科创板日报》了解到,华鲲振宇也推出了DeepSeek大模型一体机方案。