
华为又开源了个大的:超大规模MoE推理秘籍
华为又开源了个大的:超大规模MoE推理秘籍超大规模MoE模型(如DeepSeek),到底该怎么推理才能做到又快又稳。现在,这个问题似乎已经有了标准答案——华为一个新项目,直接把推理超大规模MoE背后的架构、技术和代码,统统给开源了!
超大规模MoE模型(如DeepSeek),到底该怎么推理才能做到又快又稳。现在,这个问题似乎已经有了标准答案——华为一个新项目,直接把推理超大规模MoE背后的架构、技术和代码,统统给开源了!
此刻我们正处在什么样的时代?是姚顺雨笔下的「AI 的下半场」,是 Andrej Karpathy 定义的「软件 3.0 时代」,也是一个创造者与 AI 协同进化,重新定义「可能」的时代。
AI音效已经进化成这样了吗??
中兴通讯,这家数万人的科技大厂,凭借40年 ICT 技术积累正式进军 AI 赛道。 一家信息通信公司,居然拿到了 AI 推理竞赛的冠军,这事儿有点意思。
猫猫再立新功,这次竟然是拯救了人类的科研进程?
最近,看到各大厂商,在不断地将自己的AI大模型进行开源。华为宣布开源:盘古7B稠密和72B混合专家模型。
用户究竟是如何使用AI的? Menlo Ventures是一家硅谷老牌的风险投资公司,专注于消费者、企业和生命科学领域,曾投资了Uber、Siri、Tumblr等知名公司。
大约 7 年前,我发布了一个名为 SDK Monitor 的小工具应用,用来监控设备上安装的所有应用使用的 targetSDK API 级别。当时正值 Google 开始强制推行 targetSDK 最低版本限制(现在要求至少是去年的版本),于是我的原始应用很快就变旧了。随着时间的推移,我甚至已经无法再打开 Android Studio 去维护它了——开发环境和技术体系早已焕然一新。
知名 AI 技术博主、《Python 机器学习》作者 Sebastian Raschka 又来放福利了!
大家好,我是袋鼠帝 说实话,一直以来,都在探索如何用我制作的AI Agent(智能)体变现 我之前大多数的Agent成交都是在微信私域里面。
中科院自动化所提出DipLLM,这是首个在复杂策略游戏Diplomacy中基于大语言模型微调的智能体框架,仅用Cicero 1.5%的训练数据就实现超越
从撒谎到勒索,再到暗中自我复制,AI 的「危险进化」已不仅仅是科幻桥段,而是实验室里的可复现现象。
AI Siri 多次跳票之后,苹果似乎要破釜沉舟,放弃自研,直接引入第三方的 AI 模型了。
本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅
技术节早就不是走过场的科技圈装饰品了。 放眼中外,谁家技术底子硬、AI方向稳,基本都要拿一场技术节出来亮家底。
为什么AI生成的视频总是模糊卡顿?为什么细节纹理经不起放大?为什么动作描述总与画面错位?
几十年来,人工智能领域一直在思考一个看似简单但非常根本的问题: 如果一个智能体要在真实世界中行动、规划,并且和环境互动,它需要一个怎样的「世界模型」?
根据Xsignal AI Holo(AI全息)数据库数据,上图呈现出2025年5月海外Web端AI应用类型的发展全景。为方便您最快速掌握关键要点,X博士为您梳理出5个关键洞察(5 Key Insights):
OpenAI 有个反常规的设定, 他们将我生成的图片整理成一个画廊,但是点开图片并没有跳回到当时对话的选项,只能在这张图的基础上修改。 这也是很多AI目前的交互通病, 我和他们的对话正在丢失。
你有没有想过,为什么在这个云计算和AI横行的时代,PDF文档处理依然是企业最大的痛点之一?想象一下这样的场景:一份包含数百页的贷款申请文档躺在银行系统里,等待人工审核,而申请人只能苦苦等待几天甚至几周才能知道结果。与此同时,医院里的医疗记录还在用打印机输出,然后手工传递给下一个医生。
在推出 AI 角色扮演出海应用「Saylo」后,元象团队将目光投向了 AI 游戏领域,尝试用大模型重构“无限剧情”的叙事体验。「昭阳传」是一款以穿越题材为框架的 AI 文字冒险游戏,能实现多智能体决策与动态演绎。
扩散模型(Diffusion Models, DMs)近年来展现出巨大的潜力,在计算机视觉和自然语言处理等诸多任务中取得了显著进展,而异常检测(Anomaly Detection, AD)作为人工智能领域的关键研究任务,在工业制造、金融风控、医疗诊断等众多实际场景中发挥着重要作用。
在 AI 时代的浪潮下,顶尖人才影响力空前高涨,其地位更被市场推升至了前所未有的高度。无论是谷歌 Transformer 论文八子,还是从 OpenAI 出走的科学家,他们要么自立门户,拿到亿级投资、百亿级估值,或者跳槽到他处,凭己之力拉近企业间的技术代差甚至影响竞争格局。
OpenAI收购“iPhone之父”创立的AI硬件公司后,推出的首款AI设备或为智能笔。
国际机票预订决策复杂,涉及地点进出、时间浮动与购买时机等多变量博弈,远超普通消费者能力。AI可通过模拟专家决策流程(包括需求澄清、动态数据检索、透明推荐、智能购票时机建议)赋能用户,但需跨越策略进化与数据成本门槛。OTA因其C端入口、计算能力和数据成本优势最有望主导AI应用落地,重塑行业生态。
MT Park 的第12场AI分享会顺利进行!~🎉 感谢向阳乔木老师非常细致地分享了: 他探索 Prompt 的多场景实践,从 Cursor、Windsurf 等 vibe 编程工具,到 Veo3 的视频生成,覆盖编程、教育、内容创作等多个方向,带你快速上手 AI 最实用的玩法。
世界破破烂烂。 而小猫,缝缝补补。 就在昨天,我一如既往在B站刷一些视频,却在一条视频底下里发现了一个我看不懂的梗。 是一个叫“暖言猫猫”的用户,在评论区回复了一段疑似AI生成的文字,底下一堆人追着回复“你是一袋猫粮”。
杭州AI陪诊公司,准备赴港IPO了!
JEPA-2(V-JEPA 2)是Meta最新推出的视频世界模型,采用视图嵌入预测(Joint Embedding Predictive Architecture)框架进行自监督预训练。
像人一样推理。 大模型的架构,到了需要变革的时候? 在对复杂任务的推理工作上,当前的大语言模型(LLM)主要采用思维链(CoT)技术,但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。