Meta没做的,英伟达做了!全新架构吞吐量狂飙6倍,20万亿Token训练
Meta没做的,英伟达做了!全新架构吞吐量狂飙6倍,20万亿Token训练英伟达发布全新架构9B模型,以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍,对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。
英伟达发布全新架构9B模型,以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍,对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。
100+AI专家Agent天团同时开工,分分钟并行拿下5、6个复杂任务。 “AI智囊团”现在都进化到这种程度了?
8月18日,医疗AI企业惠每科技宣布完成近2亿元人民币融资。本轮融资由上海国资上海科创基金及钟鼎资本共同领投,启明创投继续加持、长宁资本以虹桥睿智投资平台进行跟投。
首个满分选手的出现,标志着AI医疗的又一个里程碑。 近日,美国初创公司OpenEvidence宣布,其开发的全新AI系统在美国医师执照考试(USMLE)中获得了100%的满分。
中国HBM技术代差从8年缩至4年,长鑫存储提前量产HBM2并推进HBM3。三大存储巨头转向定制化HBM4,英伟达将自研基础裸片。国产化仍面临EUV光刻与生态闭环挑战,缓存卸载方案可缓解存储压力。
今天凌晨,阿里推出了最新图像编辑模型 Qwen-Image-Edit!该模型基于 200 亿参数的 Qwen-Image 架构构建,支持中英文双语精准文本编辑,在保持原有风格的同时完成修改。此外,Qwen-Image-Edit 将输⼊图像同时输⼊到 Qwen2.5-VL(实现视觉语义控制)和 VAE Encoder(实现视觉外观控制),兼具语义与外观的双重编辑能⼒。
不久之后,我们阅读的各种新闻网站的首页,也许都是AI编排的。 8月12日,以AI搜索为主赛道的公司Perplexity,提出以345亿美元收购谷歌Chrome浏览器。这一数字甚至高于Perplexity目前180亿美元的估值。
由中国人工智能学会主办的2025第三届全国人工智能应用场景创新挑战赛AI Agent全球专项赛启动仪式在香港科技大学(广州)举办。这场被业界誉为“AI Agent 元年英雄时代开幕盛典”的盛会,以吴恩达、 尤肖虎、周鸿祎、杨宁、朱啸虎、徐飚、缪玉峰 七位全球各自领域领袖对大赛的祝福视频震撼开场,为大赛全球参赛团队注入强心剂!
在大语言模型(LLMs)领域,自回归(AR)范式长期占据主导地位,但其逐 token 生成也带来了固有的推理效率瓶颈。此前,谷歌的 Gemini Diffusion 和字节的 Seed Diffusion 以每秒千余 Tokens 的惊人吞吐量,向业界展现了扩散大语言模型(dLLMs)在推理速度上的巨大潜力。
我们需要「AI母亲」,而非「AI助手」!在Ai4 2025大会上,「AI教父」再次表达了他对AI安全的担忧。他警告说人类要继续控制AI是虚幻的希望,并提出与之相反的有趣视角:为AI建立「母性本能」。