
唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力
唯快不破:上海AI Lab 82页综述带你感受LLM高效架构的魅力近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已经深刻改变了人机交互方式。
近年来,大语言模型(LLMs)展现出强大的语言理解与生成能力,推动了文本生成、代码生成、问答、翻译等任务的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已经深刻改变了人机交互方式。
A股站上3800点,券商AI投顾收费高,专家提醒勿迷信。 22日,A股全天震荡走高,沪指时隔10年站上3800点。股市行情向好之际,不少投资者将AI视为“投资理财顾问”。不少券商、投顾公司、第三方金融数据软件也纷纷推出了AI投顾、AI选股等功能。
一份全新GPT-5系统提示词,在GitHub中悄然泄露,足足有17803 token。内容设计超精细,用户对齐、拟人风格、输出质量等全面覆盖。
DeepSeek涨价了。 智东西8月23日报道,8月21日,DeepSeek在其公众号官宣了DeepSeek-V3.1的正式发布,还宣布自9月6日起,DeepSeek将执行新价格表,取消了今年2月底推出的夜间优惠,推理与非推理API统一定价,输出价格调整至12元/百万tokens。这一决定,让使用DeepSeek API的最低价格较过去上升了50%。
2025 年 8 月的世界人形机器人运动会可说是笑点与技术齐飞,荒诞与精彩共舞。我们看到了撞翻人类和机器人的机器人运动员以及足球赛场上机器人接连倒地摔跤,也看到了最前沿机器人技术的集中展现以及一个又一个新纪录的诞生。
快手二季报于北京时间 8 月 21 日港股盘后放出。近期快手股价表现可谓是港股前排的当红炸子鸡,大功臣自然是 Kling。
8月23日,据“拟合论见”经多方消息确认,华为旗下的云计算业务已启动一场大规模组织优化调整,或波及上千人。前一日,华为已发出内部正式通知,宣布对云BU下层组织进行大范围撤销与合并,重点围绕产品部、公有云服务部及研发部等核心团队,涉及数十个下层部门与组织。
Grok-2正式开源,登上Hugging Face,9050亿参数+128k上下文有多猛?近万亿参数「巨兽」性能首曝。马斯克再现「超人」速度,AI帝国正在崛起。
2025年8月,Anish Acharya与Justine Moore撰文探讨AI应用生成平台的崛起趋势。文章指出,这一领域正走向专业化与差异化发展,各平台凭借独特定位和功能共存互补,形成类似基础模型市场的多元格局。
DeepConf由Meta AI与加州大学圣地亚哥分校提出,核心思路是让大模型在推理过程中实时监控置信度,低置信度路径被动态淘汰,高置信度路径则加权投票,从而兼顾准确率与效率。在AIME 2025上,它首次让开源模型无需外部工具便实现99.9%正确率,同时削减85%生成token。