
只用2700万参数,这个推理模型超越了DeepSeek和Claude
只用2700万参数,这个推理模型超越了DeepSeek和Claude像人一样推理。 大模型的架构,到了需要变革的时候? 在对复杂任务的推理工作上,当前的大语言模型(LLM)主要采用思维链(CoT)技术,但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。
像人一样推理。 大模型的架构,到了需要变革的时候? 在对复杂任务的推理工作上,当前的大语言模型(LLM)主要采用思维链(CoT)技术,但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。
2025 年 6 月 23 日,由 GMI Cloud 联合 InfoQ 举办的 “2025 AI 应用出海年中洞察暨 GMI Cloud 新品发布会” 在线上举行。
还记得 2022 年 11 月,魔搭社区在周靖人的倡议下诞生,他当时说:“真正让 AI 开发变得更简单,实现 AI 应用的百花齐放”。
今年2月DeepSeek爆火,震惊国内外。实际上,在此之前,中国信息通信研究院(下称:中国信通院)的大模型评测团队就观察到国内模型性能迅速提升的势头,他们当中就包括中国信通院人工智能研究所所长魏凯。
全球动漫产业年增长超10%,但产能严重不足(顶级工作室排期2-3年),根源在于高度依赖手工(30%-40%流程仍用纸张)。AI技术(关键帧生成、动作捕捉、AI导演助理等)正尝试融入制作流程,但仍受限于画面稳定性(如5%-10%美学误差)、动作夸张性缺失和伦理问题(声优抵制)。未来需平衡技术突破(创造新美学可能)与人才培育(避免基础岗位断层)。
刚刚,AlphaEvolve又上大分了!基于它的开源实现OpenEvolve,靠自学成才、自己写代码,直接在苹果芯片上进化出了比人类还快21%的GPU核函数!这一刻,是自动化编程史上真正里程碑时刻,「AI为AI编程」的新时代正式开启,自动化奇点真要来了。
6月28日,由国家能源集团自主研发的全球首个千亿级发电行业大模型——“擎源”发电行业大模型在京正式发布。
如果你是程序员,又对股票感兴趣,那八成动过写个脚本的念头。这个想法的初版通常很简单:找个免费的股票数据 API,用 Python 拉取 K 线,算一下 MACD 或者 RSI 指标,然后写几个 if/else 来触发买入卖出信号。测试几次,发现收益还不错,特容易兴奋上头。
MariaDB 最近发布了 MariaDB Community Server 11.8,作为 2025 年的年度长期支持(LTS)版本,现已普遍可用。新版本引入了集成的向量搜索功能,适用于 AI 驱动和相似性搜索应用程序,增强了 JSON 功能,并提供了用于数据历史和审计的时态表。
故事的开始是发生在 1 年多前,硅谷发生了令人震惊的杀妻案件。凶手用拳头一拳拳打死了自己的妻子,再加上 华人、高学历、清华、大厂这样的无敌光环,这件案子当时格外引人关注。