大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一
大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一孙子兵法有云:“故其疾如风,其徐如林”,意指在行进迅速时,如狂风飞旋;而在行进从容时,如森林徐徐展开。
孙子兵法有云:“故其疾如风,其徐如林”,意指在行进迅速时,如狂风飞旋;而在行进从容时,如森林徐徐展开。
人工智能搜索引擎Perplexity重磅发布新产品Perplexity Labs,这是一款面向专业版用户(20美金/月)的智能Agent工具,为用户提供了更强大的生产力解决方案。用户可以在搜索框下方一键切换至"实验室模式",通过该模式可高效生成:专业分析报告、结构化电子表格、交互式网页应用、数据可视化图表等。
年入790亿,ICT龙头冲刺A+H上市。
「知其然,亦知其所以然。」
OpenAI的o3推理模型席卷AI界,算力暴增10倍,能力突飞猛进!但专家警告:最多一年,推理模型可能一年内撞上算力资源极限。OpenAI还能否带来惊喜?
近年来,语言模型技术迅速发展,然而代表性成果如Gemini 2.5Pro和GPT-4.1,逐渐被谷歌、OpenAI等科技巨头所垄断。
在今年 ICLR 会议上,我们被问到最多且最有意思的问题是:像 Jina AI 这样的向量搜索模型提供商,除了在 MTEB 上做基准测试,会不会做些氛围测试 (Vibe-testing)?
好家伙,AI意外生成的内核(kernel),性能比人类专家专门优化过的还要好!
GPT-4o-Image也只能完成28.9%的任务,图像编辑评测新基准来了!360个全部由人类专家仔细思考并校对的高质量测试案例,暴露多模态模型在结合推理能力进行图像编辑时的短板。
FLUX.1 Kontext是一款融合即时文本图像编辑与文本到图像生成的新一代模型,支持文本与图像提示,角色一致性强,速度快达GPT-Image-1的8倍。
现在,请大家一起数一下“1”、“2”。OK,短短2秒钟时间,一个准万亿MoE大模型就已经吃透如何解一道高等数学大题了!而且啊,这个大模型还是不用GPU来训练,全流程都是大写的“国产”的那种。
字节跳动开源了一个口碑还不错的模型——BAGEL (ByteDance Agnostic Generation and Empathetic Language model), 一个统一多模态基础模型。啥叫“统一”?一个模型就能同时理解和生成文本、图像、视频!
就在刚刚,中兴通讯星云大模型获推理榜总分第一,总榜并列第二!而在数学推理、科学推理、代码生成的细分赛道上,它同样表现抢眼。更难得的是,它是业内少数通过国家级权威安全认证的大模型。
最近,Yoodli宣布完成了1370万美元的A轮融资,由Neotribe Ventures领投,Madrona和Cercano等现有投资者跟投。这使得他们的累计融资超过2000万美元。但让我感兴趣的不仅仅是融资数字,而是这家公司正在创建的全新品类:AI角色扮演。
在 「What's Next|科技早知道」 的播客节目中,峰瑞资本执行董事 刘鹏琦 和「声动活泼」联合创始人&「科技早知道」主播 丁教Diane ,以及「科技早知道」节目监制 雅娴 ,围绕具身智能赛道所处的新阶段与核心挑战,探讨了以下问题,包括但不限于:
文章以第一人称视角,讲述一名AI自媒体博主因行业竞争与技术迭代陷入深度焦虑的过程,最终通过反思意识到焦虑源于攀比与生存恐惧,而非技术本身。核心观点是接纳自身局限、明确独特价值、转向合作与好奇驱动,并提出三条实用建议,强调应对AI焦虑需聚焦个人定位而非盲目追赶。
AI尚未大规模替代人类工作,就业市场未现显著冲击,企业投资回报低于预期,进入技术幻灭期。研究指出AI对生产力的影响存在滞后效应,关键问题在于能否提升社会整体生产力而非单纯替代人力。未来需构建制度框架,平衡技术发展与社会利益。
AI正被妈妈们用于辅导孩子作业,尤其是代写作文,以应对学校刻板命题和格式要求。家长认为作文缺乏意义,AI能高效生成应试模板,甚至老师也使用AI批改,形成“AI写-AI批”闭环。这虽减轻了家长负担,却让孩子过早学会应付规则,真实表达空间被压缩,引发对教育意义和童年消逝的反思。
豆包、文心一言、DeepSeek、元宝……这些国产AI工具,正在大规模进入职场内容流里。我们以为它们是工具,其实它们更像是一种“说得太像真的语气”,让每个使用者都可能在不经意间交出判断力。
文章探讨AI时代深度思考的困境:大语言模型使人类思维系统萎缩,即时生成内容取代有机思考过程,削弱直觉与思辨力。作者以自身创作瓶颈为例,指出依赖AI导致认知基础流失,廉价知识无法替代深层理解,强调原始思考过程的价值,认为未经修饰的人类思考仍有独特意义。
在建筑行业中,管理人员很容易与现场实际情况脱节。他们需要同时处理多项任务,包括掌握成本动态、与所有利益相关方沟通,以及评估与承包商账单和绩效等方面相关的风险。
AI生图新突破!一个模型同时接受文本和图像输入。
“要是这些历史能在地图上‘动’起来就好了!” 这个念头一直在我脑子里盘旋。我渴望能有一张直观的地图,让我轻松洞悉历史发展的脉络。目前人工智能浪潮奔涌而至,其在文本、图像乃至动画领域的创造力令人瞩目。我便想着,能否借助AI之力,将《枪炮、病菌与钢铁》所描绘的世界,真实地投射到一张交互式的地图之上?
提质不加价,可灵新版视频生成模型正式登场!新版本依然是一石激起千层浪,不到24小时就有超过72万次阅读。我们也带来了新鲜实测!
多模态大模型(MLLM)在静态图像上已经展现出卓越的 OCR 能力,能准确识别和理解图像中的文字内容。MME-VideoOCR 致力于系统评估并推动MLLM在视频OCR中的感知、理解和推理能力。
每天宣扬「AI变革」的外媒Business Insider,终于看到这把屠龙刀落在了自己头上。刚刚,CEO宣布:裁员21%,全面拥抱AI!讽刺吗?那些亲手写下「AI将颠覆媒体」的记者们,正被AI亲手送下了楼。工会怒斥:这是对新闻的背叛,是对人类记者尊严的公然践踏!更可怕的是,今天是他们,明天会不会轮到你?
来和机器狗一起运动不?你的羽毛球搭子来了!无需人工协助,仅靠强化学习,机器狗子就学会了羽毛球哐哐对打。基于强化学习,研究人员开发了机器狗的全身视觉运动控制策略,同步控制腿部(18个自由度)移动,和手臂挥拍动作。
多AI智能体系统的复杂构建与优化,长期以来是用智能体解决科研问题和场景落地的瓶颈。来自英国格拉斯哥大学的研究团队发布了全球首个AI智能体自进化开源框架EvoAgentX,通过引入自我进化机制,打破了传统多智能体系统在构建和优化中的限制!
就是这两个黄毛小伙子,他们试图建立新的教育体系。 他们为学生创建了一种制作自定义视频教程的方法,一键生成所有科目的讲解视频,比真人老师讲的更好更仔细,就像可汗学院一样,并允许他们像与真正的导师/老师交谈一样进行互动,让每位学生都有私教老师。
我在《晚点》公众号读到一篇质量非常高的访谈,嘉宾是 AI 应用创业公司 YouWare 的创始人明超平。YouWare 做的事情正是 Vibe Coding。这篇是我近期读到最为深刻的创始人访谈文章。明超平居然是 95 年的,但认知很深刻,他提到一个有意思的视角: