
大模型究竟是怎么思考的?这可能是近期最有趣的高质量AI访谈
大模型究竟是怎么思考的?这可能是近期最有趣的高质量AI访谈智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?
智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?
DeepSeek V3.1和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经上手实测,为你奉上更多新鲜信息。
在经过长足的预热,并且见识到谷歌堪比阿勃维尔的保密程度之后,我们终于迎来了 2025 年谷歌的 Pixel 系列新品的正式发布。
AI换脸技术已能成功骗过部分人脸识别系统,用于实施金融诈骗(如盗号改法人、盗刷账户)。人脸识别存在安全漏洞,2D识别易被照片/视频破解,3D识别也可能被伪造数据欺骗。黑产已形成相关产业链,国家与技术公司正加强防御,但用户需提高警惕,谨慎使用人脸识别。
AI吃播视频合成虚幻食物内容,快速走红成为流量热点,用户通过其解压助眠获得成瘾体验。创作者利用平台激励和售卖提示词、课程实现盈利,而AI大厂如OpenAI持续亏损。模型如快手可灵商业化成功,从会员订阅中获利。
AI领域的“抢人”早就是个显性命题了,不过现在有愈演愈烈的架势。与海外相同,这场争夺是由大厂发起的,其中字节尤甚。单从最新发布的校招信息来看,字节今年的研发岗需求量增加了23%,其中算法、前端和客户端增幅最明显。在非研发招聘领域与产品相关的,像是产品经理、数据分析等方向,offer量翻了一倍。
自2024年5月谷歌推出AI Overviews(AI概览)功能以来,用户无需点击即可获取答案,这导致新闻网站和独立博主的点击量暴跌。数据显示,全球新闻网站的月自然访问量从2024年7月的23亿次骤降至2025年5月的不到17亿次
昨晚睡不着,我把四份最新AI纪要摊床上,越看越像四盘菜:Kimi那盘是精算师凉面,DeepSeek端上战略家佛跳墙,ChatGPT递来脱口秀炸酱面,Gemini则摆好外交官寿司。
8 月 20 日,在新加坡的 Stripe Tour 上与 Stripe CEO 对谈的时候,Manus 首席科学家季逸超(Peak)表示,Manus 从三月份推出至今已实现 9000 万美元的年化营收规模(revenue run rate),1 亿美元大关近在咫尺。
众所周知,前不久 Anthropic 宣布对用户实行每周速率限制。其中,在解释原因时,Anthropic 提到“虽然 Pro 和 Max 套餐提供了充足的 Claude 访问权限,但一些高级用户却全天候不间断地运行 Claude,消耗的资源远远超出了正常使用量。一位用户在 200 美元的套餐中消耗了数万个模型使用量。”
大模型与多模态之间的关系,可以理解为大模型就像是人脑中的‘前额叶’,主要负责高级认知功能,但只有前额叶的大脑是无法处理复杂任务的,这就需要多个不同模型之间互相协调,从单纯的“前额叶”走向“完整的大脑”,从而处理更加复杂的现实任务。
就在刚刚,全球首个手机通用Agent,来了!
RoboNeo 拿下百万 MAU 后,美图财报依旧强势。7 月中旬,美图上线了面向影像领域的 AI Agent RoboNeo,并靠“emoji 小人”的社媒风潮获取了第一批用户,上线一个月左右的时间,已拿下 100W 左右的 MAU。美图又以极快的速度,推火了一款新产品。在 AI 时代,聚焦影像的美图,有点乘风起的意味,如其昨天发布的半年报。
00后AI创业潮来袭!华人女生MIT辍学创业,拿下融资2100万美元(折合人民币1.5亿元)。 公司直接剑指RPA(机器人流程自动化)界的Copilot。
大家好,我是袋鼠帝 最近发现滴滴出手了!入局打车MCP 我还挺感兴趣的 于是找朋友帮忙开了白名单拿到了一个内测apikey https://mcp.didichuxing.com/
Firecrawl 联合创始人兼首席执行官 Caleb Peffer 清楚地记得找到领投 A 轮融资的投资人的那一刻。
虎牙Q2营收15.7亿,AI战略驱动平台实现创新转型。 8月12日,虎牙发布2025年第二季度财报。经过两年战略转型后,虎牙交出一份超越市场预期的亮眼业绩。
想象一个课堂:讲台上是永不疲倦的AI讲师,台下是专注于启发和引导的人类导师。本期播客,听听他们关于AI如何重塑教育、老师角色以及适应力为何是新一代职业保障的深刻洞见。
美国每年有超三分之一患者需跨机构转诊,但复杂行政流程导致转诊完成率不足一半。Tennr以AI为底座切入这一高摩擦、高错误率的关键节点,重构信息交互与操作流程,为医疗机构与患者带来更高效、更可控的转诊体验。
当我看到 Cursor、Claude Code、Lovable 这些 AI 编程工具的出现,以及它们正在以惊人的速度降低软件开发成本时,我意识到我们正站在一个历史转折点上。这不仅仅是开发效率的提升,而是整个软件行业商业逻辑的根本性重构。
在一次采访中,美国国家科学基金会(NSF)人工智能和基本相互作用研究所(IAIFI)主任杰西·塞勒(Jesse Thaler)畅谈了AI和物理学富有成效的交叉。他分享了自己从机器学习怀疑者转变为倡导者的思想转变经历,并分析了AI与物理学双向互动可能带来新发现的潜在路径。
近年来,扩散大语言模型(Diffusion Large Language Models, dLLMs)正迅速崭露头角,成为文本生成领域的一股新势力。与传统自回归(Autoregressive, AR)模型从左到右逐字生成不同,dLLM 依托迭代去噪的生成机制,不仅能够一次性生成多个 token,还能在对话、推理、创作等任务中展现出独特的优势。
英伟达封王,谷歌、亚马逊、华为“稳赚不赔”,AMD意外亏损。AI推理,是一门利润惊人的生意。
「兄弟们,DiT 是错的!」 最近一篇帖子在 X 上引发了很大的讨论,有博主表示 DiT 存在架构上的缺陷,并附上一张论文截图。
2011 年 8 月,雷军穿着标志性的黑 T 恤和牛仔裤,在北京 798 艺术中心发布了初代小米手机。在这款产品搅动整个智能手机行业之前,他首先用一个极具冲击力的数字定义了它——1999 元。
虽然大模型的优越表现令人瞩目,但动辄高昂的使用成本也让不少用户望而却步。 为平衡性能与成本,上海人工智能实验室科研团队基于前期技术积累,开源推出了Avengers-Pro多模型调度路由方案。
智谱今天,终于发了AutoGLM2.0。 想一想,AutoGLM1.0的版本,距离我第一次首发写他们,已经过去快10个月了。
DeepSeek V3.1新版正式上线,上下文128k,编程实力碾压Claude 4 Opus,成本低至1美元。在昨晚,DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数,支持多种精度格式,从BF16到FP8。
Vibe Coding的概念已经火了一段时间,因为之前在学校课程里尝试过用生成式人工智能做了一个聊天机器人,过程很顺利,做完很有成就感,所以觉得自己其实可以尝试一下用人工智能(AI)手搓一个APP。
手机是这个问题的标准解法,但它有个悖论:为了记录生活,你必须先打断生活。掏出手机、解锁、打开相机、对焦、按下快门——这个流程本身就是对「当下」的破坏。 所以,当一个名叫 Looki L1 的 AI 硬件出现在我们面前时,我们的目标非常明确:验证它能否解决这个悖论。