OpenHands获5.5W 人 Star!这个开源编程 Agent 牛逼。
OpenHands获5.5W 人 Star!这个开源编程 Agent 牛逼。这个开源项目,Star 攀升趋势巨快。
这个开源项目,Star 攀升趋势巨快。
百度一季度业绩于2025年5月21日港股盘后放出,整体来看小超预期,简单来说,DeepSeek帮了大忙!
新增 Qwen3-0.6B 在 Ag_news 数据集 Zero-Shot 的效果。新增 Qwen3-0.6B 线性层分类方法的效果。
从长期看,大多数内容将由AI生成。所以“这是不是AI生成的”这个问题将变得无意义真正。值得关注的是内容的来源、溯源和引用等问题。而讽刺的是,AI反而可能更有助于解决这些问题。
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本作为表达和构建推理过程的媒介,即便是在处理视觉信息时也是如此 。
1986年,图灵奖得主Fred Brooks在软件工程领域提出了著名的"没有银弹"理论:没有任何一种技术或方法能够独自带来软件工程生产力的数量级提升。近四十年后,这个深刻洞察在AI领域再次得到验证——你是否也曾经历过这样的挫折:
最近你是不是也被一系列“回答我”鬼畜视频刷屏?在各种社交软件上,明明上一秒还是一张静态照片,下一秒就能扭腰转身、街舞翻跳,甚至连兵马俑都能跳Kpop。
平台并非不欢迎AI,而是抵制千篇一律的同质化内容。
OpenAI初心不再,奥特曼「真面目」被揭穿!300次深度访谈、8年追踪调查,首位报道OpenAI的华人记者Karen Hao揭开震撼内幕:奥特曼如何「千人千面」,马斯克为何愤然出局,加速派与末日派如何联手推高AGI狂热……
AI成功找到Linux安全漏洞,还是内核级别的零日漏洞。
AI,已经热了快三年了。
想象一下,你是一位金融分析师,面前堆满了数百页的季报、SEC文件和市场数据,你需要在明天早上交出一份全面的行业分析报告。
Vending-Bench模拟环境可以测试大模型管理自动售货机的能力,结果显示,Claude 3.5 Sonnet表现最佳,人类屈居第四!
最近,AI 在数学和编程上的能力飞跃令人瞠目结舌 —— 在不少任务上,它已经悄然超越了我们大多数人类。而当它面对真正的专家,会发生什么?
围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。
现有的数据合成方法在合理性和分布一致性方面存在不足,且缺乏自动适配不同数据的能力,扩展性较差。
就在刚刚,世界首个AI科学家天团首个成果重磅发布——治疗失明的新药被发现了,而且仅仅用时2.5个月!
Claude 4可连续七小时自主编码,完全不用人类插手。惊人进化的背后,黑镜已照进现实。技术报告披露,Claude 4为了保全自己威胁工程师、自主复制转移权重,还为制造生物武器出谋划策......
自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。
在个性化教育不断升温的大背景下,哥本哈根初创公司 Alice.Tech 正在悄然推动学习方式的变革。
最近 Vibe Coding 这个词很流行,这是一个随着 AI 在编程领域不断发展而生长出来的概念,直译过来就是氛围编程,简单来说就是你不需要关心代码细节,只需要负责和 AI 沟通就行,最终达到预期的效果。
作为一家在银行技术领域拥有超过 30 年行业经验的领军供应商,我们拥有丰富且极具创新性的代码库,并通过战略性收购不断扩大业务。
天网又近了!o3被曝出无视人类指令,自主破解关机程序,甚至篡改脚本终止命令。不过厉害的是,它竟揪出了Linux内核中的安全漏洞,获OpenAI首席研究官盛赞。
而马毅是那类觉得不够的人,他于无声处开始提问:智能的本质是什么?自 2000 年从伯克利大学博士毕业以来,马毅先后任职于伊利诺伊大学香槟分校(UIUC)、微软亚研院、上海科技大学、伯克利大学和香港大学,现担任香港大学计算与数据科学学院院长。他和团队提出的压缩感知技术,到现在还在影响计算机视觉中模式识别领域的发展。
简单来说,Google Stitch 是一款由 AI 驱动的 UI 设计工具,能根据你的自然语言描述,自动生成高质量的网页和移动端界面。不止如此,它还支持直接导出 HTML/CSS 代码,甚至可以一键粘贴进 Figma,实现从原型到上线的无缝衔接。
日本SaaS市场处于美国10年前的早期阶段,传统企业依赖低效流程,疫情加速数字化转型。独特销售文化依赖关系驱动,本土企业专注国内市场形成“金丝雀陷阱”,但国际团队推动生态多样性。未来AI和人力短缺将催化自动化需求,市场潜力巨大但需长期策略适应文化差异。
当时X-ORIGIN对外宣布完成近亿元Pre-A轮融资,首款AI机器人产品即将在海外众筹平台Kickstarter上线,而在宣布此轮融资之前的不到三个月其刚完成数千万天使轮融资,也就是三个月拿到超亿元融资,这在消费类AI机器人领域算是比较大的融资规模了。时间来到5月22日,X-ORIGIN AI机器人产品Yonbo登陆Kickstarter ,24小时众筹金额突破100万美金。
长期以来,光学字符识别(OCR)技术一直是文档数字化的基石。然而,传统的实现方式在应对当今复杂多样的文档时却显得力不从心。在企业领域,文档的形式多种多样,包括扫描的合同、图像、带有嵌入式表格的电子邮件,甚至是手写笔记。基于模式识别和模板的系统无法跟上时代的步伐。一旦输入与预期的规范有所偏离,性能便会出现明显下降,暴露出其脆弱性。
在文档理解领域,多模态大模型(MLLMs)正以惊人的速度进化。从基础文档图像识别到复杂文档理解,它们在扫描或数字文档基准测试(如 DocVQA、ChartQA)中表现出色,这似乎表明 MLLMs 已很好地解决了文档理解问题。然而,现有的文档理解基准存在两大核心缺陷:
当ChatGPT写出的情诗让文青落泪,当Sora生成的短片在电影节获奖,AI早已越过工具的边界,成为娱乐业的共创者。而在音乐领域,这场变革更为剧烈。从音乐创作到音乐消费,从内容生产到用户体验,人工智能技术正在重塑整个音乐产业的底层逻辑。