240元打造擅长数学的多模态版R1,基于DeepSeek核心思想,两阶段训练提升推理能力至工业级应用标准
240元打造擅长数学的多模态版R1,基于DeepSeek核心思想,两阶段训练提升推理能力至工业级应用标准多模态大模型虽然在视觉理解方面表现出色,但在需要深度数学推理的任务上往往力不从心,尤其是对于参数量较小的模型来说更是如此。
多模态大模型虽然在视觉理解方面表现出色,但在需要深度数学推理的任务上往往力不从心,尤其是对于参数量较小的模型来说更是如此。
什么?H20都变抢手货,涨价10万那种?!
通过收集六名志愿者一周的多模态生活数据,研究人员构建了300小时的第一视角数据集EgoLife,旨在开发一款基于智能眼镜的AI生活助手。项目提出了EgoButler系统,包含EgoGPT和EgoRAG两个模块,分别用于视频理解与长时记忆问答,助力AI深入理解日常生活并提供个性化帮助。
杰文斯悖论不是天然成立的。在AI的叙事中,要让算力用得越多,就要让算力变得更便宜,也要让AI更有用、好用。兑现杰文斯悖论已经成为了英伟达的命门,黄仁勋要在本届GTC上,让市场再次相信他。
深夜11点,某AI软件陪聊群才真正热闹起来。短短一个小时,陆续有几十个新账号进群。根据群公告介绍,上述软件还在内测阶段,但依然能通过链接下载试玩。众多AI驱动应用程序不仅能进行全天候的情感交流,还能满足用户的个性需求。大厂等也在切入这个赛道,如百度于近期低调推出情感陪伴类App“月匣”,主打高自由度AI对话与沉浸式剧本互动两大核心功能。
刚刚!代码神器 Cursor 宣布推出全新模型 Claude 3.7 Max!简单来说就是Claude 3.7 的完全体形态抢先体验,号称能力远超以往,专为硬核开发者打造!一句话总结 Claude 3.7 Max: 更强、更快、更贵,专为解决复杂代码难题而生!
马斯克也要打造自己的视频生成模型了??就在最近,xAI收购了一家视频生成初创公司,这家仅4个人的公司过去两年打造出了Hotshot这款产品。Hotshot至今已有3款视频生成基础模型。被收购之后,目前已停止推出新的视频创作功能,而且用户过往创作的视频截止下载时间为3月30日。
我是 Dify 产品团队的 Yawen。今天,我们很高兴地宣布发布 Dify v1.1.0,并推出了以“元数据”作为知识过滤器的新功能。通过利用自定义的元数据属性,元数据过滤能够提升知识库中相关数据的检索效率和准确度。过去,用户只能在庞大的数据集中进行搜索,无法根据特定需求进行筛选或控制访问,难以快速锁定最相关的信息。、
又是一个周五,网信办又给大家留作业了。《人工智能生成合成内容标识办法》(以下简称《标识办法》)及《网络安全技术 人工智能生成合成内容标识方法》(以下简称《标识标准》)都发布了,将在9月1日生效。
全球首个开源多模态推理大模型来了!38B参数模型性能直逼DeepSeek-R1,同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源,正是希望同DeepSeek一样,打造开源界的技术影响力。
多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。
今年年初,OpenAI 上线 Deep Research,开启了智能体又一新阶段,其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据,并最终为用户提供全面深入的解答。
AI如何赋能千行百业?最近,中绿讯科中国重磅发布了生态级通用平台——AI生态平台。这一平台以自研「泰山大模型群」为基座,集成了多个技术组件,为企业和开发者搭建了一座连接AI与业务需求的桥梁。
大模型的代码能力在这一年突飞猛进,最近我们看到很多关于用AI直接生成前端代码,做出漂亮网页的讨论。
现在各种框架满天飞,你是否想过这个问题,一个真正优秀的框架究竟需要多少代码?研究者Zach给出了一个令人惊讶的答案:仅需100行。这个名为PocketFlow的框架不仅体积小到令人难以置信(仅56KB),还能用来构建一个完整的Cursor编码助手。这个发现不仅挑战了我们对框架复杂性的认知,更揭示了一个重要的设计哲学:真正的创新往往来自于化繁为简。
文生图技术在全球范围掀起的热潮,让无数用户惊叹科技强大的同时,也开始陆续拥抱AI,沉浸于高效、趣味创作之中。特别是在许多社交媒体上,时常能看到人们通过AI创作出的创意内容。
传统的App原型设计需要专业的设计技能、复杂的工具操作和大量的时间投入。而现在,借助Cursor+Claude 3.7的组合,一段精心设计的提示词就能完成这一切。
“我的面试官是AI”“用AI助手找工作”……今年,第一批春招的年轻人发现,AI在招聘中被应用得如火如荼。
65岁陈立武接棒英特尔,正酝酿一场全面的变革。他不仅要对制造和AI业务全面升级,还要裁撤中层管理层。曾经的芯片帝国,能否重拾昔日的辉煌?
在朱啸虎看来,只有做苦活累活的AI创业项目才有护城河。
在春节的 DeepSeek 大热后,大模型也更多走进了大家的生活。我们越来越多看到各种模型在静态的做题榜单击败人类,解决各种复杂推理问题。但这些静态的测试与模型在现实中的应用还相去甚远。模型除了能进行对话,还在许多更复杂的场景中以各种各样的方式与人类产生互动。除了对话任务外,如何实现大模型与人的实时同步交互协作越来越重要。
CLIP、DINO、SAM 基座的重磅问世,推动了各个领域的任务大一统,也促进了多模态大模型的蓬勃发展。
DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率,不过其论文中似乎还缺少一些关键细节,让人难以复现出大规模和工业级的强化学习系统。
Manus的火爆带热了多个技术概念,Computer Use Agent就是其中之一。但要探讨这种“电脑使用”智能体,还得从Claude 3.5 Sonnet说起。
3 月 18 日上午,字节跳动豆包大模型部门(Seed)召开全员会,由负责模型应用相关工作的朱文佳,与新近加入的负责 AI 基础研究探索工作的吴永辉共同主持。两人谈到了未来的目标,明确 Seed 部门的最重要目标是探索智能上限;同时强调进一步加强组织文化,提高技术开放程度,并考虑推进开源。
现在是周日,天都黑了,眼瞅着快到 23 点 59 分了,差评君的量子计算文章还没写完。
超低成本图像生成预训练方案来了——仅需8张GPU训练,就能实现近SOTA的高质量图像生成效果。
AI 大神 Andrej Karpathy 在今年 2 月提出的概念——「Vibe Coding」,如今正在硅谷走红。
Google最近的动作真的多。
国外一个开发者,只用了3个小时,完全靠AI开发游戏,9天时间就赚了17360美元(折合人民币12.64万)。