一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等
一招缓解LLM偏科!调整训练集组成,“秘方”在此 | 上交大&上海AI Lab等大幅缓解LLM偏科,只需调整SFT训练集的组成。
大幅缓解LLM偏科,只需调整SFT训练集的组成。
20人国内团队,竟然提前2年预判到了DeepSeek的构想?玉盘AI的全新计算架构方案浮出水面后,直接震动业内:当前AI算力的核心瓶颈,他们试图从硬件源头解决!
现在市面上有46种Prompt工程技术,但真正能在软件工程任务中发挥作用的,可能只有那么几种。来自巴西联邦大学、加州大学尔湾分校等顶级院校的研究者们,花了大量时间和计算资源,调研了58种,整理了46种,最终筛选测试了14种主流提示技术在10个软件工程任务上的表现,用了4个不同的大模型(包括咱们的Deepseek-V3),总共跑了2000多次实验。
Vast Data 正在寻求新一轮融资,其估值将实现大幅跃升。该公司提供支持人工智能的数据存储平台。
“不一样的AI玩具形态”
家族办公室是过去几年投资圈的火热话题,从新加坡到中国香港,都在正向吸引富豪人群落地投资,方式之一就是让这些富豪在本地开设家族办公室,通过雇佣专业投资人或机构,帮忙打理庞大的资产,进行股权、信贷、证券、房地产等各项领域的全球资产配置。
在大语言模型蓬勃发展的背景下,Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算复杂度为二次方的问题,成为众多研究试图突破的重点
不仅是大模型本身,Meta 也要成为 AI 基建大厂。
AI不是万能解药 作为中国最大的在线音频平台,喜马拉雅又传出要 “ 卖身 ” 的消息了,据传腾讯音乐打算通过现金+股票的方式收购喜马拉雅。
为什么语言模型能从预测下一个词中学到很多,而视频模型却从预测下一帧中学到很少?
奥特曼亲笔长文「温和的奇点」,在AI圈内掀起巨震。他预示了人类正迈向超级智能时代,奇点不会一夜袭来,而是悄然渗透。
反正只要是苹果的一定会有很多人跟风,所以这个效果在接下来的一段时间你一定会频繁的看见,或者被要求使用。这里藏师傅也是一上午探索了一下如何将液态玻璃效果融入到网页生成的提示词里面,没想到真让我搞了个差不多的出来。
如果去标记“得帆信息”——这家成立十年的软件公司历史,2025年春节,一定是个刻骨铭心的时间点。这本是个欢庆的时点,得帆信息的创始人&CEO张桐却忧心忡忡。他已经多年不写代码,却用美国AI Coding(AI编程)工具Cursor,花两天就写出一套网页版的CRM后,张桐得出结论:
字节AI大牛杨建朝离职的消息在互联网上不胫而走。甚至离职原因都很具体,因为无法顾及北美和国内两边的工作,身心疲劳,压力太大,也有人说是退休。至少两位接近字节的人士告诉《白鲸实验室》,目前仍能在字节后台查到杨建朝的个人信息。
OpenAI深夜放大招,正式推出“最新最强版”推理模型o3-pro! 而且同一时间,o3模型降价80%不降智。官方测评结果显示,在专家评估中,所有人一致更偏爱o3-pro而非o3的回答。
值得买科技发布了自己的 MCP Server “海纳”,在 AI Agent 时代打造消费领域的基础设施。值得买在数据提供与适配方面有着丰富经验,在电商消费行业有着深刻积累,正是因为有了在垂直领域深耕的行业 know how,所以才有能力向行业提供高质量的、场景相关的数据内容。
今年苹果在 AI 上宣布的诸多所谓新功能,例如实时翻译、快捷指令等,并无太多革命性;至于视觉智能 (visual intelligence),不仅功能落后 Google Lens 六七年,交互体验上也远未达到一众 Android 友商的内置 AI/Agent 产品在 2025 上半年水平。
IT桔子在2024年做过一次统计:AI创业者曾在非常优秀的大厂/名企工作过的,在已透露职业背景的AI创业者中占比达到90%。其中,培养中国AI创业者较多的25家名企,包括百度、阿里、腾讯、华为、网易、360等13家中国企业;还有12家外企和跨国公司。
近日,硅基流动官方宣布已完成数亿元人民币 A 轮融资。此轮融资由阿里云领投,老股东创新工场等机构超额跟投,华兴资本担任独家财务顾问。硅基流动创始人袁进辉表示,在本轮融资帮助下,我们将继续加大研发投入,积极拓展海内外市场,努力早日成为开发者首选的生成式 AI 开发平台。
大模型的落地能力,核心在于性能的稳定输出,而性能稳定的底层支撑,是强大的算力集群。其中,构建万卡级算力集群,已成为全球公认的顶尖技术挑战。
游戏直播等实时渲染门槛要被击穿了?Adobe 的一项新研究带来新的可能。
近日,中国科学院计算技术研究所联合软件研究所推出「启蒙」系统,基于AI技术,实现处理器芯片软硬件各个步骤的全自动设计,达到或部分超越人类专家手工设计水平。
为什么语言模型很成功,视频模型还是那么弱?
给大模型当老师,让它一步步按你的想法做数据分析,有多难?
测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
1.93bit量化之后的 DeepSeek-R1(0528),编程能力依然能超过Claude 4 Sonnet?
传统的视频编辑工作流,正在被AI彻底重塑。
刚刚,理论计算机年度大奖——2025年哥德尔奖揭晓!康奈尔大学副教授Eshan Chattopadhyay与导师David Zuckerman荣获此奖。
虎嗅从多个独立信源获悉,半年前,某DeepSeek核心高管已悄然离职创业,并将于2025年圣诞节前后发布Agent产品。有信源告诉虎嗅,该高管系原DeepSeek CTO。
大模型目前的主导地位只是暂时的,在未来五年甚至十年内都不会是技术前沿。 这是新晋图灵奖得主、强化学习之父Richard Sutton对未来的最新预测。