CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升
CMU&清华新作:让LLM自己合成数据来学习,特定任务性能同样大幅提升为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增强 Student Model 在特定任务上的性能。然而,这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下,如何持续迭代模型的能力,成为了亟待解决的问题。
搜索
为了解决这个问题,一些研究尝试通过强大的 Teacher Model 生成训练数据,来增强 Student Model 在特定任务上的性能。然而,这种方法在成本、可扩展性和法律合规性方面仍面临诸多挑战。在无法持续获得高质量人类监督信号的情况下,如何持续迭代模型的能力,成为了亟待解决的问题。
大厂AI竞赛
有 AI 在的科技圈,似乎没有中场休息。除了大模型发布不断,各家科技大厂也在寻找着第一个「杀手级」AI 应用的落脚之地。
效率革命,骚扰更便捷?
开放域检测领域,迎来新进展——
上线仅仅一天,GPT-4o的高级语音功能(Advanced Voice Mode)简直要被玩疯了。无数网友脑洞大开的疯狂测试,GPT-4o这边呢,不仅各种奇葩任务全盘接收,表现好到更是让不少人连连惊呼“Blow my mind”。
今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。
千亿参数规模的大模型推理,服务器仅用4颗CPU就能实现!
谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。
多模态对比学习(如CLIP)通过从互联网上抓取的数百万个图像-字幕对中学习,在零样本分类方面取得了显著进展。 然而,这种依赖带来了隐私风险,因为黑客可能会未经授权地利用图像-文本数据进行模型训练,其中可能包括个人和隐私敏感信息。
下个月,美国政府或将出台新规,加大对中国芯片企业获取半导体制造设备渠道的限制
英伟达股价这周又坐上了过山车。 截至周三收盘,英伟达股价大涨13%,市值暴增3290亿美元,再次刷新过去几个月自己创下的单日纪录。
“让每个人都能站在人工智能的肩膀上。”
直观、多模态、精准控制,三位一体实现视频精细化处理。
指望这一样批人老老实实给自己的作品打上标签,或许并不现实。
天下人苦PPT久矣。
趣丸科技推出多模态音乐生成工具天谱乐。
融到的钱,到底该如何花?
埃隆·马斯克掌控的那几家公司——包括SpaceX、特斯拉、xAI乃至X(原Twitter)——都需要大量的GPU,而且也都是为自己的特定AI或者高性能计算(HPC)项目服务。
AI笔记火了!
Agent的记忆实现和调用是提高Agent智能水平的关键。
赶在 7 月结束前,GPT-4o 语音功能终于开启。现开启灰度测试,一小部分 ChatGPT Plus 用户已经可以试用。
这波 AI 浪潮,90 后可以说是顶起了半边天。 月之暗面的杨植麟,智元机器人的彭志辉,Meshy 的胡渊鸣,面壁智能的曾国洋... 而在他们之中,有一位年龄更小,但实力丝毫不逊各位前辈的女将。
7 月,大模型公司 Cohere 宣布 D 轮融资 5 亿美元,估值 55 亿,比去年高了一倍多。 跟 OpenAI、Anthropic 甚至法国 AI 公司 Mistral 相比,成立于加拿大的 Cohere 略显低调,没有推出自己的 Chatbot、文生图或者文生视频产品,不涉足个人消费端产品;即使是推出的开源大模型 Command R+,似乎也没有那么引人注意。
最近一段时间开源大模型市场非常热闹,先是苹果开源了70亿参数小模型DCLM,然后是重量级的Meta的Llama 3.1 和Mistral Large 2相继开源,在多项基准测试中Llama 3.1超过了闭源SOTA模型。 不过开源派和闭源派之间的争论并没有停下来的迹象。
在 AI Pin、Rabbit R1 首发失利之后,AI 硬件又有新玩家了。 这次的硬件主打陪伴的情绪价值,帮用户对抗孤独。
7月31日,阿里通义宣布免费开放奥运AI大模型,具备奥运专业知识,并集合同声传译级别的中法互译功能。即日起,用户可以在通义APP免费使用。
智东西7月31日消息,根据顶级学术期刊《自然》(Nature)昨日报道,生成式AI在学术写作中的使用已迎来爆发式增长。相关研究显示生物医学领域最大数据库PubMed上10%的论文摘要都有AI写作嫌疑,相当于每年15万篇论文中都有AI的参与。
贝格迈思」分布式智能数据库AiSQL日前通过深交所测试。
这两天,Apple Intelligence 的上线成为了最大的科技新闻之一。