实测“超越GPT-4”的百川超千亿参数模型:医疗问答业内最强?
实测“超越GPT-4”的百川超千亿参数模型:医疗问答业内最强?百川智能又对产品进行了一次大更新,发布了Baichuan 3模型。这次更新后,在多个权威通用能力评测CMMLU、GAOKAO和AGI-Eval中,其英文能力已经逼近 GPT-4,在中文任务表现上甚至超越了GPT-4:
搜索
百川智能又对产品进行了一次大更新,发布了Baichuan 3模型。这次更新后,在多个权威通用能力评测CMMLU、GAOKAO和AGI-Eval中,其英文能力已经逼近 GPT-4,在中文任务表现上甚至超越了GPT-4:
Quora联合创始人兼首席执行官Adam D'Angelo发文宣布,已从硅谷风投巨擘Andreessen Horowitz 处筹集7500万美元。这笔资金将用于加速公司AI 聊天平台Poe的发展,其中大部分会投入支持AI开发者的创作货币化。
人工智能可以帮助求职者找到工作,以及帮助雇主更快、更有效地填补空缺职位。
在1月24日举办的腾讯科技向善创新节2024“大模型安全与伦理专题论坛”上,腾讯发布了大模型安全白皮书《大模型安全与伦理研究报告2024:以负责任AI引领大模型创新》,并邀请业界专家进行圆桌研讨。
不久前在CES 2024上亮相的智能终端Rabbit R1,由于首批1万台很快售罄、两周超过5万台的市场表现,曾引发了外界的众多关注。但就在日前,有提前试用了Rabbit R1的用户吐槽了这款产品实际表现,认为其响应时间过慢,或并不适合AI设备的未来趋势,甚至有观点认为其完全可以被一个App所替代。
AI绘画技术在美术行业的发展不会因为真人画师的反对而停止。
使用LLM生成海量任务的文本数据,无需人工标注即可大幅提升文本嵌入的适用度,只需1000训练步即可轻松扩展到100种语言。
大模型幻觉问题还有另一种解法?斯坦福联手OpenAI研究人员提出「元提示」新方法,能够让大模型成为全能「指挥家」,汇聚不同专家模型精华,让GPT-4的输出更精准。
Hugging Face上有一位机器学习大神,分享了如何从头开始建立一套完整的MoE系统。
一家名为GitClear的公司分析了近四年超过1.5亿行代码后发现,随着GitHub Copilot工具的加入,代码流失率(即代码写入后不久又被返工修改、删除的情况)出现了显著上升: 2023年为7.1%,而2020年时仅为3.3%,翻了一番。
发布了超千亿参数的最新版本大模型Baichuan 3,是百川智能基础模型第三代——就在20天前,这家由王小川创办的大模型公司,刚刚发布过角色大模型Baichuan-NPC。
无论是 Google 翻译、DeepL 翻译还是 ChatGPT,翻译大段英文的时候,“机翻感”(机器翻译的感觉)都很强,一看就是机器翻译的,很生硬,但是自己手动润色又太费时间。
在认知科学领域,人类通过持续学习改变认知的过程被称为认知迭代(Cognitive Dynamics)。形象地说,认知迭代就像是我们大脑的「软件更新」过程,手机应用通过不断的更新来修复 bug 和增加新功能,我们的大脑也通过不断学习新知识、经验,来改善和优化思考方式。
来了,贾扬清承诺的 Lepton Search 开源代码来了。
随着大型语言模型(LLM)技术日渐成熟,提示工程(Prompt Engineering)变得越来越重要。一些研究机构发布了 LLM 提示工程指南,包括微软、OpenAI 等等。
ChatGPT 掀起的通用人工智能热潮仍在快速向前,产业竞争关键要素日渐明确,中美在通用人工智能领域的竞争也进入更高的战略层面。
生成式AI为创始人提供了一个完全重塑工作流程的机会,并将催生一批新的公司,它们不仅仅是AI增强现有业务的公司,而且是完全AI原生公司。这些公司将利用我们现有的技术从零开始,围绕人工智能独有的生成、编辑和合成功能打造新产品。
这两年,随着 AI的爆发,AI社交产品变得越来越好用、有趣,因此很多年轻人愿意尝试AI社交软件。
这两天Steam上突然出现了一款爆火的现象级游戏《幻兽帕鲁(Palworld)》。发售没几天就直接冲到了Steam史上玩家在线排行榜第2,超过了CS2等一众经典老游戏。
美国计划限制中国客户使用美国云计算厂商的服务训练AI大模型,对中国人工智能产业造成潜在破坏。本文分析了中国科技行业追赶的三个因素。
如果语言模型是巫师,代码预训练就是魔杖!
ChatGPT打辅助拿下文学大奖!33岁日本作家Rie Kudan便用AI写的小说获得了日本顶级文学奖「芥川奖」。
谷歌Bard又行了?在第三方LLM「排位赛」排行榜上,Bard击败GPT-4成为第二名。Jeff Dean兴奋宣布:谷歌回来了!
最新科学大模型浦科化学(ChemLLM),发布即开源!
1 月 24 日,Nature Machine Intelligence 杂志在《Anniversary AI reflections》(周年人工智能反思)专题中,再次联系并采访了近期在期刊发表评论和观点文章的作者,请他们从各自所在领域中举例说明人工智能如何改变科学过程。
近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和推理能力的重要性更加突出。
前几天,OpenAI 来了一波重磅更新,一口气宣布了 5 个新模型,其中就包括两个新的文本嵌入模型。
借助强大多模态模型,开创全新的网络智能体 Hongliang He1,3∗, Wenlin Yao2, Kaixin Ma2, Wenhao Yu2, Yong Dai2, Hongming Zhang2, Zhenzhong Lan3, Dong Yu2 1 浙江大学,2 腾讯 AI 实验室,3 西湖大学
欢迎再次加入我们的“RAG 系统高级掌握”系列!我们将深入了解构建企业级 RAG (Retrieval-Augmented Generation) 系统的复杂世界。
“中国现在有数以百计的通用大模型,其中的90%没多大用处,也发展不起来,只会加剧资源和人力的浪费,应该被淘汰。”1月18日,在“北京CGT新势发布会”上,中国科学院院士、翊博生物首席科学家陈润生向经济观察网谈及他对国产大模型的看法。