连发4条推特!ChatGPT重磅更新!加入多模态能力,可以听语音、生成语音并理解图片
连发4条推特!ChatGPT重磅更新!加入多模态能力,可以听语音、生成语音并理解图片OpenAI刚刚连发4条推特,宣布了ChatGPT的重磅更新。ChatGPT支持多模态,目前已经支持语音的输入、语音的输出、理解图片的输入!不过目前似乎仅限于客户端~官方说的是未来2周内企业和Plus用户可以使用,后面会普及到其它用户!
OpenAI刚刚连发4条推特,宣布了ChatGPT的重磅更新。ChatGPT支持多模态,目前已经支持语音的输入、语音的输出、理解图片的输入!不过目前似乎仅限于客户端~官方说的是未来2周内企业和Plus用户可以使用,后面会普及到其它用户!
在18 项不同的任务中,使用ChatGPT-4 的咨询顾问平均多完成了 12.2% 的任务,完成任务的速度提高了 25.1%,成果质量提高了 40%。这项突破性的前沿研究表明,人工智能将在未来几年对职业工作产生巨大影响。研究者称,明年至少会有两家公司推出比 GPT-4 更强大的AI。
OpenAI作图神器DALL·E 3内测开启,网友纷纷上手实测后,感慨强到令人发指。文生图从此告别「提示词时代」?
“新·AI绘画细节控制大师”ControlNet-XS来啦!参数只要原始ControlNet的1%。 就能做到蛋糕口味随意切换
上海交大生成式人工智能研究组 (GAIR) 积极攻克难关,研发并开源了数学计算大模型 “阿贝尔(Abel)”,在多个榜单上取得开源第一!是首个海内外高校团队推出的 SOTA 数学开源大模型。
为了解决AutoGPT一旦运行起来就不受控制的痛点,并且调优 LLM Agent 的过程更简单更系统化,波形智能联合苏黎世联邦理工大学和浙江大学,开发了名为 Agents 的开源智能体框架。
AI生成比人类动手写画所排放的二氧化碳可少三个数量级!结论来自LeCun最新分享“非常因吹斯汀”的一篇论文:
FoleyGen利用现成的神经音频编解码器在波形和离散标记之间进行双向转换。音频标记的生成由单个变换器模型完成,该模型以从视觉编码器中提取的视觉特征为条件。
人工智能(AI)正在以前所未有的方式塑造科学领域。从加速研究过程到提出新的研究假设,AI 的加入为科学带来了巨大的潜力。
麻省理工学院计算机科学与人工智能实验室(CSAIL)研究团队发现,多个语言模型协同工作胜过单一模型,多个AI协作有助于提高大型语言模型的推理能力和事实准确性。
谷歌DeepMind的研究人员最近开发了一种技术,通过使用其他人工智能模型来改进提示词,进而提高 ChatGPT 等人工智能语言模型的数学能力
来自清华大学的研究团队提出了一个深度强化学习算法的模型。基于 15 分钟城市概念,该模型可以进行复杂的城市空间规划。
本文介绍了关于大模型prompt的最佳实践,包括学习路径、prompt的概念和技巧、以及OpenAI官方的最佳实践指南。
Wayve推出的LINGO-1,让自动驾驶长嘴了!这车该怎么开,它自个给自个解说,大语言模型,再也不是黑盒了。
就在最近,百川智能正式发布Baichuan 2系列开源大模型。作为开源领域性能最好的中文模型,在国内,Baichuan 2是要妥妥替代Llama 2了。
大规模语言模型在众多下游任务中展现了惊人的能力,但它们在使用中仍然暴露了一些问题。其中,幻觉是目前影响大模型落地的重要问题之一。
科学家们已经开发出一种人工智能(AI)工具,能够诊断和预测多种健康状况的患病风险,从眼部疾病到心力衰竭再到帕金森病,所有这些都可以根据人们的视网膜图像进行诊断和预测。
传说中的英伟达GH200在MLPerf 3.1中惊艳亮相,性能直接碾压H100,领先了17%。
全网最全!一篇文章来讲讲Midjourney的图片尺寸和在各种设备中显示效果的问题
近期,国际权威期刊《柳叶刀–数字医疗》(The Lancet Digital Health)发表了一项关于肝包虫病诊断的研究。该项研究由解放军总医院第五医学中心肿瘤医学部梁萍教授团队领衔,是国际首个基于超声图像,利用深度卷积神经网络模型(DCNN)对肝包虫病进行鉴别诊断的研究
研究证实Lunit人工智能将改变乳腺癌筛查方式,将有望取代看片子的放射科医生
谷歌DeepMind团队最新发现,用这个新“咒语”(Take a deep breath)结合大家已经熟悉的“一步一步地想”(Let’s think step by step),大模型在GSM8K数据集上的成绩就从71.8提高到80.2分。
ChatGPT拥有一些出色的图表制作个哦能。从直方图和热力图到词云或者网络图都可以无压力制作,下面我们来详细介绍下,如何通过chatGPT绘制数据表格。
一经发布,地表最强开源模型Falcon 180B直接霸榜HF。3.5万亿token训练,性能直接碾压Llama 2。
本文将对 LLM 的操作方式进行分类,以明确其边界,目标是以一种非专业人士可以理解的方式来解释 LLM 的现状,为Prompt初学的设计者提供简单的理论支撑。
谷歌团队的最新研究提出了,用大模型替代人类,进行偏好标注,也就是AI反馈强化学习(RLAIF)。
ChatGPT引发的大模型热潮愈演愈烈,全球科技巨头和明星初创争相入局,打造以AI大模型为核心的竞争力和多样化商业使用需求。
参数高效的微调方法SUR-adapter,可以增强text-to-image扩散模型理解关键词的能力。
世界最强AI——ChatGPT可以通过各种考试,甚至输出回答让人难以辨别真假。
一个简单的生成式人工智能工具可以在几毫秒内根据单句提示创建视频游戏地图、人物模型和表情符号。