中国大模型在迪拜卷起来了
中国大模型在迪拜卷起来了在全球最著名的科技峰会之一GITEX上,我们见到了来自中国的大模型,他们分别来自华为、腾讯、智谱AI、科大讯飞以及Soul App,在全球市场都在积极拥抱AI热潮的当下,他们已经率先掀起了中东淘金热。
在全球最著名的科技峰会之一GITEX上,我们见到了来自中国的大模型,他们分别来自华为、腾讯、智谱AI、科大讯飞以及Soul App,在全球市场都在积极拥抱AI热潮的当下,他们已经率先掀起了中东淘金热。
智谱对OpenAI的追赶,至少持续了4年。这是人工智能大模型爆发的4年。
实测大模型情感陪伴类赛道
把《我的世界》交给大模型,会怎么样?
视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集,名为 LLaVA-Video-178K。
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍! 清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。 MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。
内存占用小,训练表现也要好……大模型训练成功实现二者兼得。 来自北理、北大和港中文MMLab的研究团队提出了一种满足低秩约束的大模型全秩训练框架——Fira,成功打破了传统低秩方法中内存占用与训练表现的“非此即彼”僵局。
简单高效的大模型检索增强系统LightRAG,香港大学黄超团队最新研究成果。 开源两周时间在GitHub上获得将近5k标星,并登上趋势榜。
2022年诞生的ChatGPT,已经在相当程度上实现了大模型的Scaling law(尺度定律)和通用能力涌现。