
给Transformer降降秩,移除特定层90%以上组件LLM性能不减
给Transformer降降秩,移除特定层90%以上组件LLM性能不减MIT、微软联合研究:不需要额外训练,也能增强大语言模型的任务性能并降低其大小。
MIT、微软联合研究:不需要额外训练,也能增强大语言模型的任务性能并降低其大小。
游戏行业真在加速拥抱大语言模型等AI技术,不论是大厂还是独立游戏制作人,都开始依靠LLM的技术创立全新的AI NPC体验。
微软发福利,DALL-E 3可以和手机键盘绑定了!键盘区秒变生图区,在任何APP中都能使用。
小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4,而所花成本还不到三分之一。
对海外AI业务依赖于国外厂商API的字节而言,微软的态度将至关重要。
OpenAI GPT-4.5 遭泄露,我们即将见识「加强版」多模态大模型
毋庸置疑,2023 年科技行业最重要的产品技术突破都来自大模型和生成式 AI 技术,上到各国政要精英,下到普通网友都见识到了大模型带来的突破性改变。年初,微软创始人比尔·盖茨在接受德国商报采访时就感慨:
本文讲述了一场拍卖会在AI领域引起的巨头间的人才争夺战,以及这场拍卖对科技巨头在人工智能领域的影响。一家在会议前紧急成立的公司以4400万美元的高价被拍卖,吸引了谷歌、微软、DeepMind和百度等巨头参与竞拍
教大模型调用工具,已经是AI圈关注度最高的话题之一了。这不,又有一项研究登上最新NeurIPS 2023——它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。
上个月,微软 CEO 纳德拉在 Ignite 大会上宣布自研小尺寸模型 Phi-2 将完全开源,在常识推理、语言理解和逻辑推理方面的性能显著改进。