
普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估
普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。
自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。
在科研领域,AI 似乎将成为一支不可忽视的力量,去年年末,AI 甚至开始和真人平起平坐,荣获 Nature 大奖。
人工智能的反馈(AIF)要代替 RLHF 了?
多模态大模型GPT-4V也会「有眼无珠」。UC San Diego纽约大学研究人员提出全新V*视觉搜索算法逆转LLM弱视觉宿命。
靠着AI创建的网站,就能月入过万?而且……自从网站建好后就再也没碰过?
据彭博社消息,奥特曼再次为一家人工智能芯片企业筹集数十亿美元。目的是利用这笔资金开发一个“工厂网络”(network of factories),用于制造,该网络将延伸到全球,并涉及与未透露名字的“顶级芯片制造商”合作。
要说今年“科技春晚”CES上最吸引眼球的是什么,智能车当属其一。
Mixtral 8x7B模型开源后,AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B,在主流基准测试中击败了Mixtral Instruct。
今天,小扎正式宣战「开源AGI」!下一代大模型Llama 3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。
GPT Store敲响了大模型的App Store时刻