英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大
英伟达新对话QA模型准确度超GPT-4,却遭吐槽:无权重代码意义不大昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天,英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下,在 10 个对话 QA 数据集上的平均得分略胜于 GPT-4。
昨天,Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,从而在 Llama 2 70B 的迭代微调后超越了 GPT-4。今天,英伟达的全新对话 QA 模型「ChatQA-70B」在不使用任何 GPT 模型数据的情况下,在 10 个对话 QA 数据集上的平均得分略胜于 GPT-4。
谷歌CEO劈柴在公开信中承认:谷歌的裁员计划还要持续一整年,还有更多岗位会被淘汰,且持续一整年。根据Layoffs数据,开年不到一个月,科技公司总共已裁掉7,785名员工。AI真来淘汰人类了?
Mixtral 8x7B模型开源后,AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B,在主流基准测试中击败了Mixtral Instruct。
不得不说,现在拍写真真是“简单到放肆”了。真人不用出镜,不用费心凹姿势、搞发型,只需一张本人图像,等待几秒钟,就能获得7种完全不同风格:
1月17日,新一代大语言模型书⽣·浦语2.0(InternLM2)正式发布并开源。2种参数规格、3种模型版本,共计6个模型,全部免费可商用。
ICLR 2024录用结果出来了。一年一度的ICLR顶会录用结果公布了!今年共7000多篇投稿论文,录用率31%。
今天,Stability AI发布了Stable Code 3B,在图片生成之外的战场上,Stability也开始发力了
最近几年,有多款备受瞩目的大作遭遇滑铁卢,其实也多少与开发过程中项目管理失控有着密切的关系,比如CDPR的《赛博朋克2077》、Bethesda的《星空》。
Open Interpreter 允许LLM在您的计算机上运行代码来完成任务。这可能是人类使用电脑的新方式,一句人话,电脑开始帮人类完成任务。
从 Llama、Llama 2 到 Mixtral 8x7B,开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。