AI资讯新闻榜单内容搜索-GPT-3

谷歌2024新年目标曝光：一边做地表最强AI，一边裁更多员工

外媒曝出谷歌2024年公司目标：做全球最强AI，同时要再裁更多的员工。网友吐槽，CEO拿巨额工资，产品无故取消，却只知道开人。

来自主题: AI技术研报

6650 点击 2024-01-22 15:14

开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了

从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5，因此它也被认为是一种「非常接近 GPT-4」的开源选项。

来自主题: AI技术研报

8187 点击 2024-01-16 14:18

“存算一体”是大模型AI芯片的破局关键？

近年来，随着Transformer模型的大规模发展和应用，模型大小每两年平均增长240倍，GPT-3等大模型的参数增长已经超过了GPU内存的增长。在大算力激增的需求下，越来越多行业人士认识到，新的计算架构或许才是算力破局的关键。

来自主题: AI资讯

10609 点击 2024-01-09 09:14

一年过去了，国产大模型怎样了？

ChatGPT-3.5 发布于 2023 年 3 月 1 日，短短一年内，AI 已经变成几乎所有科技公司都关注的话题，并且涌现了不少大模型。

来自主题: AI资讯

7799 点击 2024-01-05 10:48

谷歌Gemini大逆转？斯坦福Meta华人证明其推理性能强于GPT-3.5

谷歌放出的Gemini，在对标GPT的道路上似乎一直处于劣势，Gemini真的比GPT-4弱吗？最近，斯坦福和Meta的学者发文为Gemini正名。

来自主题: AI资讯

6455 点击 2024-01-02 15:35

CMU权威对比Gemini，GPT-3和Mistral8×7B！GPT-3.5依旧拿捏Gemini，开源模型差距依然不小

谷歌发布Gemini以后，一直宣称Gemini Pro要优于GPT-3.5，而CMU的研究人员通过自己实测，给大家来了一个客观中立第三方的对比。结果却是GPT-3.5几乎还是全面优于Gemini Pro，不过双方差距不大。

来自主题: AI资讯

10028 点击 2023-12-24 16:06

开源+共训，双轮驱动基础大模型创新普惠｜浪潮信息吴韶华@MEET2024

相比GPT-3，GPT-4 （包括GPT-3.5）的能力有了非常巨大的进步。这背后其实得益于一个很重要的过程引入：微调。

来自主题: AI资讯

6518 点击 2023-12-21 14:42

暴打GPT-3.5，谷歌Gemini大杀器官宣免费用！最强代码生成工具上线支持20+语言

Gemini Pro API今天上线即免费，开发者可以通过Vertex AI定制自己的Gemini。同时，Gemini也将支持谷歌的AI代码助手——Duet AI。

来自主题: AI资讯

7271 点击 2023-12-14 17:13

开源大模型超越GPT-3.5！爆火MoE实测结果出炉，网友：OpenAI越来越没护城河了

一条神秘磁力链接引爆整个AI圈，现在，正式测评结果终于来了：首个开源MoE大模型Mixtral 8x7B，已经达到甚至超越了Llama 2 70B和GPT-3.5的水平。

来自主题: AI资讯

5520 点击 2023-12-12 15:59

矩阵模拟！Transformer大模型3D可视化，GPT-3、Nano-GPT每一层清晰可见

Transformer大模型工作原理究竟是什么样的？一位软件工程师打开了大模型的矩阵世界。黑客帝国中，「矩阵模拟」的世界或许真的存在。

来自主题: AI资讯

8930 点击 2023-12-04 18:48

AI资讯新闻榜单内容搜索-GPT-3

谷歌2024新年目标曝光：一边做地表最强AI，一边裁更多员工

开源模型新纪录：超越Mixtral 8x7B Instruct的模型来了

“存算一体”是大模型AI芯片的破局关键？

一年过去了，国产大模型怎样了？

谷歌Gemini大逆转？斯坦福Meta华人证明其推理性能强于GPT-3.5

CMU权威对比Gemini，GPT-3和Mistral8×7B！GPT-3.5依旧拿捏Gemini，开源模型差距依然不小

开源+共训，双轮驱动基础大模型创新普惠 ｜浪潮信息吴韶华@MEET2024

暴打GPT-3.5，谷歌Gemini大杀器官宣免费用！最强代码生成工具上线支持20+语言

开源大模型超越GPT-3.5！爆火MoE实测结果出炉，网友：OpenAI越来越没护城河了

矩阵模拟！Transformer大模型3D可视化，GPT-3、Nano-GPT每一层清晰可见

开源+共训，双轮驱动基础大模型创新普惠｜浪潮信息吴韶华@MEET2024