AI资讯新闻榜单内容搜索-Llama3-8B

Z Tech｜独家解读Meta朱泽园开源新基线，用10%算力跑赢Llama3-8B，科学方法引领新范式，语言模型物理学迈入新时代

《Physics of Language Models（语言模型物理学）》，正是将AI研究带入“物理学范式”的项目，由Meta FAIR研究院的朱泽园概念化发起，并统筹设计。

来自主题: AI资讯

8004 点击 2025-08-02 14:04

Llama3-8B秒杀700亿巨兽？北大博士生等全新「BoT」框架推理暴涨70倍，24点图形推理一步成神

24点游戏、几何图形、一步将死问题，这些推理密集型任务，难倒了一片大模型，怎么破？北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法，用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下，竟多次超越Llama3-70B！

来自主题: AI技术研报

10588 点击 2024-06-08 20:15

Unsloth x Qwen2，提速47.32%，节省39.13%显存，最少仅需8.43GB显存

在上一篇文章「Unsloth微调Llama3-8B，提速44.35%，节省42.58%显存，最少仅需7.75GB显存」中，我们介绍了Unsloth，这是一个大模型训练加速和显存高效的训练框架，我们已将其整合到Firefly训练框架中，并且对Llama3-8B的训练进行了测试，Unsloth可大幅提升训练速度和减少显存占用。

来自主题: AI技术研报

5998 点击 2024-05-08 12:21