AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择

谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择

谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择

JAX在最近的基准测试中的性能已经不声不响地超过了Pytorch和TensorFlow,也许未来会有更多的大模型诞生在这个平台上。谷歌在背后的默默付出终于得到了回报。

来自主题: AI资讯
7775 点击    2024-04-01 19:01
ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练

随着生成模型(如 ChatGPT、扩散模型)飞速发展,一方面,生成数据质量越来越高,到了以假乱真的程度;另一方面,随着模型越来越大,也使得人类世界的真实数据即将枯竭。

来自主题: AI技术研报
12074 点击    2024-04-01 15:53
AI行业买英伟达GPU,花的钱比赚的多17倍

AI行业买英伟达GPU,花的钱比赚的多17倍

AI行业买英伟达GPU,花的钱比赚的多17倍

搞 AI 大模型,实在太烧钱了。我们知道,如今的生成式 AI 有很大一部分是资本游戏,科技巨头利用自身强大的算力和数据占据领先位置,并正在使用先进 GPU 的并行算力将其推广落地。这么做的代价是什么?最近《华尔街日报》一篇有关明星创业公司的报道里给出了答案:投入是产出的 17 倍。

来自主题: AI技术研报
11030 点击    2024-04-01 15:22
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

CLIP长文本能力被解锁,图像检索任务表现显著提升!一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。

来自主题: AI技术研报
10050 点击    2024-04-01 11:26
代码 | 清华Relay Diffusion:任意不同分辨率间无缝衔接,减少了训练和采样的成本

代码 | 清华Relay Diffusion:任意不同分辨率间无缝衔接,减少了训练和采样的成本

代码 | 清华Relay Diffusion:任意不同分辨率间无缝衔接,减少了训练和采样的成本

始智AI wisemodel.cn社区将打造成huggingface之外最活跃的中立开放的AI开源社区。欢迎《加入wisemodel社区志愿者团队》以及《欢迎加入wisemodel开源共创计划》。

来自主题: AI资讯
10781 点击    2024-04-01 11:19
张鹏对谈安克阳萌:GPU+Transformer 不是最终状态,大模型会催生新的硬件机会

张鹏对谈安克阳萌:GPU+Transformer 不是最终状态,大模型会催生新的硬件机会

张鹏对谈安克阳萌:GPU+Transformer 不是最终状态,大模型会催生新的硬件机会

安克经常被国人认为是一家充电宝公司,但其实是个做细分品类的公司,充电宝收入只占他们收入的 10% 不到。2022 年,安克营收 20 亿美元,在充电和储能、影音设备、智能家居三个领域里,不少细分品类都做到了全球第一梯队。

来自主题: AI资讯
9577 点击    2024-03-31 13:28
比人类便宜20倍!谷歌DeepMind推出「超人」AI系统

比人类便宜20倍!谷歌DeepMind推出「超人」AI系统

比人类便宜20倍!谷歌DeepMind推出「超人」AI系统

【新智元导读】大模型的幻觉问题怎么解?谷歌DeepMind:用AI来做同行评审!事实核验正确率超过人类,而且便宜20倍。

来自主题: AI技术研报
8395 点击    2024-03-30 14:45
Mamba架构第一次做大!混合Transformer,打败Transformer

Mamba架构第一次做大!混合Transformer,打败Transformer

Mamba架构第一次做大!混合Transformer,打败Transformer

精彩精彩,第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数,还是Mamba+Transformer混合架构。 它的名字叫Jamba。

来自主题: AI技术研报
7692 点击    2024-03-30 14:01