AI资讯新闻榜单内容搜索-Al

ICML 2024 Oral｜外部引导的深度聚类新范式

怎样才能将可爱又迷人的柯基与柴犬的图像进行区分？

来自主题: AI技术研报

9195 点击 2024-06-07 10:56

腾讯混元、北大发现Scaling law「浪涌现象」，解决学习率调参难题

过去十年间，基于随机梯度下降（SGD）的深度学习模型在许多领域都取得了极大的成功。与此同时各式各样的 SGD 替代品也如雨后春笋般涌现。在这些众多替代品中，Adam 及其变种最受追捧。无论是 SGD，还是 Adam，亦或是其他优化器，最核心的超参数非 Learning rate 莫属。因此如何调整好 Leanring rate 是炼丹师们从一开始就必学的技能。

来自主题: AI技术研报

8908 点击 2024-06-05 22:57

“Ilya究竟看到了什么？”泄密被OpenAI解雇的前员工长文爆料：2030年超级人工智能将至

OpenAI前员工Leopold Aschenbrenner，之前在超级对齐（Superalignment）部门，可是能和Ilya大佬共事的。

来自主题: AI技术研报

10283 点击 2024-06-05 17:50

从 ImageNet 到 AlexNet，李飞飞万字自述人工智能诞生的关键进程

要怎么介绍李飞飞？

来自主题: AI资讯

10486 点击 2024-06-05 17:33

Karpathy点赞，这份报告教你如何用 LLaMa 3创建高质量网络数据集

众所周知，对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说，构建高质量的网络规模数据集是非常重要的。然而，即使是最先进的开源 LLM 的预训练数据集也不公开，人们对其创建过程知之甚少。

来自主题: AI技术研报

10161 点击 2024-06-04 17:45

不同数据集有不同的Scaling law？而你可用一个压缩算法来预测它

一般而言，训练神经网络耗费的计算量越大，其性能就越好。在扩大计算规模时，必须要做个决定：是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。

来自主题: AI技术研报

7176 点击 2024-06-03 17:55

对话田渊栋：Scaling law代表一个非常悲观的未来

Scaling law发展到最后，可能每个人都站在一个数据孤岛上。

来自主题: AI资讯

8578 点击 2024-06-03 17:23

活体脑细胞做成16核芯片，用Python就能编程，9个机构开展实验36所大学排队

首个“脑PU”来了！由“16核”类人脑器官（human brain organoids）组成。

来自主题: AI技术研报

10263 点击 2024-06-03 11:12

Neuralink劲敌破纪录，4096个电极微创植入人脑！脑机接口有望进入「5G」时代

在脑机接口领域取得突破性进展的公司不止Neuralink一家。Precision Neuroscience发布公告称，他们采用与Neuralink不同的技术路径，在人脑上成功放置了4096个电极，打破了去年2048个电极的最高纪录。

来自主题: AI资讯

9907 点击 2024-06-03 10:56

开源模型进展盘点：最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好？

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察，也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中，他盘点分析了 4 月份发布的四个主要新模型：Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。

来自主题: AI技术研报

10711 点击 2024-06-02 14:42