AI资讯新闻榜单内容搜索-模型训练

“大海捞针”out！“数星星”成测长文本能力更精准方法，来自鹅厂

大模型长文本能力测试，又有新方法了！

来自主题: AI技术研报

9967 点击 2024-04-02 11:36

JAX在最近的基准测试中的性能已经不声不响地超过了Pytorch和TensorFlow，也许未来会有更多的大模型诞生在这个平台上。谷歌在背后的默默付出终于得到了回报。

来自主题: AI资讯

7775 点击 2024-04-01 19:01

随着生成模型（如 ChatGPT、扩散模型）飞速发展，一方面，生成数据质量越来越高，到了以假乱真的程度；另一方面，随着模型越来越大，也使得人类世界的真实数据即将枯竭。

来自主题: AI技术研报

12074 点击 2024-04-01 15:53

搞 AI 大模型，实在太烧钱了。我们知道，如今的生成式 AI 有很大一部分是资本游戏，科技巨头利用自身强大的算力和数据占据领先位置，并正在使用先进 GPU 的并行算力将其推广落地。这么做的代价是什么？最近《华尔街日报》一篇有关明星创业公司的报道里给出了答案：投入是产出的 17 倍。

来自主题: AI技术研报

11030 点击 2024-04-01 15:22

CLIP长文本能力被解锁，图像检索任务表现显著提升！一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。

来自主题: AI技术研报

10050 点击 2024-04-01 11:26

始智AI wisemodel.cn社区将打造成huggingface之外最活跃的中立开放的AI开源社区。欢迎《加入wisemodel社区志愿者团队》以及《欢迎加入wisemodel开源共创计划》。

来自主题: AI资讯

10781 点击 2024-04-01 11:19

首个AI软件工程师Devin正式亮相，立即引爆了整个技术界。

来自主题: AI技术研报

9526 点击 2024-03-31 14:25

安克经常被国人认为是一家充电宝公司，但其实是个做细分品类的公司，充电宝收入只占他们收入的 10% 不到。2022 年，安克营收 20 亿美元，在充电和储能、影音设备、智能家居三个领域里，不少细分品类都做到了全球第一梯队。

来自主题: AI资讯

9577 点击 2024-03-31 13:28

【新智元导读】大模型的幻觉问题怎么解？谷歌DeepMind：用AI来做同行评审！事实核验正确率超过人类，而且便宜20倍。

来自主题: AI技术研报

8395 点击 2024-03-30 14:45

精彩精彩，第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数，还是Mamba+Transformer混合架构。它的名字叫Jamba。

来自主题: AI技术研报

7692 点击 2024-03-30 14:01