AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

比Stable Diffusion便宜118倍！1890美元训出11.6亿参数高质量文生图模型

比Stable Diffusion便宜118倍！1890美元训出11.6亿参数高质量文生图模型

比Stable Diffusion便宜118倍！1890美元训出11.6亿参数高质量文生图模型

近日，来自加州大学尔湾分校等机构的研究人员，利用延迟掩蔽、MoE、分层扩展等策略，将扩散模型的训练成本降到了1890美元。

来自主题: AI资讯

8521 点击 2024-08-12 17:11

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

跨GPU的注意力并行，最高提速8倍，支持512万序列长度推理。

来自主题: AI技术研报

9252 点击 2024-08-12 13:50

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

2017 年，谷歌在论文《Attention is all you need》中提出了 Transformer，成为了深度学习领域的重大突破。该论文的引用数已经将近 13 万，后来的 GPT 家族所有模型也都是基于 Transformer 架构，可见其影响之广。作为一种神经网络架构，Transformer 在从文本到视觉的多样任务中广受欢迎，尤其是在当前火热的 AI 聊天机器人领域。

来自主题: AI资讯

7670 点击 2024-08-11 17:38

30秒生成建模师级Mesh！最大可生成面数提升至1600，GitHub揽星1.9k项目发布V2版本

30秒生成建模师级Mesh！最大可生成面数提升至1600，GitHub揽星1.9k项目发布V2版本

30秒生成建模师级Mesh！最大可生成面数提升至1600，GitHub揽星1.9k项目发布V2版本

只需30秒，AI就能像3D建模师一样，在各种指示下生成高质量人造Mesh。

来自主题: AI资讯

10485 点击 2024-08-11 17:21

让AI管理大型代码库，开发者福音来了 | 阿里/新加坡国立/西安交大联合出品

让AI管理大型代码库，开发者福音来了 | 阿里/新加坡国立/西安交大联合出品

让AI管理大型代码库，开发者福音来了 | 阿里/新加坡国立/西安交大联合出品

代码生成和补全任务做不完了？！

来自主题: AI资讯

9917 点击 2024-08-11 17:18

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

两个AI关小黑屋：Llama3.1把Claude Opus聊自闭了

把Llama 3.1 405B和Claude 3超大杯Opus双双送进小黑屋，你猜怎么着——

来自主题: AI资讯

9773 点击 2024-08-11 17:16

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

在过去的几年中，大型语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了突破性的进展。这些模型不仅能够理解复杂的语境，还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报

9938 点击 2024-08-11 13:25

给视频模型安上快慢两只眼睛，苹果免训练新方法秒了一切SOTA

给视频模型安上快慢两只眼睛，苹果免训练新方法秒了一切SOTA

给视频模型安上快慢两只眼睛，苹果免训练新方法秒了一切SOTA

自从 Sora 发布以来，AI 视频生成领域变得更加「热闹」了起来。过去几个月，我们见证了即梦、Runway Gen-3、Luma AI、快手可灵轮番炸场。

来自主题: AI技术研报

10040 点击 2024-08-11 13:18

科学家Yann LeCun：聊聊大模型如何思考与深度学习

科学家Yann LeCun：聊聊大模型如何思考与深度学习

科学家Yann LeCun：聊聊大模型如何思考与深度学习

大模型发展究竟由工程还是科学驱动？

来自主题: AI资讯

8261 点击 2024-08-11 11:04

上海交大林云：揭秘大模型的可解释性与透明度，AI 编程的未来在这里

上海交大林云：揭秘大模型的可解释性与透明度，AI 编程的未来在这里

上海交大林云：揭秘大模型的可解释性与透明度，AI 编程的未来在这里

在软件开发的世界里，代码的生成、编辑、测试和调试一直是核心活动。

来自主题: AI资讯

3592 点击 2024-08-11 10:58

上一页当前第292页,共347页下一页