AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
3天把Llama训成Mamba,性能不降,推理更快!

3天把Llama训成Mamba,性能不降,推理更快!

3天把Llama训成Mamba,性能不降,推理更快!

近日,Mamba方面又搞出了有意思的研究:来自康奈尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。

来自主题: AI技术研报
9131 点击    2024-09-05 15:31
大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

近年来,大模型在人工智能领域掀起了一场革命,各种文本、图像、多模态大模型层出不穷,已经深深地改变了人们的工作和生活方式。

来自主题: AI技术研报
9091 点击    2024-09-04 23:24
Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

论文的审稿模式想必大家都不会陌生,一篇论文除了分配多个评审,最后还将由PC综合评估各位审稿人的reviews撰写meta-review。

来自主题: AI技术研报
8111 点击    2024-09-04 23:07
AI数据告急,大厂盯上廉价年轻人

AI数据告急,大厂盯上廉价年轻人

AI数据告急,大厂盯上廉价年轻人

说好的AI给人类打工呢? 为了拿到新数据、训练AI大模型,字节等互联网大厂正在亲自下场,以单次300元不等的价格招募“AI录音员”,定制语料库。

来自主题: AI资讯
6731 点击    2024-09-04 09:57
34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

ChatGPT的出现引发了一场AI革命,它展示了通过简单对话就能完成各种任务的强大能力,并且将不同的 AI 功能整合到一个统一的平台上。还记得小编第一次使用 ChatGPT 的时候给我带来极大震撼。

来自主题: AI技术研报
8833 点击    2024-09-04 09:25
中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

中国首个拥有真正意义多任务连续泛化具身模型的机器人,诞生了!这个机器人,是真正由模型训练出来的,据了解,截止目前除了Figure 01,国内似乎还没有第二家能做到这种级别的泛化能力,即使被百般刁难,都能完成任务。清华校友下场创业,才4个月就已融资近2亿。

来自主题: AI资讯
10289 点击    2024-09-04 09:00
北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

单元测试是软件开发流程中的一个关键环节,主要用于验证软件中的最小可测试单元,函数或模块是否按预期工作。单元测试的目标是确保每个独立的代码片段都能正确执行其功能,对于提高软件质量和开发效率具有重要意义。

来自主题: AI技术研报
6812 点击    2024-09-03 16:22
KV Cache:图解大模型推理加速方法

KV Cache:图解大模型推理加速方法

KV Cache:图解大模型推理加速方法

KV Cache 是大模型推理性能优化的一个常用技术,该技术可以在不影响任何计算精度的前提下,通过空间换时间的思想,提高推理性能。

来自主题: AI资讯
9114 点击    2024-09-03 10:46