AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰

没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰

没有指数级数据就没有Zero-shot!生成式AI或已到达顶峰

近日,又一惊人结论登上Hacker News热榜:没有指数级数据,就没有Zero-shot!多模态模型被扒实际上没有什么泛化能力,生成式AI的未来面临严峻挑战。

来自主题: AI技术研报
9973 点击    2024-05-21 15:27
250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞

250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞

250行代码从头搭建Llama 3,GitHub一天4.6k星!Karpathy大赞

Llama 3发布一个月后,一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目,引起了开源社区的广泛关注。代码非常详细地展现了Llama所使用的Transformer架构,甚至让Andrej Karpathy亲自下场「背书」。

来自主题: AI技术研报
10085 点击    2024-05-21 15:20
SpaceX、人工智能与苏联:举国模式在美国的胜利

SpaceX、人工智能与苏联:举国模式在美国的胜利

SpaceX、人工智能与苏联:举国模式在美国的胜利

2023年3月的一天,美国政府的科技政策顾问Arati Prabhakar带着一台笔记本电脑走进了白宫的椭圆形办公室,向80岁的总统拜登展示了如何使用ChatGPT。

来自主题: AI技术研报
9164 点击    2024-05-21 09:20
LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究

大数据巨头Databricks与哥伦比亚大学最新研究发现,在数学和编程任务上,LoRA干不过全量微调。

来自主题: AI技术研报
2954 点击    2024-05-20 21:03
让大模型理解手机屏幕,苹果多模态Ferret-UI用自然语言操控手机

让大模型理解手机屏幕,苹果多模态Ferret-UI用自然语言操控手机

让大模型理解手机屏幕,苹果多模态Ferret-UI用自然语言操控手机

此次,苹果提出的多模态大语言模型(MLLM) Ferret-UI ,专门针对移动用户界面(UI)屏幕的理解进行了优化,其具备引用、定位和推理能力。

来自主题: AI技术研报
5744 点击    2024-05-20 18:56
为了摸鱼,我用AI做了一次财报分析

为了摸鱼,我用AI做了一次财报分析

为了摸鱼,我用AI做了一次财报分析

为了能让自己以后更好地摸鱼,我上周第一次和大模型协作,完成了对一份财报的分析。

来自主题: AI技术研报
10557 点击    2024-05-20 16:51
AI内存瓶颈(上):3D NAND路线图

AI内存瓶颈(上):3D NAND路线图

AI内存瓶颈(上):3D NAND路线图

随着AI带来的算力需求大爆发,以半导体为代表的各类硬件企业的营收也纷纷水涨船高。

来自主题: AI技术研报
8258 点击    2024-05-20 16:41
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸

众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸

众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸

最公平的大模型基准测试诞生了!来自LLM竞技场,最接近人类偏好,数据新鲜、速度快、成本低,严格分离学渣和学霸。

来自主题: AI技术研报
10520 点击    2024-05-20 16:20
时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3

5月14日,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇宙将会迎来新的霸主吗?

来自主题: AI技术研报
10188 点击    2024-05-20 16:14
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory

前几天,普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型,论文提出构建完全可微的MoE模型,是一种预训练自回归语言模型的新方法。

来自主题: AI技术研报
9994 点击    2024-05-20 16:10
谷歌数学版Gemini破解奥赛难题,堪比人类数学家!

谷歌数学版Gemini破解奥赛难题,堪比人类数学家!

谷歌数学版Gemini破解奥赛难题,堪比人类数学家!

I/O大会上,谷歌Gemini 1.5 Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5 Pro性能碾压GPT-4 Turbo、Claude 3 Opus,成为全球最强的数学模型。

来自主题: AI技术研报
10188 点击    2024-05-20 16:04
多功能RNA分析,百度团队基于Transformer的RNA语言模型登Nature子刊

多功能RNA分析,百度团队基于Transformer的RNA语言模型登Nature子刊

多功能RNA分析,百度团队基于Transformer的RNA语言模型登Nature子刊

预训练语言模型在分析核苷酸序列方面显示出了良好的前景,但使用单个预训练权重集在不同任务中表现出色的多功能模型仍然存在挑战。

来自主题: AI技术研报
9718 点击    2024-05-19 16:29
对打GPT-4!Claude 3秘密武器曝光:Claude宪法

对打GPT-4!Claude 3秘密武器曝光:Claude宪法

对打GPT-4!Claude 3秘密武器曝光:Claude宪法

Anthropic发布最新Claude宪法,兼具标准性和灵活性。语言模型如何决定它将涉及哪些问题,哪些问题它认为不合适涉及?为什么它会鼓励某些行为,而阻止另一些行为?语言模型有哪些「价值观」?

来自主题: AI技术研报
8563 点击    2024-05-19 16:07
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4

GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4

GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4

OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一,而且有很多发布会从未提及的惊艳功能。

来自主题: AI技术研报
8660 点击    2024-05-19 16:01
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA

Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA

Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA

GPT-4o发布不到一周,首个敢于挑战王者的新模型诞生!最近,Meta团队发布了「混合模态」Chameleon,可以在单一神经网络无缝处理文本和图像。10万亿token训练的34B参数模型性能接近GPT-4V,刷新SOTA。

来自主题: AI技术研报
9180 点击    2024-05-19 15:48
Llama 3加持,用户实测Meta AI还是弱爆了!小扎弯道超车的策略竟是「免费+不限量」?

Llama 3加持,用户实测Meta AI还是弱爆了!小扎弯道超车的策略竟是「免费+不限量」?

Llama 3加持,用户实测Meta AI还是弱爆了!小扎弯道超车的策略竟是「免费+不限量」?

Llama 3开源后,聊天机器人Meta AI也宣布使用新模型作为基座,在Meta旗下的各种软件(Meta.ai、Instagram、Facebook、WhatsApp)中都可以进行免费体验。

来自主题: AI技术研报
10186 点击    2024-05-18 17:51
AI 产品出海不止 PH,Hacker News 产品发布全攻略

AI 产品出海不止 PH,Hacker News 产品发布全攻略

AI 产品出海不止 PH,Hacker News 产品发布全攻略

如今出海浪潮基本上席卷了整个互联网,Product Hunt 已经成为众多海外产品发布的首选。公众号「深思圈」作者曾经写过一篇关于 Product Hunt 产品发布全攻略的文章,如今 Product Hunt 已经发生了很多变化

来自主题: AI技术研报
8835 点击    2024-05-18 11:26
HuggingFace教你怎样做出SOTA视觉模型

HuggingFace教你怎样做出SOTA视觉模型

HuggingFace教你怎样做出SOTA视觉模型

前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。

来自主题: AI技术研报
10577 点击    2024-05-17 17:49
引爆整个AI圈的神经网络架构KAN,究竟是啥?

引爆整个AI圈的神经网络架构KAN,究竟是啥?

引爆整个AI圈的神经网络架构KAN,究竟是啥?

最近一周KAN的热度逐渐褪去,正好静下心来仔细学习KAN的原理,收获颇多。

来自主题: AI技术研报
10120 点击    2024-05-17 12:57
用GAI定义手机,联发科和朋友们在行动

用GAI定义手机,联发科和朋友们在行动

用GAI定义手机,联发科和朋友们在行动

最近一段时间,端侧生成式 AI 上游的「军备竞赛」异常激烈。

来自主题: AI技术研报
8966 点击    2024-05-16 17:30