Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文
Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文【新智元导读】52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
搜索
【新智元导读】52B的生产级Mamba大模型来了!这个超强变体Jamba刚刚打破世界纪录,它能正面硬刚Transformer,256K超长上下文窗口,吞吐量提升3倍,权重免费下载。
【新智元导读】马斯克「搞笑」模型刚刚升级到Grok-1.5,推理性能暴涨,支持128k长上下文。最重要的是,Grok-1.5的数学和代码能力大幅提升。
【新智元导读】Stability AI在大佬出走后似乎并未受到影响,最近又官宣了新的代码模型Stable Code Instruct 3B,在之前的基础上更进一步,干掉了所有同级竞品,甚至能和7B、15B的模型掰手腕。
在生成式人工智能(Generative AI)的信息技术跃迁背景下,如何看待知乎当下和未来,有三个基本的视角:
【新智元导读】从今天起,千元级就能解锁专属大模型了!这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒,可以轻松实现百亿级参数多模态大模型的推理+微调。各种碎片化长尾算法,直接秒级生成!
【新智元导读】过去25年,半导体工艺制程不断逼近极限,才有了ChatGPT的诞生。如今世界最强英伟达GPU已有超2080亿个晶体管。台积电大佬预测,未来十年,1万亿晶体管GPU将问世。
一张照片 + 一段视频,就能让照片活起来!
DeepMind 这篇论文一出,人类标注者的饭碗也要被砸了吗?
马斯克搞大模型,速度也奇快。
Mamba时代来了?
大模型技术革命爆发一年多,对大众来说,大模型神秘的样子逐渐清晰,AI 创业也从兴奋期慢慢开始务实。
随着现代医学的进步,机器人辅助手术技术日益成为业界焦点。手术机器人不仅提升了手术的精準度,也為为疗专业人员及患者带来了更优质的治疗经验
当我们感慨 AI 快把人类一锅端了时,有大聪明发现了 AI 的一生之敌——弱智吧。
中美AI投资和创业,有很大不同。
什么AI导演?明明就是个AI傀儡
过去一年,从通用大模型的爆发性成长,再到垂直行业大模型与场景化应用的深度融合,人工智能正以前所未有的速度影响甚至改变世界。
8年未见马拉松,但时间到了2024年,hacker house的意义我们找到了。
“最强”开源大模型之争,又有新王入局:
近年来,人工智能发展迅速,尤其是像ChatGPT这样的基础大模型,在对话、上下文理解和代码生成等方面表现出色,能够为多种任务提供解决方案。
好家伙,现在随便打开一个大模型应用,支持的文本都有那————么长。
验证 GenAI 的商业价值,成为新老 Players 的共同课题。
谷歌就此成为了第一家因为训练数据而被罚款的人工智能公司。
Kimi的难题是商业模式,大厂的难题是获客。
【新智元导读】近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,只需一张照片,和一段音频,就能直接生成人物说话的视频!
【新智元导读】Claude 3在通用任务上是全球最强已经毋庸置疑。更令人惊叹的是,它在专业领域的表现,比如化学任务,也能远远领先GPT-4。
【新智元导读】OpenAI给开发者分钱了!就在刚刚,OpenAI宣布GPT将「货币化」,所有美国开发者都可以得到收入分成,具体细节还在摸索。开发者欢呼:爱死OpenAI了!
【新智元导读】就在刚刚,全球最强开源大模型王座易主,创业公司Databricks发布的DBRX,超越了Llama 2、Mixtral和Grok-1。MoE又立大功!这个过程只用了2个月,1000万美元,和3100块H100。
建设大学 AI 专业,大力投入产业发展,现在成效已逐渐显现。
扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如雨后春笋般涌现,进一步丰富了生成式 AI 的应用前景。然而,当前的扩散模型在理论上并非完美,鲜有研究关注到采样时间端点处未定义的奇点问题。此外,奇点问题在应用中导致的平均灰度等影响生成图像质量的问题也一直未得到解决。
AI 的发展让很多人直呼饭碗被抢了,以前是艺术家、程序员…… 现在配音员也要失业了?前有女歌星霉霉(泰勒・斯威夫特)大秀中文、小品演员蔡明在吐槽大会上说英文。现在又一款配音研究走红,即来自人工智能视频制作平台 Pipio 的视频自动 AI 配音工具 Pipio。