又来3款,字节加速探索AI应用市场
又来3款,字节加速探索AI应用市场字节在 AI 应用层的探索还在继续,而且仍然保持遍地开花的探索策略。
字节在 AI 应用层的探索还在继续,而且仍然保持遍地开花的探索策略。
随着深度学习大语言模型的越来越火爆,大语言模型越做越大,使得其推理成本也水涨船高。模型量化,成为一个热门的研究课题。
两天前,图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」的长篇漫画,引起了网友的热议。
现如今在字节跳动,已近乎隐退的张一鸣,只重点关注两件事:其一,是风暴中的TikTok;其二,就是字节跳动正在全力追赶的AI战略业务。
视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。
近期,多模态大模型 (MLLM) 在文本中心的 VQA 领域取得了显著进展,尤其是多个闭源模型,例如:GPT4V 和 Gemini,甚至在某些方面展现了超越人类能力的表现。
最近,扩散模型(Diffusion Model)在图像生成领域取得了显著的进展,为图像生成和视频生成任务带来了前所未有的发展机遇。尽管取得了令人印象深刻的结果,扩散模型在推理过程中天然存在的多步数迭代去噪特性导致了较高的计算成本。
两个多月前,我写过一篇文章:字节的Coze、扣子和GPTs,有什么区别?浅谈了我对 Agent 和 GPTs 的一些思考。两个月后的今天,我们可以看到,GPTs 逐渐过气,字节的扣子逐步出圈,而钉钉、百度、Dify 等也都上线了工作流功能。且 Agent 的热度也越来越高,尤其是近段时间吴恩达教授在红杉演讲后。
最近,字节旗下的一款视频生成AI——Dreamina 开始大规模开放测试。 Dreamina 不算是新产品,但现在它与 Sora 最大的区别,不是模型能力,而是它真的是能使用的。
最近一段时间,“字节的 Gauth 增长很猛”的消息,四处流传。在上周写完《作业帮出海,拿下200万MAU》的选题之后,我们怀着好奇心,看看字节的 Gauth 是不是真的如一些自媒体吹得那么神,毕竟作业帮的 Question.AI 体验下来,还是有一些 bug 的。