图片来源:Inc.
Z Highlights
2025年度的“Inc. 5000”榜单于近日揭晓,人工智能初创公司Akool凭借惊人的增长速度荣登榜首,成为本年度美国增长最快的私营企业。
“Inc. 5000”是美国商界极具声望的年度榜单,旨在评选全美增长最快的私营企业。该排名依据企业过去三年的营收增长率进行,被视为衡量创新和市场潜力的重要风向标。历史上,像微软、甲骨文、Intuit等如今家喻户晓的科技巨头都曾登上此榜单。
那么,这家成立于2020年的公司究竟是如何在短短几年内实现爆炸式增长,从众多竞争者中脱颖而出的呢?在《Inc.》杂志的这篇深度报道中,其创始人兼CEO Jeff Lu分享了公司成功的关键策略与心路历程,为我们揭示了Akool如何从一个想法,最终成长为全美增长最快的公司。
Jeff Lu的日常工作,可谓是与巨头为邻。他的公司Akool,与马克·扎克伯格在2005年创立Facebook初期的办公楼位于同一栋建筑。和扎克伯格一样,Lu也有着宏伟的蓝图。自2020年创立Akool以来,他通过为各大公司提供由AI驱动的虚拟人,将其打造成一家年收入近4000万美元的企业。这些栩栩如生的数字角色可以应用于从客户支持到企业培训的各种场景。
35岁的Lu,其整个职业生涯都聚焦在AI与视频技术的交叉领域。他的职业生涯始于微软实习生,随后在伊利诺伊大学获得博士学位。2018年,他在苹果公司获得一份工作,专注于iPhone的Face ID扫描技术。之后,他跳槽到谷歌云,负责其视频处理服务——但他觉得束缚太多,最终选择离开。事实证明,离开谷歌自己创业是一个明智之举。Akool乘着AI的浪潮,一路高歌猛进,最终登上了2025年《Inc.》5000强榜单的榜首。以下是他的成功之道。
我当时必须离开谷歌。那时候,他们对生成式AI的态度非常保守,不希望我们开发任何他们无法控制其产出结果的产品。现在谷歌的情况不一样了,但我当时不想遵循那些规则。
我把Akool当作副业来做,在创业第二年(2021年)就赚了超过10万美元。我们很快就发展到了10名员工。
我们当时资金很少,所以在构建技术栈时必须非常有策略。我们用了8个GPU,在短短几周内就训练出了专门的AI视频模型,我们称之为“数字人模型””(human models)。我们的数字人模型可以生成数字虚拟人,并赋予他们逼真的行为举止。任何人都可以通过自拍一张照片或一段视频来创建AI虚拟人,也可以从一系列完全由AI生成的角色中进行选择。从算法到数据收集再到训练,我们掌握了我们模型的整个技术管线。
早期,我们希望与大客户达成大订单。我们曾积极尝试向沙特阿拉伯政府销售AI解决方案,但过程漫长而复杂。对于我们这样规模的初创公司来说,专注于如此大的项目是一个错误。意外的收获是,在2022年底左右,一个新的消费级用户群体发现了我们。我们曾在网站上创建了一个免费的自助服务平台,供企业客户演示我们的技术。一些网红博主发布了关于我们平台的内容,给我们带来了巨大的流量。于是我们设置了付费墙,起步价为每月25美元。这笔收入支撑了公司的运营,也让我们有时间去探索如何打入B2B市场。
2023年初,我们赢得了一个改变公司发展轨迹的客户:可口可乐。起初我们甚至不知道客户的身份——我们只从一家营销机构那里得知,一个知名品牌正在寻找一个在AI换脸技术方面拥有专业知识的合作伙伴,并且他们对市场上的所有工具都进行了基准测试。可口可乐告诉我们,我们的技术明显优于其他家,他们希望与我们合作。
我们了解到,他们当时正与视频游戏《英雄联盟》(League of Legends)合作,推出一款名为“Coca-Cola Ultimate”的新饮料。作为推广活动的一部分,他们希望让人们沉浸在游戏世界中。可口可乐制作了一段以游戏世界为背景的视频,并使用我们的AI解决方案开发了一个网页应用,任何人只需一张自拍,就能将自己的脸换到主角的身上。该活动在80多个国家持续了六个月,我们总共处理了数百万次的换脸请求。
我们将与可口可乐的合作变成了一个成功案例,并将其纳入了一次大规模的针对营销机构的邮件营销活动中。我们意识到,我们可以将技术卖给这些机构,而这些机构在向客户推销营销活动时,可以交叉销售我们的技术。营销机构的圈子很小,所以当人们看到一个大型的成功案例时,口碑传播得非常快。从那时起,我们的业务才真正开始腾飞。
2024年,我们专注于增长。我们建立了一支专业的销售团队,并扩大了营销团队,以便在向大客户和品牌进行推介时能够更加灵活。在这一时期,我们的两项功能尤其火爆:一个是我们的流媒体虚拟人,它是一个可定制的AI生成角色,能够进行实时对话;另一个是我们的视频翻译工具,用户只需上传文件或粘贴YouTube链接,就能将视频从一种语言转换成另一种语言。我们甚至可以改变视频中人物的嘴型,使其与翻译后的语言相匹配。公司30%的业务收入来自视频翻译,许多跨国公司用它来将培训视频转换成其他语言。
我们B2B收入中约有一半来自流媒体虚拟人。最近,我们通过与亚马逊云服务(AWS)、谷歌和英伟达等公司合作,为他们的技术大会创建技术演示,取得了巨大成功。这些演示展示了我们的流媒体虚拟人既能帮助用户完成任务,也能帮助企业进行销售和客户服务。现在,我们正与AWS紧密合作,为零售商(尤其是在亚洲)创建虚拟人,用于与购物者互动。
今年,我们的年收入已增长到4000万美元,员工约100人。其中三分之二是工程师,三分之一负责业务;我们采用混合办公模式,大约一半员工在办公室工作。我们最大的创新在于实时视频技术。我们在以最低延迟进行互联网流媒体视频方面拥有深厚的领域专业知识。这使我们能够创建一套新功能,让用户可以在会议中即时将自己的语音翻译成其他语言——它甚至可以用一个能同步其动作的虚拟人来完全替代用户的真人形象。
我们的实时视频能力遥遥领先于谷歌、OpenAI和Adobe等竞争对手,而且我认为他们短期内不会大举进入这个领域。尽管如此,市场竞争依然非常激烈,我们现在的主要目标是继续增长,以便能与这些巨头抗衡,并在行业竞争中胜出。例如,我们现在有了充足的现金流来构建更大规模的AI模型,包括我们自己的视频基础模型和声音生成模型,这将使我们的虚拟人更加逼真。这个领域所有人的目标都是:创造出与真实视频无异、令人真假难辨的视频。
原文:
https://www.inc.com/ben-sherry/how-ai-avatars-powered-this-startup-to-become-americas-fastest-growing-company/91220073
https://www.inc.com/inc5000/2025
编译:Kelly Xu
请注意,本文编译自文末载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。
Z Potentials将继续提供更多关于人工智能、机器人、全球化等领域的优质内容。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。
文章来自于微信公众号“Z Potentials”。
【开源免费】Deep-Live-Cam是一个只需一张图片即可实现实时换脸和一键视频深度伪造的AI项目。
项目地址:https://github.com/hacksider/Deep-Live-Cam
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales