速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题
5895点击    2025-08-16 15:43

速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题


图片来源:Palabra


一家名为Palabra AI 的初创公司正在开发 AI 语音翻译引擎,致力于解决教学大型语言模型(LLMs)理解多种语言这一颇具挑战性的难题。


如今,LLMs 使文本语言转换变得更容易,但 Reddit 联合创始人亚历克西斯·奥哈尼安指出,语音翻译并非如此简单。


奥哈尼安表示:"AI 可以生成内容和翻译文本。但[语音]翻译是个独特难题,因为它需要实时语言切换,同时声音还需保持拟人化。"


奥哈尼安及其风投公司 Seven Seven Six(776)认为 Palabra AI 可能解决这一难题。因此该公司领投了这家初创企业 840 万美元的种子前轮融资。


本轮参投方还包括 Creator Ventures 及多位个人投资者,如 Instacart 联合创始人马克斯·穆伦、a16z 前合伙人安妮·李·斯凯茨、DeepMind 前产品主管迈赫迪·吉萨西以及纳马特·巴哈拉姆。


Seven Seven Six 的奥哈尼安特别强调,Palabra 在产品执行与团队专业性的双重优势促使他们决定投资。


“Palabra 的翻译层运行非常流畅。该公司拥有一支强大的 AI 研究团队,在语音领域做了高质量的工作。此外,这家初创公司在产品设计和输出质量方面也做出了出色的选择,”他补充道。


Palabra 由 Artem Kukharenko 和 Alexander Kabakov 于 2023 年创立。曾担任三星机器学习工程师的 Kukharenko 表示,他作为数字游民曾在多个国家生活,遇到过语言障碍问题。因此他希望结合自己的机器学习经验来解决实时翻译难题。


首席执行官ARTEM KUKHARENKO


速递|Reddit创始人押注840万!Palabra攻克AI语音翻译“拟真实时”难题


图片来源:Palabra


"许多其他公司都曾尝试解决翻译难题。但当他们将语音转文本、文本转语音等 API 与翻译技术结合使用时,延迟时间就会增加,翻译效果无法实现真正的实时性。而通过 Palabra,我们成功将延迟降至 800 毫秒,使翻译过程流畅无缝,真正实现实时翻译。"他在电话采访中向 TechCrunch 表示。


Kukharenko 补充道,该公司已构建了一条定制化数据管道,使这家初创企业能在数周内轻松新增语言支持。他表示在管道末端,Palabra 会安排人工译员对输出质量进行校验。该初创公司称其算法还能适应嘈杂环境和对话中断等不同场景。


Palabra AI 同时提供面向消费者和企业的翻译产品。该公司推出的桌面应用程序兼容 Mac 和 Windows 系统,可与 Google Meet、Zoom、Discord、Slack 及 Microsoft Teams 等主流视频通话软件协同工作。该应用支持超过 30 种语言的实时互译,用户可选择以目标语言收听对方的母语发言,这一功能在多国籍参与者通话场景中尤为实用。


Palabra 官网表示,其桌面应用即将为 YouTube、Netflix、Twitch 和 Vimeo 等内容网站提供原生翻译功能。


用户每月可免费获得30分钟翻译时长。如需更多额度,可订阅每月25美元起的套餐,获得60分钟跨应用翻译时长。


该初创公司向企业提供 API 和 SDK,以便将翻译功能集成至其产品中。


目前其技术已为Agora 等视频平台提供实时多语言流支持。此外,GIS Group 等语言服务提供商正将 Palabra 工具与人工翻译结合使用。该公司表示,多家活动主办方也采用其技术提供多语言流服务。


Palabra 在翻译市场面临激烈竞争。在消费者端,像 Y Combinator 投资的 EzDubs 这样的初创公司正在开发适用于面对面或电话对话的应用程序。今年早些时候,谷歌也推出了 Meet 视频通话的实时翻译功能 。在企业端,像迪拜的 Camb.AI 这样的初创公司正在开发多语言直播活动翻译技术。


为了脱颖而出,Palabra 目前正在开发新的流式预测模型,有望大幅降低延迟。该公司还致力于支持超过 10,000 个同步音频流的翻译处理。


参考资料


https://techcrunch.com/2025/08/14/ai-translation-tech-palabra-gets-backing-from-reddit-co-founders-venture-firm/


文章来自于微信公众号“Z Potentials”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales