专访丨华人大三学生创业教育 Agent，获赵长鹏 1100 万美元种子轮

8765点击 2025-11-12 15:16

硅谷华人大三学生创立的教育类 AI 产品 VideoTutor，近日宣布完成 1100 万美元种子轮融资，成为硅谷学生创业中融资规模最高的项目。

这是一款面向K12 学生、可「一键生成专属教学视频」的 AI 教育 Agent。本轮融资由币安创始人赵长鹏的家办 VCYZi Labs 领投，百度风投、锦秋基金、Amino Capital、BridgeOne Capital 及多位知名投资人共同参投。

专访丨华人大三学生创业教育 Agent，获赵长鹏 1100 万美元种子轮

https://watcha.cn/products/video-tutor

这次，我们也有幸第一时间采访到了 VideoTutor 的核心团队成员，一起聊一聊从最初的校园项目，到如今成为硅谷最受瞩目的教育类 AI 创业代表，他们如何在短短几个月内完成从原型到千万级融资的飞跃？

让我们一起走进这群年轻创业者的故事，听他们讲述 VideoTutor 背后的灵感、挑战与未来。

特工少女：可以先自我介绍一下，从学生到创业者，你们从什么时候开始打磨 VideoTutor 原型？两个月做出可用 Demo 的关键节点分别是什么？

Kai Zhao：我叫 Kai Zhao，是 VideoTutor 的创始人。是一名在大三学生，今年刚从大学辍学全职创业。

VideoTutor 的原型是在今年 5 月份开始打磨的。当时我们团队发现，美国 K12 学生在 SAT、AP 等考试备考中，对可视化讲解的需求非常强烈。于是我们决定做一款能「按题即时生成教学视频」的产品。

从最初构想到能用的 Demo，大概花了两个月。

第一阶段，我们快速验证方向，搭建了从大模型生成讲解脚本到动画渲染的完整流程；第二阶段专注在动画引擎的准确性上，确保函数、几何图形等渲染精度能和老师黑板讲课的效果一致；最后，我们把生成延迟从几十秒压到几秒内，让用户能几乎实时看到结果。

整个过程都遵循一个核心理念 —— 先解决学生“听得懂、看得清”的问题，再去扩展功能。

特工少女：请简单介绍一下「VideoTutor」这款产品的具体功能，并各举一个学生/家长/老师的典型使用场景。

Kai Zhao：VideoTutor 是一款可以按题即时生成讲解视频的 AI 教育agent。学生只要上传一道题或输入一个知识点，比如“什么是导数”或“求函数极值”，系统就会自动生成一个包含文字讲解、公式推导、图形动画和语音讲解的完整视频。整个过程只需几秒钟，学生能像和老师面对面上课一样听懂复杂概念。

对于学生，它可以成为随身的 AI 家教，帮助他们快速掌握难题；

对于家长，它是一个能实时反馈学习效果的工具，看到孩子理解的过程而不是帮助他们孩子提高分数；

对于老师，它能自动批量生成教学视频和练习讲解，节省备课时间，让精力更多用于教学互动。

专访丨华人大三学生创业教育 Agent，获赵长鹏 1100 万美元种子轮

特工少女：为什么选择“按题即时生成讲解视频”这个赛道，而不是更常见的“AI 解题/AI 批改”？

Kai Zhao：我自己有两次教育产品创业经历，对于 AI 教育有非常深的 insight，看到 AI 解题、AI 批改类产品已经非常饱和了，但它们大多属于“被动学习”场景，只是给出答案，无法真正提升理解力。VideoTutor 聚焦的是“主动学习”，我们希望学生不仅知道结果，更能看懂讲题的过程。其次 AI 解题和 AI 批改其实跟 ChatGPT 或者豆包没有什么太大的区别。

而且像 SAT、AP 这类考试中，80% 的内容涉及函数图像、几何证明、微积分可视化，只有视频讲解才能真正让学生理解。我们用动画引擎把抽象数学语言变成动态视觉，让 AI 像真人老师一样讲题，这种教学效果更好。真正意义上做到因材施教。

特工少女：产品上线一周后生成了近 1.7 万条讲解视频，请挑一条最能代表“学习方式被改变”的案例，以及可以分析下这个视频是解决了怎样的问题？

Kai Zhao：其中有一个高中生在准备 AP Calculus 考试时，一直卡在“导数的几何意义”上。用 VideoTutor 输入问题后，AI 自动生成了一个 3 分钟的视频：先画出曲线，再动态展示切线斜率的变化，并用语音讲述“导数即瞬时变化率”。对他来说实现非常好的教学效果，类似“这是第一次我真正理解了导数”。

这类反馈很多，对我们来说，这就是学习方式被真正改变的信号——学生不再死记推导，而是通过视觉化理解知识，像真人老师上课板书一样。

特工少女：你们是如何量化”讲清楚“的？当理解度指标没达标，或者用户看完还是觉得没学会的时候，会有哪些策略可以补救学习吗？

Kai Zhao：对于我们来说，定义的“讲清楚率”主要由学生的 Quiz 答题正确率和二次提问率等指标组成。

学生在看完讲解后会自动进入一个简短测验，如果答错，系统会立即生成针对性的视频解释。当模型判断学生仍未完全理解时，会触发“递进式讲解”策略，视频会变得讲得更慢、更细，并通过不同的例题重新解释。 AI 能根据学生的学习反馈自动调整节奏和深度，完成从“没听懂”到“彻底学会”的闭环学习体验。

特工少女：国内的话像秘塔 AI 也有即时生成带有视觉效果和旁白的教学短视频，你怎么看市场上其他产品的局限？VideoTutor 相比它们的关键优势在哪里？

Kai Zhao：我觉得像秘塔 AI 这样的产品，其实很好验证了可视化学习的需求是真实存在的，这是一件好事。但大多数产品的底层逻辑仍然是“视频生成工具”，而不是“教学引擎”。它们更多是在把知识点包装成一段带旁白的短视频，本质上仍停留在内容展示层，而不是理解层。

以下问题均来自于观猹上的 VideoTutor 真实用户反馈与疑问：

专访丨华人大三学生创业教育 Agent，获赵长鹏 1100 万美元种子轮

特工少女：有时视频一直显示“0:00/转圈”。你们能给一个对外承诺的生成时长红线吗？一旦超过，系统会自动采取什么补救？

Kai Zhao：目前视频生成包含代码生成、动画渲染、音频合成和导出四个阶段。个别延迟会导致前端显示“0:00”。我们已设定 180 秒为对外的生成时长红线，超过后系统会自动导出中间态视频、后台续生任务，并切换备用节点渲染。前端也会提示状态码，确保用户体验不中断。

特工少女：为什么阶段性选择“左字右图”的固化模板？何时会开放多模板/主题包？是否考虑代码/几何引擎驱动的动态画面替代“贴图式动画”，提升可解释性与一致性？

Kai Zhao：我们阶段性采用“左字右图”的固化模板，是为了保证生成结果的清晰度与稳定性。这个布局最接近真实课堂的板书方式，兼顾了阅读性和逻辑性。接下来会逐步开放多模板与主题包，并引入几何引擎驱动的动态动画，以进一步提升可解释性与一致性。

特工少女：关于偶发的公式渲染错误/声音缺失，你们的根因分布如何？已上线或即将上线的硬约束/质检阈值有哪些？如何保障不会再二次发生？

Kai Zhao：主要原因在于 TTS 合成失败或模型生成了错误的 LaTeX 组件。我们已上线 TTS 文件校验与自动重试机制，并增加渲染前后的公式一致性检测。后续将继续优化引擎稳定性，确保生成错误率保持在极低水平。

特工少女：视频后的 3 道题如何保证与讲解强绑定？是否在推进“错题专属讲解/变式题联动”机制及时间表？

Kai Zhao：视频后的三道题与讲解内容是强绑定的，通过 contextId 追踪同一推理链。我们也在开发“错题专属讲解”机制，让学生在做错题时自动触发变式题讲解，实现从讲解到巩固的完整学习闭环。

特工少女：目前有用户称 “理科友好、文科吃力”。语法/写作类是否考虑优先提供交互式范例 + 语音点评而非动画？

Kai Zhao：目前 VideoTutor 专注于理科场景。语法、写作类内容会采用更互动的方式呈现，我们计划优先上线语音点评与示例对比功能，而非动画展示，让反馈更贴近语言学习的真实需求。

特工少女：高阶数学讲解力不足的反馈下，你们认定的适用边界在哪里？哪些题型暂时不开放，达到什么正确率/一致性门槛才放量？

Kai Zhao：当前版本主要覆盖高中、AP、SAT 等理科内容。对需要长篇证明或符号推导的题型暂不开放。我们设定的放量标准是模型正确率达到 93% 以上、一致性检测超过 95%，达到标准后才会逐步开放更高阶内容。

特工少女：有媒体报道称你们在校园社区 Fizz 有合作与入口，这条渠道从留存与付费看表现如何？未来与国内高校合作的首要门槛与试点标准是什么？

Kai Zhao：我们跟 fizz 是有合作，fizz 是美国最大校园社交平台，有点像校园版本的 Reddit，学生可以上面发匿名帖子，以及里面还有校园二手物品交易。

暂时没有留存与付费数据，因为我们还没有开始收费。跟 fizz 的合作可以让我们拥有更好的直接校园流量入口。

可能暂时不太会进入国内市场，主要还是以美国市场为主。

特工少女：现在的团队配置是怎样的？接下来 3 个月最想招聘的人才画像是？

Kai Zhao：目前团队大概有6 个人左右，其中 CTO James 有在 Meta 和 Google 工作经验，都是参与 AI 算法这一块，团队还有动画引擎核心开发者他们在数学可视化和渲染算法上有非常扎实的积累。我们内部的节奏非常快，大家住在一起、工作在一起，基本是 996 的创业状态。

接下来我们计划把团队扩充到 9–10 人，非常欢迎有国内大厂背景、节奏快、执行力强的年轻工程师加入。因为在落地效率和产品 Sense 上非常突出，我们希望把这种工程文化与硅谷的本土创新环境结合，形成一种新的团队范式——既有快速试错和极致执行的能力，又有国际视野和对教育的长期耐心。

我们其次会为优秀人才提供充分的成长空间与期权激励。虽然已经完成 1100 万美元的种子轮融资，但我们依然保持“小而精”的节奏，希望用高密度执行力把产品从 1 做到 10。

Videotutor 招聘需求官网：https://videotutor.io/。

团队目前正在全球范围内招募工程师、设计师与研究员，并为核心成员提供期权激励与长期成长空间。

文章来自于“特工宇宙”，作者 “特工丸子”。

关键词: AI新闻 , AI教育 , VideoTutor , Kai Zhao

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales