北京跑出 AI 准独角兽:toB 视频,是百亿美金机会

2025
06/30
20:14
分享
评论

 

   

" 我真的为此流过泪,不止一次。" 提到 OpenAI 发布 GPT3.5 时,一览科技创始人罗江春,内心流露出复杂情感。" 我们难道不努力吗?不聪明吗?我们也一样工作到凌晨两点,为什么中国没有诞生 OpenAI 这样的公司?。"

一个客观的现实是:国内做大模型,太烧钱了。" 即便融了几十亿元,在 AI 基础设施建设中也远远不够。"

因此,作为创业公司,聚焦应用是更好的选择。

然而,关键的问题是:AI 应用赛道千千万,哪些最能跑出百亿美金独角兽?罗江春的答案是:视频应该是 TOP5 的选择。

这也是一览科技的主攻方向。罗江春在视频行业深耕 20 年:2005 年创办风行网,开创中国互联网高清视频产业,拥有清华机械工程和企业管理双学士学位,1997 年— 2000 年于美国莱斯大学就读人工智能与机器人专业。

访谈中,罗江春提出了多个 AI 机会赛道:

1、AI 视频(To B)将成为水电煤。

视频正从娱乐载体蜕变为商业基础设施:尤其是在获客、促活和增收上,正成为企业刚需。

比如,银行需日均百条 " 种草视频 " 促活用户,电商依赖 AI 生成海量营销内容,传统三天制作一条视频的产能被 AI 提升至 " 日均百条级 "。

2、AI 视频(ToB)仍依赖人的参与,并且该局面会持续数年。

客户不在乎工具,只在乎最终结果。TOB 场景下,对 AI 的要求更高,必须有人工干预。AI 生成数百个初稿后,专业团队筛选优化(如精修图片、重写脚本),最后多轮审核交付。

3、垂直 Agent 是唯一机会:对抗大厂垄断的护城河。

通用 AI Agent 会被大厂收割,但法律、审计等垂直 Agent 依托专业语料库和闭环数据,有很好的创业机会。

4、AI 不是移动互联网的延续,而是代际变革。

AI 的影响比互联网更深远。AI 的诞生更像电的发明,是一个底层基础设施级别的变化,是代际影响。

声明:访谈对象已确认文章信息真实无误,铅笔道愿为其内容做信任背书。

01 AIGC:TO B 是否有未来?

铅笔道:什么时候开始关注 AIGC 的(AI 生成内容)?

罗江春: 我们提这个概念时大模型还没流行。

2018 年我们提 RGC 概念(从 PGC、UGC 到 RGC),当时叫 " 机器生产内容 ",和现在的 AIGC 是一个意思。

记得当时在乌镇互联网大会上我就提了这个,只是那时没有大模型,做法比较原始:抽取视频素材标记,人写脚本后混剪配音,形成 RGC 雏形。

我们现在的业务是:AI+ 视频。我觉得,未来视频会像水电一样成为基础需求。

铅笔道:你们主要做 TO B 业务(商用)?

罗江春: 对,我们其实是把 " 内容 " 这件事做了进一步的升级:从 toC 转向商用。

就像我当年做风行的时候,更多是在做娱乐内容。现在像抖音、快手、优酷、爱奇艺这些平台,大家刷的也还是娱乐内容。

那我们往前走了一步,我们看到的是 " 商用内容 " 或者叫 " 商业内容 "。

为什么这么说?过去 20 年,内容的主要功能是提供娱乐。但是我们看到一个核心趋势是:视频越来越 " 工具化 ",它的 " 使用属性 " 和 " 功能属性 " 开始被强化了。

就比如卖货。我们服务了很多大的电商平台,他们用视频不是为了娱乐,而是为了 " 种草 ",激发消费者的购买需求。这就不是 " 娱乐 " 的用途了,是有非常明确的目的。

还有银行客户,他们做视频是为了提升用户活跃度,比如让信用卡用户不仅是每个月打开 APP 还款一次,而是通过视频延长用户使用时长,增加粘性。

所以,视频作为一个 " 内容载体 ",它的使用场景越来越多,不再局限于娱乐,而是广泛走向商用。

这也是我们提出 " 让视频像水和电一样 " 的原因。视频服务应该成为所有企业客户的基础设施。

02 AI 不是 " 新互联网 ",而是 " 代际变革 "

铅笔道: 您 2018 年提出 AIGC(RGC)概念,这是个怎样特殊的年份?当时 OpenAI 成立才两三年,这对您有影响吗,还是说国内已经有了相关的发展土壤?

罗江春: 其实没有。那时我根本不知道 OpenAI,差不多到 2021 年才开始关注它的 GPT 1.0、2.0 版本。

2015 年前后,大家更关注的是 AlphaGo 和 DeepMind。

OpenAI 当时并不在大多数 AI 从业者的视野里,Meta(Facebook)的 Torch 和 Google 的 TensoFlow 等框架等才是我们关注的重点。

当时投资圈还在追逐 "AI 四小龙 ",像云从、商汤那一波,其实跟我们当时做的视频理解也很像。

我们用 AI 打标签,也主要用图像识别、语音识别(STT)这类技术,我们能用这些技术来做视频理解,也是因为它们当时已经相对成熟了,我们不可能从头去开发所有底层技术。

铅笔道: 有人判断 AI 时代的下一个 " 字节跳动 ",可能于视频领域有关。你对这个判断怎么看?

罗江春: 不一定是视频,虽然视频领域肯定很大,但未必是最大的。前五应该有可能。

铅笔道: 除了视频,你觉得还有哪几个方向?

罗江春: 核心要回归到 AI 到底改变了什么。 它改变视频内容生产方式只是一方面,可能我们现在都身处其中,像在森林里,还没跳出来看未来的全貌。

很多人想在科技史里找一个能和 AI 类比的技术革命,而我觉得 AI 可能像 " 电 "。发明电之前,大家点油灯蜡烛,发明电以后更在电普及后,城市的夜晚才能灯火通明,生活的时间和空间无限拉长。

AI 的影响可能比互联网领域的类比更深远,它是一个底层基础设施级别的变化,并且是代际影响。 比如刚开始觉得它像互联网,但进入工业领域后,它更像 " 电 ",对生活是代际的影响,不是简单延续 PC 互联网、移动互联网到 AI 互联网的逻辑。

很多人把 AI 类比成移动互联网或 PC 互联网那样的替代技术,其实这样的类比,把价值看小了。

03 国产大模型:遗憾、务实与加速追赶

铅笔道: 你在 2021 年就开始关注 OpenAI 了,其实已经很早了,毕竟大多数人是 2022 年才开始接触。

罗江春: 这可能也跟我的专业背景有关系。我是正经科班出身,在美国留学的时候读的就是 AI 和机器人(Robotics)专业。我们有一个圈子,一群人经常会讨论 AI 和人工智能的话题。所以 OpenAI、GPT 这些概念,其实很早就在我们内部流传开了。

铅笔道: 那你第一次听到 OpenAI 的时候印象是什么?

罗江春: 我当时的印象是,这家公司选择了一条完全不同的路线(Transformer)。

当时我们也不知道他们能否成功。他们要花几十亿美金堆 GPU,作为创业公司,这种不计成本的投入胆子太大了,而且还能找到投资。

说实话,我为这件事特别感慨。中国没有这样的土壤。要是我想拿几万张显卡堆算力,谁会给我几十亿美金?在一无所有的时候,没人敢支持你。

我真的为此哭过好几次。我们难道不努力吗?不聪明吗?没有工作到凌晨两点吗?关键就是土壤问题,中国确实缺乏这样的环境。

其实如果有资金支持,土壤成熟,中国人也能跟随并做出 OpenAI 这样的公司,当时已经隐隐有这种感觉了。

客观且从专业角度讲,我们 "follow" 别人是没问题的。 比如哥伦布发现美洲大陆后,第二个人再走就容易了,中国人很擅长这个。这不仅是任正非先生这么说,也是产业里的现实。

让我们去引领新技术革命,指出方向,这和基础科学、教育等很多因素相关。

比如现在的应试教育,AI 来了之后,我都不知道怎么教育孩子了:还要不要刷题?刷题有意义吗?我经常让孩子遇到不会的题就拍照问 " 豆包 ",让他学会用工具。

我们现在的教育体系不鼓励钻研基础科学,也不鼓励质疑,缺乏批判和自我批判精神,而颠覆式创新正需要这些。

铅笔道: 您刚才提到的遗憾从何而来?现在释怀了么?

罗江春: 当然还遗憾,非常遗憾!当 GPT-3.5 真正出来并使用时,第一次用的感受和现在不同。当时感觉像在和 "God" 对话,它无所不知。尤其是 ChatGPT 推出后,这是跨时代的产品。

铅笔道: 这有没有让您对技术路线产生犹豫?比如 2021 年看到 OpenAI 时,是否决定开始准备做大模型?

罗江春:我们一直没做大模型。作为创业公司,我们缺乏土壤。即便融了几十亿元,在 AI 基础设施建设中也远远不够。

所以我们坚定聚焦应用层,不跟风底层大模型的研发。中国缺乏做大模型的广泛土壤,底层大模型最终会是 BAT 等大厂的主场。

铅笔道:2022 年 GPT 爆火后,国内资本是很动心的,你没动过心吗?

罗江春: 我和美元基金的负责人很熟,他们投资时也很犹豫。大家心态普遍是:第一怕错过机会,第二怕投错项目,第三怕投的项目没有下一轮融资。

我们其实没动过心,我们就是做应用的。

讲个小笑话,从 2023 年 1 月到 7 月,我一直在坚持读大模型的论文。但有一天我突然发现,我读不过来了,他们出论文的速度比我读的速度快,节奏确实太快了。这些做大模型的兄弟们,他们像是站在天上看世界。他们一天的成果,普通人可能要用一年才能实现。

铅笔道:既然已经那么坚定只做 " 应用层 ",那还遗憾什么?

罗江春: 我遗憾的是 GPT 没出现在中国。改革开放以来,中国在 PC 互联网、移动互联网领域都有对标美国的公司,但 AI 时代来临前,我们没有一家能引领代际变革的公司,这很遗憾。

铅笔道:对于公司而言,站在巨人的肩膀上(AI 底层技术),是不是也是一件开心的事。

罗江春: 我们这一代人很幸运,经历了 PC 互联网、移动互联网,现在又遇上了 AI 的崛起。它确实把我们抬到了一个新的高度。

像我们原来做 RGC,有很多东西做不了,现在有了 AIGC、大模型作为底座,特别是视频大模型、多模态大模型,这些事情都能做了。我们是看得很清晰的。

铅笔道: 大模型出现后,对公司的战略有什么具体影响和变化吗?

罗江春: 更加坚定地做内容,也更坚定目前的方向。整体战略方向不变(AI + 视频 + TO B),但会把 AI 渗透到各个环节中。

04 AI+ 视频 +toB=?

铅笔道:在视频生成内容的质量提升上,哪些技术生态对您影响最大?

罗江春: 视频可拆分为三个要素:脚本、素材、剪辑加后期(含音效)。

目前有两种技术路线:一种是像 Runway 或即梦那样,输入创意直接生成视频,但效果不稳定、与预期偏差大,不过在特定场景下有改进空间;

另一种是我们推崇的。拆分环节,脚本、素材、混剪独立处理,素材不足时可生成,再用 AI 混剪。特别是脚本这个环节,我们认为必须要有人为干预。

如果完全不干预,让 AI 直接从一个 idea 生成完整视频,中间会出现很多不可控的问题,最后出来的东西跟你想要的完全不一样。

但是目前 AI 还没强大到 " 一念即得 ",即使是 GPT、豆包等大模型,回答问题时也是基于搜索和推理,输入与输出常存在偏差。所以本质是智能程度还不够,无法一站式生成满足用户需求的内容。

现在的 AI 更像 " 辅助驾驶 ",而非 " 自动驾驶 ",其实还差得远。

这是为什么现在大家对 Agent(智能体)这么感兴趣,就是 AI 来扮演一个 Agent 的角色,帮助你完成任务,而不是替代你来做。

铅笔道:对你们来说,AI 提升了几倍的人效?

罗江春: 我们希望是 " 两个数量级以上 " 的提升,才算真正达到预期。

比如说以前一个客户的项目,一条两三分钟的视频,质量要求比较高,那很正常是三天做一条,要好几个人一起搞。

现在我们工业化拆解完流程后,三天可以搞 100 条、200 条都没问题。 能做到这些的前提是:我们做了很多 " 储备 " 和 " 质量控制 " 的工作。

铅笔道: 从用户角度看,用通用大模型写脚本,和用你们的自研产品,有什么技术上的差别?这属于哪种类型的技术壁垒?

罗江春: 差异非常明显。关键在于,我们的内容创作是 " 命题作文 "。客户有明确需求,我们为每个客户定制工作流,这是自研的,其他软件无法替代。

我们从一开始就强调 " 有四个有 ":有场景、有数据、有用户、有产业链。

第一," 场景 " 是真实的客户需求;第二," 数据 ",我们长期积累了大量素材和客户数据;第三," 技术 " 是我们的核心能力,而且这种技术能力随着客户案例和数据的积累呈螺旋式增长。它不是一下形成的,是越做门槛越高;第四," 产业链 " 让你的技术能有充分发挥的空间,一旦形成闭环,别人很难竞争

铅笔道: 你们是什么时候正式接入大模型技术的?

罗江春:从 2022 年底 GPT 出来开始,我们应该是国内最早一批接入的。那个时候很多人还没反应过来,我们已经上线工具了。

铅笔道:你们引入 AI 大模型后,客户的反馈怎么样?他们知道吗?有感知吗?

罗江春:这里有个过程。其实我们在 2023 年已经开始推 AIGC 工具,我们推出了 " 运营宝 ",里面有 AI 编剧、AI 绘图、各种 AI 工作流。最初是想赋能创作者(To C 或 To 小 B)。

后来我们很快发现一个问题:客户要的是 " 结果 ",而不是工具。他不关心你怎么做菜,只在乎你有没有做出他想要的那道菜。我们很快转向用 AI" 做交付 " ——直接服务客户,而不是做工具。

其实现在大家流行说的 RaaS(Result as a Service),我们 2023 年就在这么干了,比大家早了差不多两年。 AI 刚出现时,结果的可靠性存疑,在 TO B 场景下,对 AI 的要求更高,必须有人工干预。

05 TO B 视频怎么赚钱?

铅笔道: 所以 To B 类客户,其实对 AI 的 " 智慧程度 " 要求更高?

罗江春:当然,所以人是必须介入的。Agent 也不是完全替代人类,而是辅助人类做事。

客户更关注结果。这些客户用内容是为了达成后续目标,比如电商客户会关注转化率、消费数据;大公司(银行、手机厂商、平台)的 KPI 很严格,内容必须帮他们完成指标。

铅笔道:具体说说,你们是怎么用 AI 服务 toB 客户的?

罗江春: 我们用 AI 生产内容时,一定有人工介入,并非全流程自动化。 比如客户需要一张图片,AI 可能生成几百张,我们会安排专业人员从中挑选并精修,用擦除、重绘等工具优化,经过多轮审核后才交付。

AI 提升效率的核心在于处理重复性工作。 比如过去用 PS 做一张图需要半天甚至更久,现在 AI 生成几百张,人只需半小时筛选,再局部优化,效率能大幅提升。

就像写文档时,会先用 " 豆包 " 生成初稿,再自己审核修改。AI 的价值在于辅助人做筛选、评判,而非替代人。所以人与大模型交互时,人的专业水平越高,结果越好。

铅笔道:TO B 的 AI 视频交付中,AI 最适合做哪些工作?

罗江春: AI 擅长补人类的短板,比如处理重复性、标准化的工作。以前剪辑需要训练三个月工具操作,现在 AI 能简化流程,让编导直接判断内容是否可行,无需依赖剪辑师。

AI 就像 " 辅助驾驶 ",帮人提升效率,而非替代人做创意决策。这和机器人行业的逻辑类似,让机器做人类不愿做、不擅长或不能做的事。我们把 AI 定位为辅助者。

铅笔道:你认为这种模式是短期现象还是长期趋势?

罗江春:AI 的进化速度不是匀速的。

我听过一位头部券商的分析师的观点。AI 目前之所以爆发,是因为 " 吃完 " 了互联网上积累的大量数据,当新增高质量数据有限时,其进化速度会放缓。这个观点很有道理。

从生物和哲学角度看,当前 AI 的能耗模式一定是低效的。 人脑每天消耗约 400 大卡能量,而一个数据中心的 GPU 能耗远超于此。

未来芯片技术可能优化算力效率,但短期内很难颠覆现有模式。

所以,在未来三到五年内,不太可能出现 " 念头一动就生成理想视频 " 的颠覆性技术。 TO B 的 AI 视频交付模式至少能稳定 3-5 年。

铅笔道:TO B 视频主要用于市场营销吗?

罗江春:不止。客户既会用于公域获客,也更看重私域流量(如 APP 内的内容运营)。比如信用卡客户每天可能需要 100 条种草视频,关联商城或理财产品,这比传统 TVC 的需求量大得多。

铅笔道:按市场规模看,哪些行业需求更大?

罗江春:我们专注服务大客户,因为内容是非标品,服务大小客户的售前成本相近,做大客户更高效。

但国内市场存在 " 内卷 " 问题:大客户常要求降价或增加服务内容,利润空间被压缩,而欧美客户更注重契约精神,付款流程规范。核心围绕 " 拉新、促活、留存、增收 " 四个目标。

我们更倾向服务互联网大平台客户,因为他们的内容需求量大且持续,而硬科技行业(如半导体)对视频内容的需求较少。

铅笔道:有没有可能未来服务中小企业?比如做一家平台型公司。

罗江春:我们其实一开始是服务中小客户的,后来才聚焦到大平台和重要客户。

在 2018-2019 年服务中小客户时,他们对内容的需求并非刚需,拓展起来很困难。而且服务中小客户和大客户的获客成本差不多。

在国内 TOB 领域,想找到低成本获客的方法服务小 B 客户很难。我们尝试过很多方法,最后发现还是得靠销售。

长期来看,这种情况可能更 " 糟糕 "。很多中小客户对内容的需求,可能会逐步转向抖音、快手、视频号这些平台。内容会更偏向于平台运营。

06 未来的百亿美金机会

铅笔道:在 AI 领域,TO B 和 TO C 的生态是隔离的,还是相互交融的?

罗江春:我觉得是分不开的。底层技术是一样的。

比如我们公司来看,产能非常重要。如果未来某个时间点我们一天能生产 100 万条图文、100 万条视频,那时我们想做 C 端会很容易。所以生态是融合的。

铅笔道:这个行业的竞争格局如何?是不是很混乱?

罗江春:挺混乱的。不只是客户在卷,供应商之间也很卷。行业里进进出出的人很多。有些角色刚进来,觉得这个领域不错,但实际操作后发现比想象中困难,就退出了。

我们遇到过很多竞争对手,名字都没听说过,也有很多大公司参与。玩家很多,但没有出现占据绝对份额的玩家。

铅笔道:AI 视频这个赛道,除了你们公司,还有哪些细分方向值得关注?有没有可能出现百亿美金级别的公司?

罗江春:我认为工具类产品一定有机会,尤其是工具加大模型的模式。但这种机会很容易被大厂吃掉。因为这种模式本质上依赖场景、数据、技术、资金和用户,而大厂基本什么都有。

比如抖音的剪映,为什么能成功?因为每天有无数用户在用,内容不断生成,语料库可以不断扩展。其他大模型想 PK 根本竞争不了,进化速度跟不上。

所以如果工具加上大模型底座,确实有机会成为百亿美金的公司,但很可能红利属于大厂。

铅笔道:创业者通过深耕垂直产品(比如非主流应用),机会也很小?

罗江春:这种路径周期太长了。其实大厂不是看不上,而是产品经理可能暂时没想到。一旦他们意识到,很容易将功能集成到超级 APP 里。

铅笔道:除了工具,智能体(Agent)领域您怎么看?现在很多人做数字员工,TOB 和 TOC 哪个更有机会?

罗江春:对创业公司来说,TOB 的智能体更容易切入和生存,但能否做大是个问题。通用型 Agent 大概率会被大厂垄断。

但垂直领域的 Agent 有机会,比如法律、审计等专业场景,像律师顾问、审计工具,只要有专业语料和数据库支撑,就能收费。

可是这类业务难在规模化,获客和竞争都是问题。TO C 的 agent 我觉得是和 " 内容 " 相关的。可能是游戏、互动、陪伴这些方向,但一定和内容挂钩。

铅笔道:您看好人形机器人吗?为什么一定要做成 " 人形 "?

罗江春:我只看好人形机器人。因为物理世界的设施大多为人设计,比如工厂拧螺丝的工位,人形机器人最容易适配,这是取代人类工作的关键。

来源:铅笔道

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map