对话新壹科技CEO雷涛：AI领域有非常多的机会更好服务用户

发布时间：2023-04-20 11:04

AIGC 潮水已来。或快或慢，它都将到达每个人身边。AIGC 会取代我们的工作吗？中文版 ChatGPT 什么时候会出现？技术、资本博弈暗流涌动的背后，有哪些值得关注的入局者和前线故事？

知乎联合多家优秀媒体、个人作者，共创“AIGC 入局者”栏目，与你一起，关注那些卷入 AIGC 潮水的人。

本文独家发布于知乎“AIGC 入局者”栏目。

作者丨李祥

如果一个应用，能将一篇文章瞬间生成一段符合逻辑的视频，将给视频行业带来多大的冲击？

新壹科技推出的AIGC产品一帧秒创，正应文生视频的需求而生。功能上，用户只需要在一帧秒创输入文案，就能一键生成相关视频。比如，输入一段关于宇宙起源的文章，就会生成一段3分钟左右的科普视频，里面涉及宇宙起源、宇宙演化、星系诞生等元素，还会由系统自动配音讲解，语言风格类似抖音上最火的解说类短视频。

当前，视频内容几乎是网民的刚需，但还有大量有表达能力的创作者不会制作视频，这制约了很多创意落地。AI大模型技术的进步，让机器能更好地理解人类语言。一帧秒创等工具的问世，让文字创作者可以通过文字指令让AI大模型快速匹配视频资源，并自动完成剪辑任务，从而成为视频创作者。

除文字生成视频功能外，一帧秒创还能为创作者提供多模态生成服务，包括文字扩写、文字转语音、文生图、图文转视频等系列创作服务，通过对文案、素材、AI语音、字幕等要素智能分析、解构，辅助创作者快速成片，实现零门槛产出视频。

近日，知乎联合铅笔道，专访新壹科技CEO雷涛。他认为，从去年末兴起的AIGC技术浪潮，会让内容行业或主动或被动地完成重新洗牌。在不久的将来，AI会让内容数量指数级上升，届时创意才是内容行业竞争的关键，而大厂也未必能在应用端保持制霸。尽管现阶段文生视频的质量仍不尽如人意，但未来已经近在眼前。

以下是对话精华。

一、AIGC将颠覆现有视频行业格局

铅笔道：ChatGPT出现，对内容生产类产品产生了哪些影响？

雷涛：过去十多年，移动互联网行业基本是在一些很成熟的东西上修修补补。ChatGPT所代表的大模型技术跨越式发展，让每一个具体应用都看到了跟人工智能结合的机会，这种结合可能带来整个领域的洗牌。

在视频领域，虽然目前来讲，文字直接生成视频的效果并不算好，案例远没有达到能够商用的水平。但大语言模型、文字生成图片等技术进步，已经有比较成熟的应用了，（图片和语言）作为视频的组件，客观上促进了AIGC在视频行业的发展。

铅笔道：你认为AIGC的能力会给视频行业带来哪些颠覆性变革？

雷涛：早在2016年，视频在整个互联网中作为主要传播形态的地位就确立了。可以说视频是一种刚需，但与此同时，具备视频剪辑能力的人毕竟是少数。很多用户根本不知道Premiere（注：Adobe公司开发的视频编辑软件）。

这就像原先只有电视台能通过视频的方式制作内容，后来随着秒拍、小咖秀再到抖音等产品出现，用户可以通过自拍的方式发布内容，让视频内容数量呈几何式上升，最终引爆短视频行业。

而AI赋能视频生产，则是进一步降低了视频生产门槛，用户可以更方便快捷地生产更高质量的视频，视频行业的格局也可能由此再度改变。

铅笔道：你提到文字直接生成视频的效果并不理想，那现阶段AI辅助视频生产的思路是什么？

雷涛：整体而言还是用AI辅助GC（生产内容）。目前我们的AI内容生成平台产品一帧秒创，基本逻辑是通过AI加速文案与素材的匹配。

以往创作者写完文案和脚本后，还需要花大量时间寻找、拼接合适的视频资源。比如我想制作一个“细说李白”的短视频，那我在写完文案后，还需要在全网筛选关于李白的图片、形象、作品等素材，再把这些素材剪辑到一起，这些重复的搜索和筛选，本质上全都是低效能的劳动。再加上现如今互联网资源的丰富程度，同类型视频动辄上万条，人力也很难匹配到最合适的。

通过AI大模型，只要两三分钟就能完成素材收集和整理工作。无论从产能还是素材匹配度上，都能将过去几个人几天的工作量，变成现在一个人几分钟的工作。

铅笔道：内容行业有声音质疑AIGC会产生版权问题，一帧秒创如何在保证内容产量的同时避免版权问题？

雷涛：这个问题的确很棘手，有很多独家视频素材是无法商用的。所以我们采取的是“自有资源＋外部资源”合作的方式。

首先新壹科技是一下科技（研发了秒拍、小咖秀）在元宇宙VR及人工智能领域探索的实体，而通过秒拍产品多年的积累，我们的视频素材已经积累了将近10亿规模，我们将这些自有资源库开放给了一帧秒创的用户，免除他们的一些顾虑。

其次我们也在和一些版权素材库协商，想将更多素材接入一帧秒创，届时用户可以付费购买素材的使用权，而价格会比在原素材平台上购买更加优惠。当然，AIGC的版权资源会是一个长期问题，我们也希望找到更多版权方合作。

二、人工智能会不会“杀死”创造力？

铅笔道：如果AIGC能让内容数量爆发性增长，你认为未来内容行业的核心竞争点是什么？

雷涛：未来的核心竞争点肯定还是创造力。这就像传统媒体和自媒体的竞争，原先只有纸媒才可以在公众渠道发声，后来有了像微博、公众号等平台后，任何个人都可以注册自媒体公司，然后内容创作。但你可以很明显感觉到，公众号文章的质量天差地别，这就是创造力的区别。

AI大模型可以通过进一步降低生产门槛，让更多人参与视频创作，从而进一步释放创造力。

铅笔道：也有人担心AI会杀死创造力，毕竟有大模型了，很多工作都可以交给它。

雷涛：我更愿意把创造力分为两个部分，一部分是创意形成的过程，就是你脑中突然有了一个天马行空的idea；另一部分则是将创意落地，最终创作出内容的过程。

就像你写科技评论文章，你应该花更多时间在输出观点、输出干货，而不是花大量时间在寻找文章配图或短视频，这是一种本末倒置。而在视频生产中，恰恰是文案脚本容易写，视频素材整理很困难。所以一帧秒创实际上解决的是将创意落地的过程，帮助视频创作者减少低效能的劳动，将自己的创意更快变成具体产品。

关于创造力，我认为即便AIGC完全普及，能真正做好内容创作的还是少数人。

以国外做AI文生图的头部企业Midjourney为例，他们的文生图技术已经相对成熟，最近做的那组“中国情侣”图片，几乎可以以假乱真，但真正能产出那么精美图片的又有几个？

铅笔道：不同风格的视频对工具需求不尽相同，如何平衡用户对产品通用性和个性化的需求？

雷涛：通用性和个性化需求反映在大模型上，其实就是数据的泛化程度和匹配精准度。

所以首先我们尽可能多地在一帧秒创中加入更多素材量，秒拍将近10亿级别的视频素材是底子,然后对一些比较成熟的视频创作者，以往就有私有素材库，基本是几个T量级的常用资源放在硬盘里。一帧秒创支持创作者导入私有素材库，然后依托AI大模型完成结构化分析，可以更加方便创作者调用。

如果以往没有任何素材积累的创作者，大概率就是纯小白用户，对个性化需求会更低。一帧秒创是基于OpenAI及其它几个开源大模型进行了垂直训练，基本能保证现阶段用户的个性化需求。

铅笔道：现在Open AI已经推出GPT-4了，如何让产品跟上技术迭代的速度？

雷涛：就像我之前提到的，一帧秒创是从21年末开始研发的产品，谁都想象不到GPT-4会在一年多后就推出。

随着更先进的开源模型推出，我们自己的模型也在进化，技术是可以迭代的。而且相对于国内其他产品来讲，首先一帧秒创的语言模型并不会比他们差。第二，在视频这个垂直领域，我们甚至还有很多优势。某种层面上，我们跟百度的差别要远小于百度跟OpenAI差别。

铅笔道：让大模型匹配用户视频剪辑需求的难点主要有什么？

雷涛：主要还是语义的理解。因为做文字转视频首先需要理解文字，比如用户输入一篇公众号文章，一帧秒创就要理解这篇文章在讲什么，是什么类型。然后分段，找出每一段的关键词，并匹配合适的视频素材。

但如果用户随便下个指令“我今天心情很好”，这句话没有合理的关键词，也没有上下文，AI大模型就很难匹配合适的素材。这其实和真人摄影师类似，如果导演的指令不清晰、没有逻辑性，视频质量怎么可能高？

当然，当我们付出大量人工学习的成本后，通过大量标注，可以让机器更好地理解人类语言背后的意思。这也是本轮AI大模型最让人兴奋的地方。但要实现完全不用人工参与的AIGC，还需要假以时日。

三、大厂训练大模型，小厂打磨应用

铅笔道：国内外大厂都在尝试将AGI（通用人工智能）与内容生产结合，像新壹科技这样的创业公司如何留在牌桌？

雷涛：先说结论，我并不认为AI大模型会是一个赢家通吃的赛道，大厂也不一定能制霸应用端。

首先，大厂肯定要抓住行业颠覆性机会。无论是微软、谷歌、Meta，还是国内的百度、阿里、腾讯、字节，他们的主战场都在培训大模型，这是最烧钱，也最能形成技术壁垒的地方，大厂肯定要铺大量资金、技术、人才到大模型上。

然后在应用端，大厂一是不一定有那么强的动力去做，二是对应用端的理解不一定有创业公司深。比如新壹科技之所以能率先推出AI辅助视频生产工具，是因为我们提早观察到了用户的痛点，很多小白用户希望进一步降低视频制作门槛。因此我们从21年年底就开始尝试将AIGC的能力融入产品，比这波AI大模型风潮要早不少。

铅笔道：那你认为AIGC创业公司与大厂相比，有哪些竞争优势呢？

雷涛：我觉得我们和大厂大概率不是竞争关系，而是合作关系。因为大厂肯定是要研发大模型的，如果大模型技术停滞不前，那么应用端的迭代也无从谈起。当然，就目前的技术态势来看，大模型技术肯定还会继续进步。而且我认为，这波AGI浪潮中应用端的机会不比大模型小。

这就体现了创业公司的灵活性。我们可以自由选择跟哪家的大模型合作，可以从技术匹配度、市场人群、价格等多个因素综合考虑，选出最优解。但是举个例子，假如A大厂要尝试应用端，那他肯定只能用自家大模型，而不会用B大厂的大模型，这也算大公司的难处吧。

铅笔道：目前有在和国内大模型厂商探讨合作吗？

雷涛：有的，虽然目前国内大模型还处于混战状态，但大模型终归是要落地到应用端。作为一款较为成熟的AI文生视频产品，一帧秒创需要积极地跟用户，跟C端市场产生连接。所以无论最后是百度，还是阿里、腾讯、字节等的大模型能跑出来，从应用角度来讲，我们都可以积极接入。

因为应用端产品，更关注就是用户端的反馈，谁能更好地服务用户，谁就是真正有价值的。

铅笔道：国外大厂Meta宣称会将AIGC与元宇宙结合，似乎和新壹科技的业务有些相似？

雷涛：广义上看，AIGC会是元宇宙的一个组成部分，因为按元宇宙的世界观，里面不管是3D场景还是消费的内容，乃至NPC（非玩家角色），都肯定要通过AIGC的方式生产。因为内容量太大了，通过人工生产肯定无法完成。

但现阶段，狭义的元宇宙还只是一个概念，不管是NFT还是VR，目前都还有很强的局限性，甚至根本没有落地场景。而AIGC已经从一个概念，真正走向了广泛应用。基于AI大模型，文生文、文生图、文生视频的产品，国内外都在不断出现，所以AIGC的风头很快压过了元宇宙。其实从长期来看，AIGC和元宇宙还是有可能融合的。只是国内市场有一点很不好，元宇宙热的时候大家都蹭热度，一旦热度下降又唯恐避之不及。

铅笔道：相比遥远的元宇宙，现阶段一帧秒创或许更需要找到变现模式？

雷涛：确实，相比于大厂的雄厚资金，创业公司的变现压力更重。所以我们为一帧秒创制定的是“B端定制＋C端付费”的变现模式。

首先在B端，我们已经观察到有两类公司可以尝试定制。一类是许多自媒体都有制作讲解类短视频的需求，但又不想专门雇一个制作视频的人，一帧秒创简单易用的产品特点正好切中他们的需求；另一类是营销类公司，比如做本地生活营销，会有大量制作短视频的需求，一帧秒创的素材库能大幅提升产量。而且我们经过计算，一帧秒创每分钟的视频制作成本对企业来说已经非常划算。

而C端付费主要是AIGC热潮兴起后，更多用户对这一块业务感兴趣，开始积极尝试，让我们看到了付费的可能。我们现在推出了免费版和用户阶梯付费版，对于一些有制作视频需求的个人视频博主来说，也是有付费意愿的。

对话新壹科技CEO雷涛：AI领域有非常多的机会更好服务用户

推荐阅读