
Agent 的工具可以 “以终为始”。
文丨祝颖丽
编辑丨宋玮
闹闹从不以真实姓名对外,这很 “二次元”。闹闹一直的梦想也都跟二次元有关:做动画。
2014 年,在腾讯工作了 3 年后,闹闹辞职学了半年动画,想投身动画行业。但后来发现,做动画的工具复杂到让她抓狂;行业的环境也很糟糕,不仅实习要交钱,“出师” 后收入水平也只有她过去的三分之一。她自嘲,自己还没那么有勇气。梦想于是暂时搁浅。
时隔 10 年,在创过业(一家极限运动内容社区),去过大公司(字节跳动、B 站),也在 AI 大模型公司阶跃星辰做过二次元社区产品 “狸谱” 后,她终于决定出来延续梦想。
事情进展得很快。闹闹今年 7 月从阶跃星辰离职、组建团队,8 月正式启动,11 月就拿出了 AI 动画产品 OiiOii 的测试版。这是一款专业的创作工具,用户通过输入故事创意或者人物形象,艺术总监、编剧、角色设计师、分镜师、音效总监等智能体就会协作完成,最终输出一个成片。
正式采访闹闹之前,我试用了 OiiOii 这个产品。它与我们曾经报道过的 Movieflow 有相似之处:都是对话框输入想法,网站输出成片;并且也是多个智能体(类似一个团队)协作完成。
但也有不一样的地方,Movieflow 是将多个智能体的协作封装在后台,用户无法在不同的节点上参与,而是直接获得成片;OiiOii 则不仅将协作的工作流透明化,而且还提供一个可供随时编辑的画布,用户作为 “导演” 可以随时介入调整,更有创作的参与感。
作为一个初次上手的用户,我用 OiiOii 随机、自动做出来作品除了在分镜的衔接上有些生硬外,整体效果已经非常不错。市场对 OiiOii 的态度也超出预期:原本产品上线时,只计划招募 100 个内测用户,但结果引来了 10 万人在排队。
投资人也很热情,在对具体方向还犹疑的阶段,锦秋和高瓴就拿出了几百万美元提前锁定;产品出来后,更多的投资机构进场,短短几个月的时间里,OiiOii 的估值就已经过亿(美金)。
“以终为始” 地做内容社区
2025 年下半年,如果一个创业者说要做 AI 动画,大部分人会关心的问题是:这是不是为 AI 漫剧提供工具?毕竟各大视频平台都在加注这个行业,抖音一个月漫剧相关的播放量就超过了 60 亿,也有无数 AI 漫剧公司赚钱的消息传到市场。
闹闹承认,在最初找方向的阶段,她的确考虑过,但最终没有将漫剧作为主要目标,因为这需要极强的剧本能力和投流经验,而这并非她自己和团队的优势。
此外,漫剧和动画虽然形式类似,但内容底色不太一样。用一位行业人士的说法是,AI 漫剧其实是动画形式的短剧,属于 “抖音科”,而不是动画科。
更关键的是,漫剧最终目的是为了制造爆款,往往会有套路和局限,但闹闹希望 OiiOii 不管在风格、还是表达的内容上,有足够的丰富性、能覆盖更广阔的想象力,也能承载一个生态。
闹闹将目光锁定在了全网约 200 万个 ACG(动漫游戏)类的 PUGC 账号上。
这些创作者面临的最大痛点是产能——一个几分钟的动画,往往需要两三个人耗时一周制作,“如果我们能让他们从 ‘周更’ 变成 ‘一日两更’,这个产能释放是颠覆性的。”
而且除了 ACG 博主,闹闹想到,做历史的、教育的、科普的、财经的、职场的各类创作者都适合动画的形态来展示,因为动画是比真人拍摄成本更低、想象力边界更宽的表达方式,“没有现实生活中拍摄的场景,其实都可以用动画来展示。” 内测期间,涌入的用户也正在佐证这一点。
不过闹闹对 OiiOii 的设想,并不止步于工具。在她的规划里,工具是一个过程,社区才是最终的形态。
她在字节跳动时,做过抖音特效和剪映。那时候,是先有社区(抖音),后有工具(剪映);但在 AI 时代,她认为逻辑可能是反过来的。因为在内容平台如此之多、内容消费供大于求时,大家对单调的内容容忍度在变低。所以,OiiOii 必须从一开始就帮助用户创作出消费属性足够高的作品。
这也给了她 “以终为始” 的思路,即未来她想构建一个什么样的内容社区,就可以提前提供什么样的创作模板,比如想做某种特定风格的动漫 MV,就把这个模板提前植入在工具里——一如过去的抖音特效和剪映模板——普通人通过这个工具,能像专业创作者一样产出对应内容。当内容足够多、足够丰富时,社区自然就构建起来了。
OiiOii 目前的重点,是修补体验(音乐、故事类的)和填充垂类(搞笑的、科普的)的内容模板;到 2026 年 2 月她们会考虑出海,“海外的内容丰富度会更高,一旦摸透了脉络,那将是另一个量级的市场。”
为了继续完善功能,OiiOii 现在仍是以邀请码的方式对用户开放,为了杜绝黄牛等非真实用户,她甚至给已注册用户的邀请机制设置了限制:必须登录 3 天、真实使用,才能发出得到邀请码。
创业者的 “抗体”
OiiOii 是闹闹的第二次创业。2014 年,腾讯产品经理出身的闹闹,凭着一股热血裸辞,创办了一个极限运动内容社区。她玩滑板、拍纪录片、办线下赛事,靠着激情和 “冲动” 来自我驱动。
那是一个属于 “大众创业、万众创新” 的年代,氛围中弥漫着一种热潮;前两年,这份事业也在上升期,但外界很多赞扬,让她隐隐感觉到虚空,“我总觉得很多东西没有跟上,就是那个底子很空。”
当时的现实是,她们做电商,但没有充分的准备,做不深;做线下活动,也没办法规模化。后来,这些的确变成了公司往下走的漏洞,虽然还侥幸生存着,但始终长不大。
闹闹说,如果要总结上一段创业经历给她留下了什么,那就是 “抗体”,“有点像那种有一个病原体一样,它侵入你,你可能病了,然后你自己长出来了抗体。”
2017 年左右,公司的经营状况下滑到了谷底,她个人的焦虑也达到了顶峰。但幸运地是,她在这个谷底里找到了 “触底反弹” 的力量。
对闹闹来说,这种力量本质是一种精神力。她从佛法中习得了一种平静广大的东西,接受了无常,放下了自我,然后发现,“当你不用力去维护自我感的东西时,所有一切都变得很轻松;你的焦虑自然而然降低了,因为你知道你最终一定是安全的。”
当恐惧消散、内在安静下来之后,她也重新找到了解决问题的方式,逐渐走出了困境。
带着这种 “抗体” 和第一次创业的遗憾,她进入了字节跳动。在字节的几年,她幸运地赶上了抖音增长最快的几年,能力和经验迅速得到了放大。她接手了抖音特效业务,亲手打造了 “变漫画”、“变老变小” 等全球爆款;她负责剪映,从 500 到 600 万的日活,做到 3600 万。
她概括自己在抖音最大的贡献在于,以剪映的模板的和抖音特效的业务逻辑,为抖音的投稿和社交关系的增长起到了很大作用。
在字节,她也见识了什么是极致的组织效率,什么是用数据量化创意,随后短暂的 B 站经历,则让她看到了大厂的另一面:B 站有着全中国最好的动画土壤,但她发现大家都在 “循规蹈矩”。
这段经历也让她看清了两个事实:一是产能与消费的不对等:用户对动画的需求在暴涨,但制作门槛太高;二是只有 AI 能把动画制作的边际成本降下来。
去阶跃星辰是顺着这个逻辑的另一个故事,她在这里做了产品 “狸谱”,一度达到百万的月活;但发现在模型公司,应用产品很难成为第一优先级。
2025 年 7 月,随着 AI 多模态模型终于成熟到可以商用的临界点时,闹闹知道,离开创业的时机到了。
为完整呈现创业者的思考和个人特点,以下为筛选编辑后的部分问答:
AI 时代,工具与社区先做哪个?
晚点:为什么 OiiOii 没有延续 “狸谱” 的方向?
闹闹:都是在做动画,只是切入口不太一样。狸谱是做 UGC 的,但现在的这个节点,我觉得可能还没有 ready,包括用户体量、投推广投放,推理成本,社区的留存可能都还没有到时间点。
晚点:如果你判断 ugc 社区这个时候还不成熟,为什么在阶跃的时候可以做?
闹闹:当时(2024 年)整个多模的能力没有像现在这么好,你要做一个完全有消费属性的内容工具,其实很难。而且其他家模型厂商也在做工具,我没有想清楚和其他家有什么不同;但是社区会有一些粘性,所以我就先做了社区。
这其中,也有一点点过去的路径依赖。比如,我们看抖音的发展,是先有抖音再有剪映,也就是说先有一个社区产品,再有一个工具,看起来是一个 UGC 到 PGC 的发展的过程。我当时觉得,可能在 AI 时代也是这个路径和顺序,所以就先做了社区。
晚点:现在的思考是什么?
闹闹:出来之后,我的一个思考是,这种推演可能有部分是成立的,但有部分不成立。
它不成立的点,在于这个时机。这个时间点,大家已经消费了非常丰富的内容了,它不像抖音的初期,可能大家没有那么多的内容可消费,所以它的单调大家是可以接受的。
但现在,大家已经习惯有丰富多彩的内容了,我既然能在其他的平台上能消费很好的东西,我在你这儿稍微玩一玩,没有什么太多吸引我的东西就留不住大家。
所以,你第一时间要保证你内容的丰富度是够的,你的消费属性要高,这样你才能留住那些用户来消费。它和之前的路径不太一样。
而且出来的时候,整个多模的生成的不管是图也好还是视频也好,它就已经相对来说比较完善了,都在卷。那我觉得是时候可以做一个工具,然后把把内容的消费属性给做上去。
而且现在先做一个工具,和原来的工具还有点不太一样。因为 Agent 的工具它其实可以 “以终为始”。
什么意思呢?以剪映为例,它分成两部分:一部分是剪辑工程的部分;一部分是剪映的模板。模板的那一部分其实是跟着抖音的生态走的,我只有用这里的模板才能制作出来抖音里流量比较大的卡点音乐内容,它其实就是以终为始的一个工具。
它的目标是,我要做一个什么内容,用这个模板就能做成。这其实是不可替代的。做 Agent 工具,可能就是有点像是做某一群的某一类内容,有点像模板的那种生态,它是以终为始的。
我们在模型和达到这一种内容之间,其实做了很多调优的工作,有点像把专业创作者的能力包装成一个 prompt 的模板,然后给普通人用。而且这个模板的优势是,哪怕是你的 prompt 完全一样,它出来的内容也是不一样的。
而你,以终为始的话,你就可以去想,我这个内容社区里头到底要多少种内容?多少怎么丰富它的内容?比如,我就想要卡点音乐的,或者想要混剪的动漫 MV,那我就把这个模板植入在里面,你就能很快的出这种内容。
有点像我想让你创造什么类型的内容,你就可以用这个工具创造出来。这某种程度上,是在为构建这个内容社区做准备。
能力壁垒:要既懂审美、内容,又懂技术
晚点:我看过类似的产品比如 Movieflow,他们是把所有 Agent(编剧、分镜师、灯光师)封装在后台,用户给个 Prompt 直接出成片。但你们选择把工作流透明化,让用户看到每个节点甚至去编辑。为什么这么选择,这样做会不会门槛太高?
闹闹:之所以不封装,是因为觉得 AI 还没到能全自动完成一个完美片子的时候 。 现在的节点,还是需要人的配合。
另外,我觉得创作者,是要享受一点点创作感的,他得要有掌控感。其实我们想把创作者当成导演,他在控制整个团队,即便是很多东西是团队做过的,但他自己会有这种掌控感,他会有说这个作品是由我来触发的,这个感觉很重要的,他需要有一些参与感在里头。完全自动化的话,我觉得这个参与感很薄弱。
晚点:这种透明的工作流加上可编辑功能,开发难度是不是比封装的高很多?
闹闹:多 Agent 之间的相互分配工作,到底是谁来判断,谁来分配,要怎么理解,这里面有巨大的排列组合问题;我们天天都在解这种排列组合题 。
而且你要保证流程稳定,又要允许用户随时跳出来修改,改完还得能跳回去继续走流程,这里面的不确定性指数级增长,在基础架构上相对来说要复杂很多。
晚点:你们的产品在审美上很有特点,比如乐高风、插画风,但现在的模型如果不具备这种风格,技术上怎么解决?
闹闹:这本质上有点像 “抽卡” 游戏 ,如果他有好的表现,我们就去强化这种表现。如果没,就看他的是在什么条件下变成了这种好的表现;如果完全没有的话,我们就先会把那个风格给去掉。
现在图片模型和视频模型,各有各的好、各有各的不好,没有一个完美的模型,这也是我们的机会。只有大家都没有那么完美的时候,我们才有排列组合的可能性。
比如 Midjourney 保风格能力很强,但保角色一致性很弱;Nano 或 GPT-4o 保角色强,但保风格弱 。 我们就在做各种排列组合:如果用户想要风格强烈的,我们可能这就调用 MJ;如果用户更看重角色一致,我们就用 Nano。 视频模型也是,如果是大动作冲突,可能用海螺(Hailuo);如果是细腻的哭戏,可能用可灵(Kling)或者即梦。
晚点:这个选择和判断,是 Agent 的自动的智能判断吗?
闹闹:我们在图上不是智能的,因为它要求的稳定性比较强的,模型达不到这种稳定程度,让 agent 去判断一定会出错。我们现在是用工程的方式,把各种排列组合做完以后,用工程的方式规定好;但在视频模型这一块,我们是做智能选择。
为什么视频模型和图片模型有这种差别呢?因为视频模型上它是模糊的,不是说我一定要这样,而是大概率是这样,而它大概率在那块儿是好的。如果是一个概率决定的东西,那就可以用模型来解决,可以智能判断。但图片不一样,它是一个百分百的概率,那就一定不能用模型来解决。
晚点:大家都用这些模型,你们的能力壁垒在哪里?怎么保证你们的排列组合比别人好?
闹闹:这里面有几个东西。你要对你生产的内容非常敏感,知道里头的要素是什么;然后你要把内容拆解,知道组成的过程里每一步的元素是什么,也得看到怎么才能表达出最好的效果。
这个背后还是看人,因为我在抖音做过特效业务,如果我没做过,我也很难 get 到这里头的人力模型是什么样的,它就是你既要懂审美、懂内容,又要懂技术。简单说就是左右脑都非常发达。这类人其实是很凤毛麟角的。
然后,你怎么找这群人也很关键。我已经比较熟悉怎么去找这一群人,我们现在的设计师和产品经理,基本都是这类人,他们有点像游戏行业的 TA(技术美术),这种团队配置是很难复制的。
“这个世界很多事情是由精神力决定的”
晚点:这是你第二次创业。第一次创业经历给你留下了什么?
闹闹:上一次,在创业大浪里,身边的公司融资特别多,但是又消亡的非常快。你其实也被那种氛围给带着走了。公司本身的起起伏伏是非常正常的,你会看到很多创业者,0 到 1 非常容易就做出来了,但他一定会是反复的,很多人往下走的时候就没了;然后又从 0 到 1,又 0 到 1。
我个人觉得很宝贵的是,我一直在坚持做这件事情。14 到 16 年的时候,我们涨得非常好,但在最好的时候,别人在在夸赞的时候,我心里反而是有一些担忧在的。我总觉得很多东西没有跟上,觉得一定会下来。最后确实下来了,然后就焦虑。
在这个过程里,我觉得我幸运的是,我找到了着陆和反弹的力量。就是有点像病原体一样,侵入你之后,你可能病了,然后自己长出来了抗体。再遇到问题的时候,你就不再有那么强的焦虑感了。最后,我们平稳且往上走了一段距离,然后往上走的时候我就离开了。
晚点:具体是怎么触底反弹的?
闹闹:我觉得不是业务上,是个人的状态的变化。16 年底,我开始发现,有些力量是非常竞争意识的;但是我感觉到好像还有一股力量,是非常平静但是很广大的东西,它是细水长流的。后来,我开始冥想,打开了一个新的世界。
我觉得人容易焦虑,首先是对无常的不可接受。好的时候开心,不好的时候伤心,你把这个我放到了最前面,你要维护我的这个形象。但其实这只是你的一个壳子,真正的你是非常宽广的,是非常安全的。你找到了内心的平静时,会发现外在的评价其实就是针对那个壳子;你会发现所有一切都很轻松了,你的焦虑自然而然就会降低了。
大的铰链去掉了,人就会安静下来,思考我到底应该怎么去聚焦,怎么一点点恢复。这时候你才真正开始想办法。当你真的聚焦在一步一步去做的时候,事情就慢慢好起来了。
如果没有底层的安全感,虽然表面上说该怎么办,但其实你不是真正的在想,而是在害怕那个结果。但实际上,那个结果没有你想象中那么严重,很多恐惧都是想象力制造的。
所以最终,这个世界很多事情是由精神力决定的,虽然听起来很玄幻。
晚点:带着这种抗体,你后来你去了字节做剪映和特效,怎么评价这段经历?
闹闹:那段经历是很享受且纯粹的。那是 19 年到 22 年,当时的字节组织能力真的很强,比如说我们做的特效爆款这个业务的时候,需要抖音的运营和市场的同学,我们不是一个大的部门,但只要你的目标是非常一致的,马上别人就拉过来,支持你去做这个项目,非常迅速。大家都在打一个胜仗的那种感觉。
第二个是,字节平台的各种基建是非常完善的,当你去想要用一种科学的流量的方式做很多东西的时候,它的数据是相对来说比较健全,策略也是非常 make sense 的。
晚点:那离开的原因是?
闹闹:我还是很想做跟创作者相关的业务,但后来组织架构变更,创作者服务被打散到了各个业务线,有很多的这个工种的人去了另外一个组织。那我没办法协同好两个大组织,也没办法聚焦做我想做的事了。
当时我还有几个选择,不过我想了想,字节最擅长的东西都是很套路化的、很数据的、很推荐引擎的这些东西。但我想做的这个内容,它其实是感性的,我觉得自己在这个环境里是,其实很难生存下来的。想来想去就觉得,虽然它们都是内容,但可能也会拧巴,所以我就先走了。
晚点:后来又去了 B 站,原因是什么?
闹闹:刚好有一个机会,可以了解所有的 up 主、工作室、大制作,以及全中国动画产能的机会,我觉得很难得。因为如果我还是很想做动画的话,对这个市场情况不了解,肯定是做不了的,所以就去 B 站了。
B 站的创作者和消费者真的是质量比较好的,我在 B 站的时候,说过我想做 AI 动画的东西,但是当时的技术资源和财力资源都无法支持,我觉得挺可惜的。
这段经历,也让我看到了 AI 动画有非常大的可能性,因为它的产能是真的很有限。大家对他的需求又高,产能被憋着了,被阻碍了。
晚点:最后一段职业经历,为什么选了阶跃星辰?当时 “狸谱” 也有一些出圈的东西,比如 “灵魂提取器”,这是怎么做出来的?
闹闹:我当时是一定要去做 AI 动画这件事情,然后就考虑去哪做。
要么是回大厂,技术特别好的大厂,但明显大厂是不会做垂类的,它一定是通用型的东西;另外,当时 MinMax 还没有出视频模,阶跃它有 CV(计算机视觉) 的背景,我觉得应该是相对比其他的语言模型会更好一点,就去了。
做 “狸谱”,思路上有点像我们当时做抖音特效爆款,它就是一个好玩的东西,然后戳中大家传播的点,去想怎么才能让大家都玩起来。
所以,未来我们真的要做 UGC 社区的话,我们团队在这块儿是更擅长的。
题图来源:OiiOii 创始人闹闹
相关推荐
先抖音后剪映不再成立,OiiOii闹闹聊AI时代的创作工具和内容社区
B站推出“必剪”App,对标抖音“剪映”
Youtube也做“剪映”,剪辑工具能成流量收割机吗?
张楠辞任抖音集团CEO,未来将聚焦剪映发展
张楠辞任抖音集团CEO,将聚焦剪映发展
字节跳动推出海外版剪映「Viamaker」,视频剪辑工具兵家必争
Sora会“杀死“剪映吗?
移动视频创作工具赛道:资本和巨头的新战场
产品观察 | 抖音快手B站都有视频剪辑工具了,腾讯也为微信视频号做了一个
从抖音、快手背后的技术,谈AI内容产品的启发
网址: 先抖音后剪映不再成立,OiiOii闹闹聊AI时代的创作工具和内容社区 http://m.xishuta.com/newsview145903.html