Text-to-Video文生视频,继作文、绘画之后AI杀入的又一领域,有越来越多产品涌现。根据读者爆料,一款主打AI生成视频的产品,已经在小圈子内被频频提及,还是国产的。
量子位迫不及待浅扒了一段关于曹操的介绍,喂给它,得到这样一段视频:
在不经任何替换和干预的情况下,生成的视频画面符合人物、时代背景和部分文案提及的场景,效果还算不错。
最最重要的是,用它制作一段视频,几乎不存在“剪辑”这个步骤,比以往图文转视频的产品门槛更低,耗费的时间也更短。
但要评判这款产品到底是骡子是马,还得多次体验,再往深处挖一挖。
什么样的产品?
这产品名叫一帧秒创,本次体验的主角是它最基础常规的“文案一键生成视频”。
开头关于曹操的简介视频,是用该功能这样生成的——
点击该选项后,会跳出一个文本框供输入标题和正文,底端可以选择最终的画面呈现形式是横屏还是竖屏。
这一步骤实测下来,标题部分对后续内容生成影响不大,现阶段可以不用输入,后续AI会自动提取补充。相对而言,第二个需要输入文案内容的部分非常重要。
量子位做了如图文案输入:
点击右下角“下一步”,可以更改AI对文案进行的分类,也可以修改文案的分割。分割成n个小段的文案,承担分镜头脚本文案的功能,以便后续AI从素材库里匹配对应的视频片段。
在这方面,AI的分割效果没有出太大纰漏。
但从下图可以看到,此处AI把曹操title中的“书法家”单独作为一个分镜头文案,量子位对其进行了合并。
接下来就会进入最后的调试界面,分出两大板块,即左半部分的调整界面和右半部分的预览界面。
通过左侧的工具栏,在最顶端的场景部分,AI为文案匹配了12个视频片段。
12个视频片段中,原本AI为片段8生成的视频中出现了现代社会的外国人。也就是说,在画面内容和文案内容的匹配度上,AI能力还有所欠缺。
最终量子位通过小蓝框中的替换素材功能,在素材库中选择了更符合文案的视频画面。
12个镜头整体拉片式通看一遍,直观感受是视频质量算不上精致。虽然并非完全不相关,但还是与人类剪刀手的视频编辑水平有明显差距。
敲定视频片段后,在音乐板块挑选国风类型的BGM,又选择了“磁性浑厚”的解说男声,Logo和字幕都是默认选项。
一切确定,点击生成视频选项,就能在预览板块看到这一套搭配下来的视频效果,最终生成文章开头的视频。
历史分类的AI视频效果不错,那是否在每个分类下都有同等水平的效果呢?
又陆续还尝试了科普类(量子位文章,扔进去)、美食类(宫保鸡丁菜谱)等多种类别的文案,甚至还把谷歌Phenaki效果惊艳的小企鹅冲浪视频的6句文案丢给了它。
结果显示,科普类和美食类,生成视频的表现都还算文案和画面贴合。
但,小企鹅冲浪文案的生成效果就有些拉胯:
看遍视频画面的每一秒钟,从未出现过一只企鹅,连影子都没有……
Excuse me???
虽然部分画面也和文案有所关联,比如出现人在沙滩上走的第一视角视频片段。但和曹操视频的效果相比,可以说大相径庭,实在有点出乎意料。
无独有偶,国外有个Quickvid同样主打AI生成视频的功能,同样在小圈子里走红。而目前开放Beta测试的Youtube Shorts功能,和上述国内产品功能类似。
为了测试,把相同的小企鹅冲浪文案喂给了Quickvid。结果是,Quickvid生成的视频里,仍然不见企鹅的踪影,一帧也没有!
(谷歌Phenaki听后狂喜)
当然,Quickvid之所以走红,并不是因为生成的视频质量惊人。除了成为文本生成视频赛道的“早鸟”外,与背后的开发者密切相关。
开发者小哥名叫Daniel Habib,此前在Facebook的虚拟现实部门Oculus工作。
Quickvid走红是从今年2月开始的,当时它正式从内测转为Beta测试,仅2月23日一天,就有2万2千多人成为用户。本月ChatGPT开放API后,Daniel把它接入了Quickvid,成为了第一批ChatGPT生态内开发者。
量子位的视频编辑对两款产品也进行了试玩,用户评价是这样的:暂不认为这东西能威胁自己的就业。
但对于AI生成视频展现出的趋势,多少有点心有凄凄焉。
因为你不得不承认,用这玩意儿做视频,完全不需要懂得剪辑知识。而且做一条同等质量的视频,相比人工剪辑,用AI生成,时间和资源投入显著降低。
不完美的视频创作AI工具
不仅仅是Quick接入了别人家的API,事实上,今天体验的一帧秒创也接入了GPT-2的API,还用上了开源Stable Diffusion模型。
这不是猜测,是我们直接找到背后开发者“对质”后得知的结果。
一帧秒创背后的公司叫做新壹科技。
这个名字或许比较陌生,但这个“新的一”是“一下科技”的“一”。
一下科技,曾经多次站在视频风口上的公司,一直播、秒拍、小咖秀,都出自一下科技之手,这是移动互联网时代视频领域响当当的玩家。背后的团队,也是源自搜狐视频-酷6网-新浪视频一脉的视频内容老兵们。
其创始人兼董事长韩坤,在创立一下科技之前,以联合创始人的身份把酷6网打造成中国第一家在美国纳斯达克上市的视频网站。
新壹科技是韩坤手下孵化出的最新公司,现有团队在2020年年中开始筹备,领队人雷涛,现任新壹科技CEO,也是一下科技的创始团队成员。
团队正式组建的2020年12月,距ChatGPT出生还有一年,连DALLE-2和Stable Diffusion代表的AI绘画也还没有名声大噪,但春江水暖鸭先知,一下内部这支团队感知到了AI对于视频内容创作的方向性改变。
因为视频内容的传统和基因,新公司诞生之初,新壹并没有把自己定位为一个人工智能公司。
他们希望从首先解决创作者需求切入,让AI介入视频生产全流程,尽可能降低视频内容创作门槛。
通过AI能力,让用户以低成本制作视频,还能用秒拍平台上的视频为AI匹配提供一个庞大的素材库,形成规模壁垒。
把秒拍作为现成的数据库,这对新壹算是一个地利,不仅因为秒拍有10亿级规模的视频素材和数据,更因为秒拍能为一帧秒创进行版权授予,让AI生成的视频有版权保障。
后者简直解决了AIGC方面一直争论不休的大问题。
所以首款产品一帧秒创,有了明确的应用场景,也有了面向视频内容创作者、视频自媒体营销的方向。
这是一个集合多种AIGC能力的工具,但是,无论是文生图还是AI帮写,最终的目的都归于一处——把它们作为素材应用到视频生产流程,让视频生产更加高效。
为了高效和低门槛,一帧秒创尽量做到去剪辑化,创作视频的过程从开放式变成了填空式。
虽然距离产出极致和精彩的视频还有距离,但最直观的是,哪怕完全不懂剪辑知识的人,也能上手制作视频——甚至是批量制作。
△社交平台的剪辑小白用户评价
目前,一帧秒创方面也知道,自己生成的视频还不能和人工剪辑的视频媲美,但是足以应对一些应用场景,如科普类视频生成效果是最好的,批量生产内容可以应用到抖音本地生活推广。以及除了面向C端的高阶功能订阅模式,一帧秒创还有来自B端的商业合作,比如跟360搜索的合作,已经获得了不错的反馈。
对于一帧秒创当前的初创状态,新壹也透露正在通过一些具体的解决方案改进。
比如创作者集中的内容类别,投入更多的素材分析和标注成本;又比如推出私有化素材库,提高匹配率和视频片段替换率。
雷涛表明了一帧秒创的思路,称作为产品公司,新壹科技虽然没办法让技术和硬件等基础条件实现跨越式的发展,然而,能够在每一阶段适时提供符合当时阶段水平的应用,“这已经足够去忙了”。
他多次以智能手机时代开启后,移动互联网的产品开发机遇举例,也多次用新能源、智能车变革进程中的理想造车模式类比,话里话外,追求的不是一步到位,而是与技术基础设施和整个行业生态一起成长进步,而最关键的是,必须躬身入局,不能站着观望。
这其中自然有视频老兵对新周期的敏锐洞察,但也多少有些不甘心。
如果你对2015年以来的互联网江湖还有记忆,应该多少能感知这种不甘心的合情合理。在如今字节独大或抖音快手的双雄格局之前,秒拍和一下科技,才是短视频领域最火爆的明星公司。然而商场如战场,如今的结局和市场份额,已经再清楚不过了。
或许“赢回来”的最好方法就是赢在未来、赢在下一个时代。
而下一个时代就是AIGC。连比尔·盖茨都说,背后不亚于互联网的发明。
面向这个全新的创新创业赛道,已经分出了两拨创业者,走出不同条路线。
一条是技术路线,训练大模型,把底层技术牢牢掌握在自身的手里,做底层,做平台。但门槛极高,创业公司在底层大模型方面取得突破的难度和成本都会很高。
另一条就是面向需求和场景,走产品、应用、工具平台的路线,集成开源和开放的现有技术,先入场再发展壮大,这也是更多中小创业者和开发者最可见的机遇。
这两种路线也不稀奇。
一如当初苹果做出了iOS系统,有人对标iOS,要研发新手机系统,建立新生态;也有许许多多的开发者基于iOS做各种创造,在游戏、开发、创作、工具类别下疯狂推出各种适配iOS系统的App。
所以技术和应用两条道路,都能有玩家走到最后,完成商业化闭环,选择不同而已,没有优劣之分。
从来没有事实能笃定表明,其中某一种能一统天下。
据透露,走产品应用路线的一帧秒创,已经快速积累了近200万用户,每日的视频生成量在10万级——这算不算AIGC时代的船票还不好说,但至少让外界看到变数发生的可能。