n_214128
您当前的位置:汽车发烧友 > 热点

让霉霉说地道中文,背后玩家7个月收入百万美元

添加时间:2023-10-24 04:20   来源: 投资界   阅读量:15941   

最近,霉霉说地道中文的视频在全网疯传。

没有机械的翻译腔,霉霉用自然而地道的语气讲述自己最近的游历,甚至连嘴型都卡点对上,效果堪称绝绝子。

还没有看过视频的小伙伴们,原视频奉上

视频作者表示,想要做出效果这样的视频,其中有三个很重要的因素:掌握地道的口语翻译、语音克隆和替换嘴型,但没有提到具体用到的模型。

看到视频效果如此好,不少网友就开始试图找到“复刻之法”。

一位网友就表示需要至少三步才能达到这种效果,Whisper识别、Tortoise-TTS合成带原始说话人音色的语音、Wav2lip换嘴型。

视频火了之后,吸引了更多人开始尝试,其中背后一款AI工具也被网友迅速扒出。

这不扒不知道,一扒吓一跳,这个工具竟然还是来自国内的一个初创团队搞的。

全网爆火,HeyGen被网友疯玩

全网火爆,网友纷纷动手玩了起来。

网友Gorden Sun也复刻了一段霉霉说中文的视频,在排队等待7000个视频后,用HeyGen制作的视频翻译终于完成了。并直言:“效果*目前*,没有之一”。

从视频可以看到,无论是口型*,卡点和嘴型都对的。

不过作者也表示,虽然声音克隆稍有缺陷,毕竟HeyGen只通过40秒的视频来克隆音频,如果刻意对比原视频,情感还原度稍有欠缺。

HeyGen虽然可以免费试用,但只能生成1分钟时长视频,且生成需要等待很长时间,而付费版*的也要24美元/月。因此,就有热心网友贴出了如何用开源的工具,做出和HeyGen生成效果同样的视频。

比如,语音转文字whisper、文字翻译GPT、声音克隆+生成音频so-vits-svc、生成符合音频的嘴型视频GeneFace++。

除了这种中英互译的视频,HeyGen在外网也是一片火爆景象,各种玩法都有。

比如,这位网友就用HeyGen制作了说6种不同语言的视频。

HeyGen火爆程度可见一斑,而近日根据推特上一位分析师Will的统计显示,今年8-9月,各大文生图类AI网站的访问量均开始呈现下降趋势,但HeyGen的访问量却上升了92%,流量跃居各大独立AI网站之首。

图源:网友Will推特

那么,这个被众多网友狂推,成为AI独立网站之首的HeyGen,到底是什么来头?

国内创业团队,7个月收入百万美元

2020年12月,HeyGen的背后玩家“诗云科技”在深圳成立。

据36氪此前报道,公司成立之初,就以“用AI生成内容,让用户以更低成本完成内容创作”为愿景,已获得来自红杉中国、真格基金等风投们累计近千万投资。

HeyGen要做AI视频创作领域的Midjourney,在团队方面竟也有一些相似之处。目前,HeyGen的团队只有大概30人,分布在全球各地,以远程办公形式进行合作。

HeyGen的前身,一款名为“Movio”的AI视频翻译平台,背后所依靠的模型是自家的多模态内容生成引擎“Surreal Engine”。

2022年7月,诗云科技推出多模态内容生成引擎Surreal Engine,将内容生产分为Understanding、Framing(视框化)、Rendering(渲染)三个步骤。区别于市面上的两大3D内容创作巨头:Epic Game的Unreal Engine和Nvidia的Omniverse,Surreal Engine让普通人也可以轻松进行高维度、可交互的内容创作。

得益于此,HeyGen的最新版本Joshua Avatar 2.0在实时生成人物视频方面逼真度方面表现出色。

这不,连公司创始人都亲自上阵打广子了~

不仅如此,HeyGen的产品正式上线后的一年不到,创始人Joshua Xu就发表博文表示:HeyGen在7个月内实现了100万美元的ARR,并保持连续9个月50%的月环比增长率。

目前,HeyGen可以支持50多种语言和300多种不同的音色,用户可以上传自己的照片进行个性化形象定制,HeyGen也贴心地为用户提供了上百款数字人素材和模板。

盈利模式方面,HeyGen主要依靠C端客户付费,视频生成付费模式分为“创作者和商务(Business)”两种,*24美元/月。也支持“声音克隆、人像精调”单独付费。未来将逐步开放API接口、团队协作和企业功能。

HeyGen可以基本保证1080P的分辨率,满足广告、电商、新闻等行业的需求,还能帮助用户制作PPT。此外,HeyGen还提供了文本转视频、音频上传、视频分享和多种场景视频等功能。

当然,HeyGen还处在成长期,并不是*的。目前,一些技术问题还会存在——比如生成的AI视频存在视频抖动、眨眼频率过高等问题。

不过,HeyGen目前正在趁着这一热度全力冲刺。上周四,HeyGen就在一场线上会议中展示商业版本的各项新功能——商业用户可以用HeyGen生成长达3小时的内容,画质最高可提升至4K,这一切工作都可以在新上线的并排脚本编辑器、集成的校对模块中进行。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

猜您喜欢
  • 内外大变样!畅销全球的本田CR-V迎来第六代
    内外大变样!畅销全球的本田CR-V迎来 就在昨天晚上,美规版2023款本田CR-V正式首发亮相,这是CR-V家族的第六代车型,整车的内外...
  • 欧萌达打破次元壁,售9.29万元-12.69万元
    欧萌达打破次元壁,售9.29万元-12 7月12日,奇瑞欧萌达在深圳举办了一场别开生面的上市发布会暨新潮派对,奇瑞全新产品系列OMODA...
  • 搭载3.5L V6机增引擎 路特斯Emira V6车型上市
    搭载3.5L V6机增引擎 路特斯Em 近期,路特斯宣布Emira V6车型正式上次。此前,Emira仅推出了2.0T版本车型...
  • 特斯拉销量急剧下减,保时捷又推出电动跑车,决策不当or破局?
    特斯拉销量急剧下减,保时捷又推出电动跑 大家周日愉快,欢迎收到新一期的汽车资讯,相关数据显示汽车市场一片大好,家用汽车品牌,豪华汽车品牌...
  • 同台竞技狂飙不止玩王牌竞速游戏赢领克03实车!
    同台竞技狂飙不止玩王牌竞速游戏赢领克0 2022年,在现有汽车运动系统的基础上,林克在《赛车超腕》前线打造了汽车运动系统专属IP,以赛车...
  • 一汽丰田RAV4荣放双擎E+2022款上市售价24.88-29.68万元
    一汽丰田RAV4荣放双擎E+2022款 7月11日,一汽丰田RAV4创新一代高性能运动SUV携双擎E+2022“高能”上市。新车推出四款...