出品|网易科技《态度》栏目
作者|丁广胜
1. 如何让文生视频更好用,Pika 再下一城。不仅仅是文生视频,AI 连音频也一并搞定,且非常逼真。Pika 说不好意思他们不再“静音”了,音频生成包括两个方法,一是输入 Prompt,二是直接根据视频内容匹配生成。Pika 把这一功能称为“ Sound Effects ”。目前开放测试版给到“超级合作者和专业用户”。
2. 输入 Prompt 生成音频或许不值得特别惊讶,大家乐见其成的是“根据视频生成”,即你让 AI 生成了一段视频,Pika 根据视频再帮你搞定音频,且这个音频完全符合现实世界 —— 让我想起了电影工业的昂贵“手艺人”音效师 —— 又一个即将失业的群体?
3. “这是工程上的一个小进步,从技术角度来讲,没什么”。英诺天使基金合伙人王晟告诉网易科技《态度》,虽然 Pika 生成质量方面还有不少问题,但这是趋势,AI 把各种模态都统一起来,用一个 Prompt 去解决,这大大提升了视频制作的流程和效率,AI 让这个事情变得非常简单,但本质上技术难度不大。
4. 在 Pika 的 x 博文留言区,引来了音频工作者的质问:能分享一下训练音频的数据吗?许多创作者担心他们的作品在未经他们同意的情况下被你们使用。
5. 文生音频其实比文生视频要成熟。经过网易科技粗略统计,市面上公开可用的文生音频工具多达 50 款,但生成质量层次不齐。比如,伦敦创业公司 Stability AI 在靠文生图获得大量关注之后,就曾于 2023 年推出 Stable Audio,用 prompt 的方式写歌,描述音乐流派、乐器、画面、感觉就可以生成一段音乐 demo。
6. 多模态是大势所趋,AI 将重塑创作的每一个角落。从大模型在文生图应用的大放异彩,再到文生视频 Sora 的惊艳众人。AI 定会不断的给我们惊喜,从文本、音频、视频的全链条 AI 化,这是通往 AGI 的天然场景,也可能是证明 AGI 的绝佳方式。
7.Pika 创始人郭文景称其对标的产品就是 Sora,当 Sora 横空出世之时,所有人都在为 Pika 捏一把汗,郭文景当时的表态是:“振奋人心,筹备直接冲”。今天率先推出文生视频的音频生成功能,想必是她冲击 Sora 的其中一步。
8. 这家公司成立于 2023 年 4 月,同年 11 月发布了 Pika 1.0。Pika1.0 的主要功能是:一是用文本和图像生成视频,只需要输入几行文本或上传图像,就可以创建简短、高质量的视频;二是编辑更改视频,输入相关文本,实现对背景环境、衣着道具等元素的增减或者更改;三是切换视频风格,例如在黑白、动画等不同风格中转化;四是更改视频的宽高比。2024 年 2 月 28 日,Pika 推出新功能 Lip Sync,允许用户为视频添加语音对白,并实现嘴唇同步的效果。而后,最新的更新便是今天这次。
9. 给大家看看 demo:
娱乐热点 造型 韩国 尺度 中国人 穿着 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-02-04
科技热搜 工资 行业 资产 北京 家庭 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-12-07
娱乐热点 宋仲基 卧底 池昌旭 智友 河正宇 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-10-02
科技热搜 ssd type-c 京东 酷睿 intel 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-06
科技热搜 笔记本 上限 全能 nfc 摄像头 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-02-23
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13