作者error405 (流河=L)
看板AI_Art
标题[闲聊] viduQ3影片动画生成模型 日本关注
时间Tue Feb 3 08:49:23 2026
https://www.itmedia.co.jp/aiplus/articles/2602/02/news075.html
以下是 Vidu Q3 的相关资讯整理(基於文章 + 最新公开资讯,截至2026年2月):基本
资讯开发公司:ShengShu Technology(中国 AI 初创,与清华大学等有合作背景)。
发布时间:2026年2月初(文章於2月2日报导,属於近期新模型,作为 Vidu 系列的 Q3
版本)。
官方平台:Vidu AI 官网(vidu.com),支援 Web 服务 + API。
核心卖点:业界首个在单一生成流程中同时输出原生音讯 + 影片的长影片模型(native
audio-video generation),不再需要後制配音。
主要功能与规格影片长度:最长 16 秒(业界领先,多数模型如前代仅 2-8 秒)。
输入方式:文字提示(Text-to-Video)、图片输入(Image-to-Video)、多模态。
音讯支援:直接生成语音旁白 + 唇形同步(lip-sync),支援日语、英语、中文等多语
言。日语表现特别突出,尤其是「动漫声」(anime voice)品质高、读起来自然,口型
同步违和感低。
画质与格式:Web 端输出 1080p(可选 16:9、9:16、1:1 等比例),支援 2K/4K 升级(
部分功能)。
进阶控制:提示可指定镜头运动(pan、tilt、dolly 等)、切换镜头(multi-shot / 智
能分镜)、转场。
其他特色:物理模拟更强、画面一致性高、支援字幕内嵌生成(非後制)。
与其他模型比较(文章与网路印象)优於 OpenAI Sora 2:提示追随度更好(尤其是镜头
运动与切换),lip-sync 更自然。
整体被视为 Sora、Kling、Runway、Luma、Veo 等竞争对手中的强劲新秀,尤其在音画同
步与日语/动漫风格上领先。
缺点:生成时间较长(8-10 秒影片可能需数分钟到 10 分钟),有时需排队。
日本走红原因日本 X 用户大量分享用 Vidu Q3 生成的动漫风格影片,日语发音 + 动漫
声优般的语调让人惊艳,唇形同步自然。
文章作者亲测後也认同:「日本语読み上げの精度は高く、特に“アニメ声”のクオリテ
ィーは高い」「リップシンクも违和感が少なく」。
动漫、Vtuber、轻小说相关创作者特别感兴趣,因为能快速做出带声音的短动画片段,省
去配音麻烦。
官方也有日文社群(如 @vidujapan
),并在 PR 中强调适合日本创作者。
使用与价格Web 端:直接上 vidu.com 注册使用(有免费额度或试用)。
API 价格:1080p 约 $0.16 / 秒(非高峰期可能半价),支援更低解析度。
许多第三方平台(如 fal.ai、Dzine、Media.io、Pollo AI 等)也整合 Vidu Q3 模型,
可免费或低成本试玩。
--
以上grok整理
以下转5ch
https://www.youtube.com/watch?v=XDvyLTlOaKY
https://reurl.cc/dqMA58
https://reurl.cc/jmno5Z
https://reurl.cc/QVvx7p
https://reurl.cc/Vmdl35
https://reurl.cc/qKl6mn
https://reurl.cc/aMWA57
至少在日文配音这部分算是有一定实力
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.217.153 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AI_Art/M.1770079768.A.54B.html
※ 编辑: error405 (114.36.217.153 台湾), 02/03/2026 08:54:37
1F:推 AoWsL: 效果确实比Q2进步蛮多的..不过要摸熟 还是选最高方案吧 02/03 12:11
2F:→ AoWsL: 一个月两三千那个 02/03 12:11
3F:→ AoWsL: 2/1速度 02/03 12:14
5F:→ AoWsL: 生一张费用90~150点(最长16秒) 02/03 12:15
6F:→ AoWsL: 没有错峰模式 所以... 打出来的影片都是真金白银 02/03 12:19
8F:→ AoWsL: 你连结好像都是坏掉的 02/03 12:28
https://greta.5ch.net/test/read.cgi/poverty/1770024160/
缩址也不行那我放原讨论串
※ 编辑: error405 (114.36.217.153 台湾), 02/03/2026 12:38:26
10F:推 ZMTL: 但我不太确定哪边是t2v哪边是i2v,但sora2的i2v理论上是倒数 02/03 15:56
11F:推 ZMTL: 的 02/03 15:56
12F:→ AoWsL: Artificial Analysis 02/03 16:06
13F:→ AoWsL: 右边T2V 。不错了啦...I2V确实没Kling强 Kling要出3.0了 02/03 16:07
16F:→ error405: LMArena资料还没更新 02/03 16:12
19F:→ AoWsL: Kling3.0 可能要翻车了..做了两张 好像 02/06 07:13
21F:→ AoWsL: 感想是..如果风格太奇幻(偏难的画面)做不出来什麽东西 画 02/06 12:01
22F:→ AoWsL: 面就是正常的风格 或很静态的风格 大约这几个月的加强水准 02/06 12:01
23F:→ AoWsL: 版本 也许我测试太少吧 毕竟才测试两张而已(等待时间太久 02/06 12:01
24F:→ AoWsL: 了) 02/06 12:01
25F:→ AoWsL: 阿你说这种画面能吸被AI影片荼毒的眼球吗? 其实还满难的 02/06 12:04
26F:→ AoWsL: 把它当2.0_2.1加强版使用就好 跟2.5_2.6又差很多 02/06 12:09
27F:→ AoWsL: Seedance2.0看样子窜起了 02/07 18:22