作者asid52714 (黑心人)
看板Python
标题[问题] 辨识影片中人声起始时间
时间Fri May 17 09:42:29 2019
请问版友,
若我有一只五分钟的mp4影片,
想要辨识影片中的人讲话时的起始时间。
例如:00:02 大家好
00:03 很高兴今天能够参与此次会议
并不需要辨识语音内容再转文字,
只要能抓到起始时间即可,
不知道有什麽套件可以达成这个任务呢?
感谢阅读。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.137.149.99
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1558057351.A.8F7.html
1F:推 sma1033: 若你的影片包含了除了人声以外的声音,那这个问题就很难 05/17 11:17
2F:→ sma1033: 反之,若影片里的声音非常乾净主要都是人声,那人工抽抽 05/17 11:18
3F:→ sma1033: Feature,自己调一下应该就可以做个7.8成 05/17 11:18
4F:推 sma1033: 自动上字幕这种事情大家都想做,但是技术上还是存在瓶颈 05/17 11:22
5F:→ jiyu520: Voice Activity Detection (VAD) 05/17 11:46