作者yshihyu (yshihyu)
看板Python
标题[问题] pydub 切割音讯
时间Mon Oct 7 20:13:35 2019
我有一本英文单字书 mp3档案, 每个档案是一个章节全部单字+例子
每个章节的mp3档案是 该单元的 单字念完後 会再念一个例句, 在念下个单字&例句 後面依此类推
我想制作成anki 去复习单字, 我使用下面网址程式码切割出来大致都没问题
https://gist.github.com/shihyu/8199c1839c565169f7552e419d29b829
但单字发音之前会先念单字数英文发音, 我不想要念单字发音之前先念个英文数字
想不到有什麽方法可以切掉英文数字发音, 有使用过pydub 有什麽建议嘛?
下面两个网址我想切割的单字档案
http://www.mediafire.com/file/51427vdcsfkcjsh/0002.mp3/file
https://www.mediafire.com/file/ln5knyhs1kzgr66/0077.mp3/file
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 175.181.157.77 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1570450421.A.DB6.html
1F:推 sma1033: 这个问题的答案应该会依照「英文数字」的资料样貌来决定 10/07 23:19
2F:→ sma1033: 不同的「英文数字」会有不同的作法,放几个样本给大家看? 10/07 23:20
3F:→ sma1033: 如果连资料长什麽样子都没不知道的话,很难推荐有效作法 10/07 23:21
※ 编辑: yshihyu (175.182.195.53 台湾), 10/08/2019 20:40:25
4F:推 sma1033: 开头的英文数字跟後面的单字发音中间会有很明显的停顿 10/09 19:29
5F:→ sma1033: 最简单的做法可以用振幅的波谷来分割切开就行了 10/09 19:31
6F:推 sma1033: 更进阶一点的作法可以用speech segmentation的套件像是 10/09 19:38
8F:推 sma1033: 这种资料内容还满规律的,理论上应该很容易做到才是 10/09 19:42
9F:→ yshihyu: 我使用 inaSpeechSegmenter 可以分析出来, 10/11 21:27
10F:推 sma1033: 唉唷,不错喔~ 10/12 23:56