[問題] 辨識影片中人聲起始時間

作者: asid52714 (黑心人)   2019-05-17 09:42:29
請問版友,
若我有一隻五分鐘的mp4影片,
想要辨識影片中的人講話時的起始時間。
例如:00:02 大家好
00:03 很高興今天能夠參與此次會議
並不需要辨識語音內容再轉文字,
只要能抓到起始時間即可,
不知道有什麼套件可以達成這個任務呢?
感謝閱讀。
作者: sma1033 (死馬)   2019-05-17 11:17:00
若你的影片包含了除了人聲以外的聲音,那這個問題就很難反之,若影片裡的聲音非常乾淨主要都是人聲,那人工抽抽Feature,自己調一下應該就可以做個7.8成自動上字幕這種事情大家都想做,但是技術上還是存在瓶頸
作者: jiyu520 (不要鯽魚我)   2019-05-17 11:46:00
Voice Activity Detection (VAD)

Links booklink

Contact Us: admin [ a t ] ucptt.com