Re: [討論] AV字幕請教

作者: bluewild (bluewild)   2021-10-26 00:43:10
※ 引述《bluewild (bluewild)》之銘言:
: 大家好
: 潛水了這麼久也想對本版有點貢獻
: 常常遇到一些AV迷片,沒有字幕覺得有點可惜
: 聽不懂在演什麼
: 我又不是很愛光看肉搏戰的那種[email protected][email protected]
: 正巧最近在訓練AI給日本片子上字幕,用了很多的步驟
: 想說回饋本版,不知前輩們有沒有什麼片子很想要看到字幕,但卻找不到的~
: 如果有的話,請推文番號給我,我會試著產出字幕檔
: 當然,有產出的srt~我會在本版放送回饋~
: 但是如果沒能產出,也請見諒
: 也許我找不到片源,或者是其他原因使然~
: 另外,我會用DeepL來進行翻譯,聽說這個翻日文比谷歌好
: 一切都在進行中
: 感謝大家給我資訊^^
: 第一次在本版發文,如果有違反版規,請告知,必將立刻刪除~~
: 謝謝大家
大家好
我非常意外會有這麼多人貼給我
本來想說進行AI上字幕研究
感謝大家的踴躍貢獻番號
我將今天的成果跟大家報告
大家可能不要太失望了
遲到現在才能上線貼文,讓大家久候
非常抱歉
之前我有針對AI進行日語課程的自動上字幕化
算是可以的,成功率大概30趴吧,也就是說大概十句有七句必須人類協助處理。
我也進行過多拉A夢來當試驗,基本上也差不多。
所以我才想說來試試AV,本來想說跟大家收集幾個番號~
大家這麼給面子,小弟非常感動,也非常惶恐XD
今天我大概是進行了影片下載
(由於還在很原始的雛形,所以我先拿朋友給我的AV進行)
我大概找出如何批次下載肉料的方法~但是這不是本篇重點 所以就不提(而且也違反板
規的樣子)
總之我本來想說可以批次下載=>批次錄音轉字幕=>批次翻譯=>大功告成
(之前日語課程就大概是這麼做的)
結果我想得太美,日本AV是一個難以突破的口。
跟大家報告今天我試過了非常多的方法,有谷歌的,有DeepL的,還有百度、fb等,各種
大家、小家的日語翻譯工具。
(我當然是將翻譯的動作給專業的去做),結果成績非常淒慘,大概只有0.5%的成功率。
我的意思是大概十句有9.5句都需要人工編輯。
幾乎除了幫忙找Timecode之外,翻譯幾乎都是廢的。
我研究了之前為何可以,遇到AV為何失敗的原因。
主要是谷歌、Deepl等公司他們所訓練的日文,都是口語日文。 首先收音必須是字正腔
圓,所以我之前轉日語課程都可以成功。
但是AV裡面太多嗯嗯喔喔,而且充滿了奇怪的腔調
這在轉換音檔的時候會遺漏非常多
另外谷歌等廠商的翻譯功能,也都是在彬彬君子的風格下訓練的。
給他最髒的文,他也不會翻譯到很臭~。
但是在AV裡,很多不堪入目的語言才是重點。結果他卻翻譯成像旅遊節目一樣~~
後來我有去找有沒有dirty talk等的日語AI,(我一定是去找別人有沒有做好的,不可能
自己去訓練@[email protected])
目前並沒有看到類似的東西,所以今天忙了一天,但是成果非常的不能滿意。坦白講,連
讓各位脫褲子的程度都沒有,更別說興奮了@_@
看樣子AI給日本AV上字幕,還是得要人手介入~
以下是今天的成績
大家一起笑笑~~開心一下^^
透過坊間專業AI聽打日文的軟體成果
範例:BBAN-326
ねふふふうんやっぱりきれいなうんちょっとはいああきれいな指うん恥ずかしいええは
いはいお普通にああおお!うんうんうんうんうんはあはあはあはあはああああああああ
あだけすごい気持ちいいうんうんうんあ、めっちゃいいはいはいココイコ行くああふふ
ふうんうんうんうんええあああーああはいはいはいはいうんうんうんああ中孝介確かえ
えはいピッああうんうんですええあーえっ本当と緊張してるやばいですよやばいよええ
どんな人くれるだろでもなんかエクトルしてた感じ人そうだったよ本当ふふ大丈夫かな
大丈夫うん絶対大丈夫単にせるふふふ先生人見知りだもんごめんねはいはいはいはいは
いはいはいはいはいはいうんはいたまに道の真ん中ですはいよろしくお願いしますはい
そっそれはふふうん一ええ全然ない全然へーそうですね選択だしうん流されたすいませ
んいやいただきますかはいええええはいああおいしいおいしいはい凄いよねねやっちゃ
うよ私より強いふふふ普通の店ちゃうからねそうですよね結構そういうアプリって使う
んですかそうですね結構使ってへなんなんそう何回か凄い凄いね初初めてですねうんそ
うだねそうだねへーおいしそうだねうん食べようんうんうんそうかああいいそうだね結
局独身じゃんそうですよねねくださいはいはいうんええ姿勢そうしてミシックちゃうん
これ食べたんじゃいやうまいはいはいはいはい大丈夫そうええいつも聞いてねええ私は
そうですねうんはいそうなんだから私ものんびりできるうんはいはい聞き取りやすい私
も感じて凄いねそういいねああうんうん二人は何で付き合おうってなったんですかなん
でなんでそれそれすごいうん私も初めて見た時からつけたいと思うええ一つの流れなん
です行ってもねそっかどんなテレビだよねええはいええうんああ始まってですね一すじ
ゃ何ね?あんまり分からないねなんか凄い緊張ねめっちゃどきどきしたりそうですか私
たちも最初は緊張しだよね?ええ今持ってる気がしてきましたうんやっぱり楽しくなっ
てきたよね本当にあんまり会わないね確かに分からないうんうんうんふふふうんうんへ
ーね香港だね大丈夫大丈夫だようんそうすね同棲したいよねなんかうんこれ前かみたい
なやっぱりただあそうそうそうそうそう結構ね見てたりしてうん一緒にうんそうだねそ
うだねみたいな感じうん楽しい一緒に住んでいるああそうええいやでも最近だよねそれ
は楽しいおすすめですね凄いね解説ねうんですね別に毎日愛ですねそしたら喧嘩とかし
ないうんうんうんはいこれねああ確かにそうもう年だからね怒る気力もなくなるねだか
らすごい新鮮ねね最初は違うちまったねねどうやって来るんだよねべたべたしてたから
そうですよねねえよいしょ皆さん講演をやってる人で悪い人いないよね嘘これなんかた
まにの人とかいそうじゃないですかそうだよねそうな顔をした方がいいかもしれないね
ちゃう声えうーんおなかいっぱいはいはいふふふええええはい一度に乾杯ふふふいやい
やいやうんめちゃくちゃうんうん禁止するはいふふふええうんえー怖い私ええはいはい
よしうんうんうんうんうんうんうんそうそうちゃんて凄い一かわいいナニイロ今日嫌い
じゃないよ、そうだよね色ねおっぱいしか見えないちょっといい感じええそうじゃない
今日はピンクピンクピンク好きあ、そうなんだいやねええすごい下がるじゃんあれ引い
ちゃった凄い面真っ白ねみんな手冷たいえどこが好きなんですかどこが好き終わられる
とかうんとね私この辺好き国三行ってるんだそうそうねだなっちゃったらすぐ乳首寝る
んだ
我只看到あはああああああああ~~哈哈哈
放棄
換成谷歌speech to text API 「聽」打出來的日文
Srt 檔案內容:
1
00:00:53,980
作者: DareJ (幸運之星)   2021-10-26 00:54:00
試試逃亡中啊~ATOM-010 https://goo.gl/PbYrSJ 節目型的應該不會那麼亂
作者: cksuck (俊吉的巨人)   2021-10-26 00:56:00
好球!好球!好球!
作者: VSshow (VS Fashion Show)   2021-10-26 00:57:00
我覺得這弄出來7.80%,絕對有歷史定位!!!
作者: George8   2021-10-26 01:06:00
感謝大大無私的付出!加油!
作者: a06380802 (tub)   2021-10-26 02:16:00
好球!
作者: larrysu   2021-10-26 03:26:00
想法很好耶 搞出來 也是一門專業
作者: zzxxzz (射☆惹ㄦ!!!!!!)   2021-10-26 05:30:00
好球!好球!好球!
作者: moonshade (一隻歐拉貓)   2021-10-26 05:56:00
日文看起來還好
作者: darkbrigher (暗行者)   2021-10-26 07:45:00
別說咕狗了 新東寶翻譯也是慘不忍睹
作者: moonshade (一隻歐拉貓)   2021-10-26 07:50:00
其實這種自動翻譯會差應該都是沒有管畫面上在幹嘛日文因為會省略主詞甚至受詞所以尤其重要AI真的要學必須要學會看畫面上的人在幹嘛
作者: a3456777 (saycheese)   2021-10-26 08:28:00
其實原本就沒有報太大期待,但看到成果還是會心一笑了,我對AI未來的發展很期待啊!加油加油
作者: mark11422   2021-10-26 10:10:00
推推 職人精神
作者: kevin8867 (陳小丁)   2021-10-26 11:13:00
作者: ponanchen (ponan)   2021-10-26 11:59:00
我推你
作者: qq56 (qq)   2021-10-26 12:47:00
作者: min1818 (minwin)   2021-10-26 13:08:00
感謝大大無私的付出!
作者: asmen (我X他X的經紀人)   2021-10-26 13:13:00
莫名的喜歡:「廢物,我想參加。」
作者: a30253 (我妹小吉他'')   2021-10-26 13:20:00
謝謝大大的嘗試
作者: refusekkk (另類3k)   2021-10-26 15:30:00
滿好奇旅遊節目的效果 哈哈 應該很好笑
作者: n1234567810 (嵐嵐嚕)   2021-10-26 15:43:00
作者: tkucuh (tku's cuh)   2021-10-26 16:33:00
感覺作出來的話可以寫一篇論文了。
作者: daae (南極熊貓)   2021-10-26 17:12:00
蠻好笑的
作者: warfarin (瓦法林)   2021-10-26 17:41:00
作者: snes9xw (小包薯條)   2021-10-26 18:14:00
推一個
作者: a8312116 (折一半都比你長)   2021-10-26 18:27:00
好球!好球!
作者: HOWyun2648 (無用之用是為用)   2021-10-26 20:18:00
真的做出來的話,那個規模都可以成立一間公司了吧
作者: jenqhau (真好)   2021-10-26 20:52:00
熱血字幕組,我熱血沸騰了,推
作者: cloudeda (麵包)   2021-10-26 21:05:00
辛苦了
作者: danisaku (對不起我又自私了)   2021-10-26 21:06:00
請受小第一拜
作者: ig49999 (張思妤)   2021-10-26 21:14:00
笑死
作者: CalvinS (偽善者)   2021-10-26 21:59:00
神人 拜
作者: Kust (Kust)   2021-10-27 01:23:00
好球!
作者: howboutdah   2021-10-27 01:39:00
推個 其實我也做過 也是超慘
作者: ckWade (只好喜歡自己)   2021-10-27 10:19:00
日文文章機翻都很慘了
作者: sk89856857 (Jesse)   2021-10-27 22:10:00
謝謝大大無私分享
作者: hjwing280 (胡蝶ノ夢)   2021-10-28 09:54:00
好好笑
作者: jet113102 (傳說中的Yi)   2021-10-30 23:51:00
你為什麼那麼認真啦

Links booklink

Contact Us: admin [ a t ] ucptt.com