[問題] 使用python 做類別歸檔

作者: moodoa3583 (金牌台灣啤酒)   2020-04-01 00:57:10
嗨大家晚安
感謝上次大家幫我解決球員傷病關鍵字提取的問題,今天又有新的問題要來麻煩各位了。
問題是這樣的,我有約莫一萬個與籃球有關的詞彙,而我想將它們一一分類,像是:
NBA>組織
FREAK 1>球鞋
Karl Malone >球員
走步>規則
像是以上這樣子,我創了10個類別包括組織、球鞋、球員、傷病、品牌、服飾、獎項、個人數據、規則、其他
想問有什麼方法可以將這一萬個詞彙分類到屬於它們的類別呢?
我上網查了一陣只查到doccono這個方便標記的介面,好像比較少看到如何去訓練這種取向的模型
再麻煩各位如果知道的話還請和我說該查什麼關鍵字了,感謝
作者: MacBook5566 (尊爵不凡 麥書56)   2020-04-01 01:11:00
entity typing/linking
作者: ddavid (謊言接線生)   2020-04-01 10:46:00
關鍵在你畢竟還是需要不少已經分類好的詞做training,而且直覺來看這個分類器可能正確率不會太高詞分類的線索不多,這些類別又不少容易混淆看到Nike到底是組織、品牌或服飾呢?其中有一些引入前後文或人類知識會有幫助,比如裡面有動詞那高機率屬於規則類、NBA球員列表資料庫直接比對等等
作者: TuCH (謬客)   2020-04-01 11:25:00
可以收集很多文章 做 word2vec

Links booklink

Contact Us: admin [ a t ] ucptt.com