Re: [問題] 正規表達式 有好方法表達 非數字的字母嗎

作者: Neisseria (Neisseria)   2016-03-08 20:54:18
※ 引述《JackBaska (Baska)》之銘言:
: 順便問一下,有沒有人知道python有沒有辦法處理模糊查詢跟同意
: 同音的功能 ? 或是有沒有人在github上看過有人分享的 ? 還是要
: 自己刻 ?
如果是要找意義相關的,可以看 semantic similarity
基本的想法是,用已知的字彙庫,找出兩個字之間的關連性,求距離
常見的字彙庫有 WordNet 或 Cyc 等等
如果想看更多內容,可上維基百科,或是看以下這篇
Description and Evaluation of Semantic Similarity Measures Approaches
http://arxiv.org/pdf/1310.8059.pdf (免費 PDF)
要做 semantic similarity,通常不建議自已土炮字彙庫
因為你還要證實你的字彙庫有公信力
這個和一些測量字串距離的方法不太一樣
一些測字串距離的方法是算 A 字串經過數個代換步驟後成 B 字串
然後藉由一些加權的方式,計算出 A 和 B 的距離
看原 po 想用那一種查詢
作者: JackBaska (Baska)   2016-03-08 23:22:00
感謝你的分享 ^^我手上有些資料是可以土炮的拉,但有些不行所以我先放著另外還有一些比較麻煩的像是地址連結的我還沒想好怎解像是有市沒有縣 有縣沒有鄉 然後接地址或,各種組合目前是知道R可以乾脆把這問題送給google反正ggmap那麼好用,當作那些都看不到直接抓經緯度,但還在想還有什麼解法可以解這問題

Links booklink

Contact Us: admin [ a t ] ucptt.com