Re: [問題] Bag of words 中文單字詞問題

作者: ctr1 (【積π】)   2018-06-27 08:42:43
我自己來回答
預設過濾掉一個字符長度的詞
text = ["我|,|愛你|白Z",
"他|愛狗",
"貓|愛鼠"
]
vectorizer = CountVectorizer(min_df=1, token_pattern='(?u)\\b\\w+\\b')
vectorizer.fit(text)
vector = vectorizer.transform(text)
print (vectorizer.vocabulary_)
print (vector.shape)
print (vector.toarray())
作者: b24333666 (比飛笨)   2018-06-27 08:55:00
你怎麼把上一篇的推文修掉了....
作者: ctr1 (【積π】)   2018-06-27 08:59:00
兄弟 你留言在另一個版~
作者: b24333666 (比飛笨)   2018-06-27 10:45:00
不好意思XDD

Links booklink

Contact Us: admin [ a t ] ucptt.com