— Posted in 程式設計

[轉錄] Python – Jieba 簡易教學

來源:http://www.victorgau.com/?p=4973

結巴實在是太簡單太好用了,官網上面的使用說明寫得很清楚,所以這裡只摘錄一些簡單的東西。

安裝:

pip install jieba
1
pip install jieba

斷詞:

使用 jieba.cut(),直接看例子:

 

精確模式 :將句子最精確地切開,較適合文本分析
語法:words = jieba.cut(content, cut_all=False)

_
全模式:把句子中所有的可以成詞的詞語都掃描出來, 速度快。
語法:words = jieba.cut(content, cut_all=True)

_
搜索引擎模式:在精確模式的基礎上對長詞再次切分,提高召回率,適合用於搜尋引擎分詞。
語法:words = jieba.cut_for_search(content)