Stop Word: Difference between revisions

From LemonWiki共筆
Jump to navigation Jump to search
No edit summary
mNo edit summary
Tags: Mobile edit Mobile web edit
Line 20: Line 20:
* 中文停用字: [https://github.com/zake7749/word2vec-tutorial/blob/master/jieba_dict/stopwords.txt word2vec-tutorial/stopwords.txt at master · zake7749/word2vec-tutorial · GitHub]
* 中文停用字: [https://github.com/zake7749/word2vec-tutorial/blob/master/jieba_dict/stopwords.txt word2vec-tutorial/stopwords.txt at master · zake7749/word2vec-tutorial · GitHub]


[[Category:NLP]]
[[Category:Search]]
[[Category:Search]]

Revision as of 23:17, 18 August 2018

Stop Word (單一高頻字、停用字、停止字串)

English: a, of, the, in, is, she, he, to be, as, because, if, when
Chinese(Traditional): 的 一 是 不 人 在 有 我 了 中 ... 這 個 來 為 國 們 著 時 會 說
Chinese(Simplified):  的 一 是 不 人 在 有 我 了 中 ... 这 个 来 为 国 们 着 时 会 说


use case

  • search the gmail inclue "这 OR 个 OR 来 OR 为 OR 国 OR 们 OR 时 OR 说" for deleting spam letters in Chinese(Simplified)


references