'中过'、'中国'、'过国'、'国过'、'国中'、'过中'
,这六个
字对
中,很容易就看到只有
中国
这个
是能成词,其余都不是词。但是如果给你100个、1000个字,你怎么知道其中的能成词的字对呢。所以这里就要用统计学,统计语料中各个字对的概率,一般概率大者的 字对 有很大可能性是一个词。
来源: http://www.tuicool.com/articles/iaAZNnF