** 自然语言处理:** 研究使用计算机编程来处理与理解人类语言。 ** 应用场景:** 机器翻译、情感分析、文本处理、聊天机器人。 通用技术:**1. 分词 ** 将连续文本分割成若干词汇 **2. 停用词过滤 ** 拿一个句子来说:主谓宾、定状补。经过停用词过滤以后就只剩下 --- 主谓宾。 词干提取和词形还原主要应用在英文等西方语言中。**3. 词干提取 ** **4. 词形还原 ** **5. 词袋模型 ** **6.TF-IDF** **7.Word2Vec** |
来源: http://www.bubuko.com/infodetail-3053069.html