今天新学习了一个敏感词匹配的算法, 记录一下.
1, 用途:
主要用于敏感词匹配.
2, 原理:
以王八蛋和王八羔子两个敏感词来进行描述, 首先构建敏感词库, 该词库名称为 SensitiveMap, 这两个词的二叉树构造为:
以上面例子构造出来的 SensitiveMap 为敏感词库进行示意, 假设这里输入的关键字为: 王八不好, 流程图如下:
3. 代码编写
3.1 构造敏感词实现代码
3.2 实现敏感词查询代码
来源: http://www.bubuko.com/infodetail-2986095.html