推荐 GitHub 上一款高性能且好用的敏感词工具: sensitive-word。
基于 DFA 算法实现高性能 Java 敏感词过滤工具框架,目前敏感词库内容已收录 6W+。
GitHub: https://github.com/houbb/sensitive-word
具有如下特性:
- 6W+ 词库,且不断优化更新。
- 基于 fluent-api 实现,使用优雅简洁。
- 基于 DFA 算法,性能为 7W+ QPS,应用无感。
- 支持敏感词的判断、返回、脱敏等常见操作。
- 支持常见的格式转换,如全角半角互换、英文大小写互换、忽略重复词等。
- 支持敏感词检测、邮箱检测、数字检测、网址检测等。
- 支持自定义替换策略。
- 支持用户自定义敏感词和白名单。
- 支持数据的数据动态更新(用户自定义),实时生效。
- 支持敏感词的标签接口。
- 支持跳过一些特殊字符,让匹配更灵活。