Skip to content

Latest commit

 

History

History
332 lines (242 loc) · 22.7 KB

CHANGE_LOG.md

File metadata and controls

332 lines (242 loc) · 22.7 KB

变更日志

类型 说明
A 新增
U 更新
D 删除
T 测试
O 优化
F 修复BUG

release_0.0.1

序号 变更类型 说明 时间 备注
1 A 基本功能的实现 2020-1-7 21:46:32

release_0.0.2

序号 变更类型 说明 时间 备注
1 O 优化最大长度匹配模式 2020-1-8 09:34:35
2 A 新增替换实现 2020-1-8 09:34:35 性能优于各种博客的直接正则替换。
3 O 优化公共代码到 heaven 项目 2020-1-8 09:34:35 便于后期统一维护整理。
4 O 初步优化 DFA 对应 map 的大小 2020-1-8 09:34:35

release_0.0.3

序号 变更类型 说明 时间 备注
1 O 优化敏感词大小 2020-1-8 09:34:35

release_0.0.4

序号 变更类型 说明 时间 备注
1 A 支持大小写转换 2020-1-9 09:34:35
1 A 支持半角全角转换 2020-1-9 09:34:35

release_0.0.5

序号 变更类型 说明 时间 备注
1 D 移除单个字符 v 2020-1-9 09:34:35
2 D 移除单个字符 2020-1-10 09:34:35
3 O 责任链模式优化代码实现 2020-1-10 09:34:35
4 A 支持数字格式化转换 2020-1-10 09:34:35
5 A 支持数字敏感词验证 2020-1-10 09:34:35
6 O 优化所有写法的数字为阿拉伯写法 2020-1-10 09:34:35

release_0.0.6

序号 变更类型 说明 时间 备注
1 A 添加中文繁简体转换支持 2020-1-10 09:34:35
2 A 添加英文常见写法转换支持 2020-1-10 09:34:35
3 A 新增敏感词 2020-1-10 09:34:35
4 D 移除单个词 k买仆办功务动区卖台吨天房本歌滚灾独证踢弓 2020-1-10 09:34:35

release_0.0.7

序号 变更类型 说明 时间 备注
1 A 添加忽略重复词支持 2020-1-10 09:34:35

release_0.0.8

序号 变更类型 说明 时间 备注
1 A 添加用户自定义敏感词和白名单 2020-1-10 09:34:35

release_0.0.9

序号 变更类型 说明 时间 备注
1 A 添加邮箱检测 2020-1-11 09:34:35

release_0.0.10

序号 变更类型 说明 时间 备注
1 F 修复依赖包 heaven 版本 2020-1-11 09:34:35

release_0.0.11

序号 变更类型 说明 时间 备注
1 A 添加对于数字过滤的可配置型 2020-1-14 22:48:12
2 A 添加部分敏感词 2020-1-14 22:48:12

release_0.0.12

序号 变更类型 说明 时间 备注
1 A 添加对于网址的过滤 2020-1-16 20:51:58

release_0.0.13

序号 变更类型 说明 时间 备注
1 A 新增 Helper 工具类 2021-5-12 20:51:58
2 A 新增动态词库初始化支持 2021-5-12 20:51:58

release_0.0.14

序号 变更类型 说明 时间 备注
1 A 开发样式配置特性 2021-5-31 20:51:58

release_0.0.15

序号 变更类型 说明 时间 备注
1 A 优化 init 方式 2021-7-16 20:51:58

release_0.1.0

序号 变更类型 说明 时间 备注
1 A 返回敏感词对应的下标范围 2021-8-8 20:51:58
2 U ignoreRepeat 默认为 false 2021-8-8 20:51:58
3 U 把测试、系统、买卖、彩票等常用词移出敏感词库 2021-8-8 20:51:58

release_0.1.1

序号 变更类型 说明 时间 备注
1 F 自定义敏感词 allow/deny 进行格式化处理 2021-12-11 23:51:58

release_0.2.0

序号 变更类型 说明 时间 备注
1 A 允许用户自定义替换策略 2022-01-15 23:51:58
2 U 升级二方数据库依赖 2022-01-15 23:51:58

release_0.2.1

序号 变更类型 说明 时间 备注
1 O 移除日志初始化的控台日志输出 2023-02-17 23:51:58
2 A 支持数字检验的长度指定 2022-01-17 23:51:58

release_0.3.0

序号 变更类型 说明 时间 备注
1 O 移除冗余的耗时统计 2023-06-06 23:51:58
2 A 优化代码实现方式,添加工具类方法 2023-06-06 23:51:58

release_0.3.1

序号 变更类型 说明 时间 备注
1 O 敏感词添加 2023-06-06 23:51:58 幸运/幸运儿/17年前/1条/1梯两户/1比1/年检/幸存/幸运/幸运儿/恶搞/游戏机/日/草
2 A 敏感词添加 2023-06-06 23:51:58 SB

release_0.3.2

序号 变更类型 说明 时间 备注
1 O 中文繁简体样式 2023-06-07 23:51:58 调整实现策略
2 A 代码结构优化 2023-06-07 23:51:58 调整实现策略

release_0.4.0

序号 变更类型 说明 时间 备注
1 O 优化单词校验逻辑 2023-06-08 23:51:58
2 A 新增是否单词校验的开关 2023-06-08 23:51:58

release_0.5.0

序号 变更类型 说明 时间 备注
1 A 优化单词结果,减少 String 创建 2023-06-08 23:51:58
2 A 优化 contains 判断,减少 String 创建 2023-06-08 23:51:58

release_0.6.0

序号 变更类型 说明 时间 备注
1 O 性能优化:字符映射统一处理一遍,而不是每次都处理 2023-06-09 23:51:58
2 D 移除废弃的 replaceContext 2023-06-09 23:51:58

release_0.7.0

序号 变更类型 说明 时间 备注
1 A IWordMap 命名调整为 IWordData, 添加 Tree 实现。优化内存占用 2023-06-09 23:51:58 避免过于限制,放开便于后续拓展

release_0.8.0

序号 变更类型 说明 时间 备注
1 A 添加 ICharFormatCombine 2023-06-10 23:51:58 允许用户自定义格式化组合策略
2 A 添加 ISensitiveCheckCombine 2023-06-10 23:51:58 允许用户自定义敏感词校验组合策略
3 A 添加 IWordAllowDenyCombine 2023-06-10 23:51:58 允许用户自定义 allow+deny 的组合策略
4 A 添加引导类进阶的配置使用说明 2023-06-10 23:51:58 放在后续,避免内部接口不够稳定
5 U 内部接口名称统一为 IWordXXX 2023-06-10 23:51:58

release_0.9.0

序号 变更类型 说明 时间 备注
1 O 移除单个汉字+部分常用词的脏词 2023-11-17 23:51:58 降低误判率

release_0.10.0

序号 变更类型 说明 时间 备注
1 A 添加脏词的标签接口,便于后续拓展 2023-12-05 23:51:58

release_0.11.0

序号 变更类型 说明 时间 备注
1 A 添加忽略字符接口,便于跳过一些干扰的字符 2023-12-08 23:51:58

release_0.12.0

序号 变更类型 说明 时间 备注
1 A 添加 wordTags 标签结果处理类 2023-12-18 23:51:58
2 A 添加 AbstractWordResultHandler 处理类,便于后续拓展和统一管理 2023-12-18 23:51:58

release_0.13.0

序号 变更类型 说明 时间 备注
1 A 对匹配后的单词,额外可以做一次校验,比如做一次英文全词匹配的验证。 2024-02-19 23:51:58

release_0.13.1

序号 变更类型 说明 时间 备注
1 F 修正单词匹配 BUG 2024-2-28 16:16:42 houbb#47

release_0.13.2

序号 变更类型 说明 时间 备注
1 O 优化部分2长度的英文,避免误判 2024-4-7 21:04:18
2 O 升级 heaven 版本到 v0.9.0 2024-4-7 21:04:18

release_0.13.3

序号 变更类型 说明 时间 备注
1 O 移除辉煌、辅导、迅雷、运营、近亲、连接、1期、2o年、2期、3期、46级、4川、4风、4级证、5周年、5月天、610、64、6级证、89、8964、89年、9成、fa票、ftp://、nrqr、o78569 2024-4-8 21:04:18
2 O 移除pqαr、q币、tqrqu、v商、xi藏、xrnvs、xrqu、xrtbrnvs、x藏、you行、αqrqr、αqrqu、αrnvs、αrwqnvs、丁香、万岁、上海交大、上海交警、不良、专6、专8、丑化、东升、中华、中华人民共和国 2024-4-8 21:04:18
3 O 中南海、中国、中考、主义、主权、举行、举办、乌克兰、乌鲁木齐、乡巴佬、买房、争鸣、二战、亚洲、亡国、交警、交通部、亵渎、人渣、人质、人鬼情未了、今有广东 2024-4-7 21:04:18
4 O 仙剑、仙侣奇缘、仙界传、仙笛、代理、价格、仿真、优惠、会员、传单、伤亡、住宅、佛祖、佛教、作秀、佳薇、供应、侦探、侮辱、侵犯、俄国、俄罗斯、保监会、信仰、信号、信息、信用卡、信誉、修炼、 2024-4-7 21:04:18
5 O 倒塌、倒退、倚天、借记卡、值勤、倾城美人、假冒、偷税、储蓄卡、催泪、催眠、傲视、傲神传、僵尸、充值、光线、光明日报、克隆、免费使用、全套、全户型、全职、全集、公务员、公司、公告、公司网址、公安、公安局、公寓、 2024-4-7 21:04:18
6 O 公文、公证、兰博、共产、其它、内幕、冒险岛、凤凰、凶手、出卖、出售、出版社、出货、击毙、刀剑、分析、刑警、列宁、别墅、制作、制服、刷卡、剑侠世界、剧毒、加冰 2024-4-7 21:04:18
7 O 动向、动漫、助理、助听器、劲舞、劳务、北京、北韩、千年、千岛湖、华语、协警、卡通、卧底、卫星电视、卫生部、卫生巾、印章、历史、压制、压迫、原子弹、原点、参拜、 2024-4-7 21:04:18
8 O 反攻、发售、发票、受伤、变天、变态、口腔科、古兰经、古龙、可儿、可塑、台湾、叱咤、号码、司机、同志、名刀、名师、后庭、后庭花、吐血、启蒙派、告示、呻吟、和平、和弦、咨询、哥哥、哥白尼 2024-4-7 21:04:18
9 O 唐僧、商务、商业楼、商圈、商铺、商标、善恶有报、喷剂、回族、回馈、围攻、国务院、国家、国庆、国歌、圆满、圣母、在十月、地址、地产、地球文明 2024-4-7 21:04:18
10 O 地震、均价、坠落、城堡、城管、增值税、复仇、复制、复活、多维、大宝、大师、大话、天猫、天骄、太监、头孢、奥运、奥运会、女人、如影逐形、如来、妈妈、姐夫、姐姐、孤儿 2024-4-7 21:04:18
11 O 学习班、学位证、学历证、学历证书、宇宙真理、安全监管、安全部、安定、安息、完美世界、宗教、官场、官方、定金、定额、宝莲灯、审查、审计、客户、客服、客服人员、密码 2024-4-7 21:04:18
12 O 富婆、富姐、富姐婆、寻仇、导师、导弹、导火索、导航、封神、封锁、小说、小龙女、尖值、屏蔽、岁月无声、崩盘、巡查、工商、工商局、巨商、巴赫、市长、 2024-4-7 21:04:18
13 O 师傅、师父、帐号、帝国主义、常委、幸运儿、广告、广电、广电局、广电总局、庐江、废墟、建筑、开发、开发票、开放、引导、弟子、形式主义、征途、 2024-4-7 21:04:18
14 O 微信、怀旧、性情、性情中人、总局、总理、总裁、恭喜、您被、户口本、户型、房产、房地产、房型、房间、手机、托福、投票、抗战、抗议、报国、报警、拉sa、拉萨、招商、招募、 2024-4-7 21:04:18
15 O 拦截、拿破仑、指导员、挑战、捆绑、探头、接班、摄像、收藏品、改革、政治、救援、教徒、数通、文化部、断电、新浪、新闻出版、无线耳机、无线通话、日本、日本人、旺铺、 2024-4-7 21:04:18
16 O 昏迷、易容、星月、星星月亮、星相、春光、春色、暧昧、月嫂、月卡、月光宝盒、朝鲜、朝鲁、期货、本店、本色、杜鹃、杨j、格斗、梵高、检察、检查、楼盘、欲望、正义、 2024-4-7 21:04:18
17 O 武力、武器、武神、武警、歹徒、死亡、残疾、母亲、毕业、毕业证、毕加索、民族、民国、民政局、民警、汉人、江山、江山如此多娇、江湖、汪洋、沉沦、沁园春、沙僧、 2024-4-7 21:04:18
18 O 洗牙、洞穴、活动、消息、淘宝、混沌、清仓、清真、清纯、渡口、温b、温馨、温馨提示、激情、烟花、烟草、烟草局、然后、燃烧、爆炸、爸爸、爷爷、父亲、爹娘、牙科、牙疼、牙签、牙周炎、 2024-4-7 21:04:18
19 O 牢记、牲口、狙击、独立、猥琐、现代中国、现金、现货、现房、瓦斯、生肖、用户、电信、电影、电影下载、电话、男装、疫苗、病毒、监督、监管、监管局、盗版、盘古、相亲会 2024-4-7 21:04:18
20 O 省长、督察、短信、破坏、硬币、礼品、礼物、社会、社会主义、祖国、祖宗、离婚、秃鹰、种子、租房、租售、移动、移民、税务、穷人、空降、签证、简历、米粒、精装、纪元、经济、经典语录、绝版 2024-4-7 21:04:18
21 O 统治、维护、维权、缅甸、缠上、缺陷、网址、网关、网易、网站、网站建设、网络、网购、罪行、美利坚、美国、美女、群发、老板、老板手机、考号、考研、耳机、 2024-4-7 21:04:18
22 O 耶和华、耶稣、联合国、联合行动、 联系、联通、股票、自fe、自制、自拍、舆论、舒淇、航天、航班、航空、花园、苹果、茅台、茉莉花、药水、莎士比亚、落榜、蒙面、蓝光、虎头、 2024-4-7 21:04:18
23 O 虎牙、虎门、蛤蟆、融资、行驶证、街铺、被迫、西游、西臧、西藏、观世音、解放军、警察、讲法、论文、证书、证件、证券、诛仙、诡异、语句、语音、诱惑、资格、跟踪、路人、躲猫猫、通告 2024-4-7 21:04:18
24 O 通知、通讯录、道教、采花、重生、钓鱼、钢珠、铃声、链接、销售、错别字、锤子、锤锤、面积、预测、领土、领导、风水、风花、首长、鲁迅、鲍鱼、鸡尾酒、麻将、 2024-4-7 21:04:18

release_0.13.4

序号 变更类型 说明 时间 备注
1 O 移除 一直对、组织、验证码、数据库、服务器、火药、世界都、聚集、国内、制造、解码、万里、视频、中国好声音 2024-4-9 21:04:18
2 O 移除 骑士、移动公司、战役、战场、飞机票、逃逸、自由、杂志、使用人数、域名服务、人民日报、一粒沙、牛顿、三国演义、哥伦布、 2024-4-9 21:04:18
3 O 移除 订票、财政部、搜狐、人员变动、惊天动地、试卷、华莱士、空闲时间、泰晤士报、企业家、气象局、诺贝尔奖、多多益善、论坛、外交部 2024-4-9 21:04:18
4 O 移除 焚烧、雅典娜、真相、真善美、制造、万里、法国、世界都、昨日重现、信息中心、马克思、刘德华、内蒙古、 2024-4-9 21:04:18
5 O 移除 涿州、中国联通、中国网通、李老师、写字楼、人民银行、卡拉、牛魔王、 张杰、哪里找、爱因斯坦、天地之间、不玩了、里根、监听器、监听 2024-4-9 21:04:18
6 O 移除 选举、登陆、中国移动、运营者、客户服务、精益求精、下载速度、好朋友、拦截器、账号、无界、深入浅出、腾讯、解码器、管理员、白皮书 2024-4-9 21:04:18
7 O 移除 监听、运营商、一起玩、转化、超市 2024-4-9 21:04:18

release_0.14.0

序号 变更类型 说明 时间 备注
1 A 结果添加敏感词的类别 2024-4-11 15:02:25

release_0.15.0

序号 变更类型 说明 时间 备注
1 F 调整默认文件名称,避免和其他框架重合。 2024-4-23 21:02:25 houbb#54

release_0.16.0

序号 变更类型 说明 时间 备注
1 A 支持资源的释放,如 andriod 场景 2024-4-26 21:02:25 废弃版本,houbb#53

release_0.16.1

序号 变更类型 说明 时间 备注
1 F 支持资源的释放,如 andriod 场景 2024-4-26 21:02:25 修正未调用问题,houbb#53

release_0.16.2

序号 变更类型 说明 时间 备注
1 O 敏感词优化移除: 译码器/鞋帽/破解/看下/快乐水/冷却/招聘/搬迁/机票/谣言/第4代/赚钱/1989年/贫穷/护士/工作人员/网通/超速/明心/人民/服务管理/刺激/心水/ 2024-6-01 15:02:25
2 O 敏感词优化移除: 影院/公关/韦小宝/挣钱/资本主义/人也/战争/水浒/女装/装修/妹妹/他爸爸/他妈妈 2024-6-01 15:02:25
3 O 默认关闭数字+网址+邮箱的校验 2024-6-01 15:02:25 降低误判率

release_0.17.0

序号 变更类型 说明 时间 备注
1 A IPV4 校验 2024-6-01 15:02:25 houbb#43

release_0.18.0

序号 变更类型 说明 时间 备注
1 A 优化网址匹配策略,避免命中 1.jpg 之类的 2024-7-07 15:02:25