四角号码,汉语词典常用检字方法之一,用最多5个阿拉伯数字来对汉字进行归类。
四角号码最重要的特定之一是字型相似的字具有相同或者相似的编码。比如 门
和 闫
比较相似,它们都编码成了 37001
。闩
和它们两个也比较接近,被编码成 37101
这种特性可以被深度学习模型用来作为字的特征之一:字形的特征。
python ./query.py 民
or
from four_corner_method import FourCornerMethod
fcm = FourCornerMethod()
result = fcm.query('名')
print(result)
输出
77747
数据来自于 资料共享——最全的《四角号码检字表》chm
TODO
pytohn ./parse.py
四角号码数据来自于 wangyanhan AT 资料共享——最全的《四角号码检字表》chm