一、简介
这是一款可以中文汉字简繁体转换的python库,它主要由两个部分组成:
- hanzi-convert: 命令行工具
- hanziconv: python 转换库
二、安装
$ pip install hanziconv
如果提示没有权限则使用sudo前缀,另外可以加-i参数添加国内的安装来源来加快速度,pip源列表参考:设置国内pip源,加速pip更新速度
三、使用
- 1、命令行的不再介绍,可以参考文档。或者敲入hanzi-convert --help来获得更多信息。
- 2、hanziconv API 支持python 2.x 和 3.x版本。
四、hanziconv API的使用
- 汉字转换API示例:
>>> from hanziconv import HanziConv
>>> print(HanziConv.toSimplified('繁簡轉換器'))
繁简转换器
>>> print(HanziConv.toTraditional('繁简转换器'))
繁簡轉換器
>>> print(HanziConv.toSimplified(u'繁簡轉換器'))
繁简转换器
>>> print(HanziConv.toTraditional(u'繁简转换器'))
繁簡轉換器
>>> print(HanziConv.toSimplified(u'mix English and Chinese. 繁簡轉換器')
mix English and Chinese. 繁简转换器
>>> print(HanziConv.toTraditional(u'mix English and Chinese. 繁简转换器'))
mix English and Chinese. 繁簡轉換器
>>> print(HanziConv.toSimplified('mix English and Chinese. 繁簡轉換器'))
mix English and Chinese. 繁简转换器
>>> print(HanziConv.toTraditional('mix English and Chinese. 繁简转换器'))
mix English and Chinese. 繁簡轉換器
说明:上面是在控制台终端输入python后出现>>>的运行结果。
除此以外,hanziconv 还提供API来进行简繁体的比较,如果你直接比较两个相同意思的简繁体字符串u'繁簡轉換器' == u'繁简转换器'得到的结果是False,但是使用hanziconv API却能够得到正确的结果。
- 比较字符串 API示例:
>>> from hanziconv import HanziConv
>>> u'繁簡轉換器' == u'繁简转换器'
False
>>> HanziConv.same(u'繁簡轉換器', u'繁简转换器')
True
>>> str1 = 'mix English and Chinese. 繁簡轉換器'
>>> str2 = 'mix English and Chinese. 繁简转换器'
>>> str3 = 'mix Chinese and English. 繁简转换器'
>>> str4 = u'mix English and Chinese. 繁簡轉換器'
>>> HanziConv.same(str1, str2)
True
>>> HanziConv.same(str2, str3)
False
>>> HanziConv.same(str1, str4)
True
更多信息请参考:hanziconv 0.2.1-document