在Win10、Python3.6环境下,调用包,将繁体中文字转为简体字。
方法一:
pip install snownlp
调用snownlp包进行转换。
from snownlp import SnowNLPs = SnowNLP('環境很惡劣')s.han Out: '环境很恶劣'
方法二:
下载 zh_wiki.py 和 langconv.py 两个文件,放到python代码目录下。
文件下载地址:
链接:/s/1X8MWZi9sab9XVATwiaDgZw
提取码:qe31
1.代码实现。
from langconv import *line1 = '環境很惡劣'line2 = Converter('zh-hans').convert(line1)line2Out: '环境很恶劣'Converter('zh-hant').convert(line2)Out: '環境很惡劣'
2.写成函数,调用函数,进行转换。
from langconv import *# 转换繁体到简体def cht_to_chs(line):line = Converter('zh-hans').convert(line)line.encode('utf-8')return line# 转换简体到繁体def chs_to_cht(line):line = Converter('zh-hant').convert(line)line.encode('utf-8')return lineline1 = '環境很惡劣'cht_to_chs(line)Out: '环境很恶劣'line2 = '环境很恶劣'chs_to_cht(line)Out: '環境很惡劣'
方法三:
zhconv 提供基于 MediaWiki 词汇表的最大正向匹配简繁转换,Python 2, 3 通用。
支持以下地区词转换:
zh-cn大陆简体zh-tw台灣正體zh-hk香港繁體zh-sg马新简体(无词汇表,需要手工指定)zh-hans简体zh-hant繁體
import zhconvline1 = '環境很惡劣'line2 = zhconv.convert(line1, 'zh-cn')line2Out: '环境很恶劣'zhconv.convert(line2, 'zh-tw')Out: '環境很惡劣'