python中将中文汉字转换为英文首字母的代码及遇到的小问题

时间:2022-07-02 07:56:16

python中将中文汉字转换为英文首字母的代码及遇到的小问题
在地名地址工作中,有一步是将属性表中的单位汉字名称转换为对应的英文首字母名称
def multi_get_letter(str_input):
if isinstance(str_input, unicode):
unicode_str = str_input
else:
try:
unicode_str = str_input.decode(
'utf8')
except:
try:
unicode_str = str_input.decode(
'gbk')
except:
print 'unknown coding'
return
return_list = []
for one_unicode in unicode_str:
return_list.append(single_get_first(one_unicode))
return return_list
def single_get_first(unicode1):
str1 = unicode1.encode(
'gbk')
try:
ord(str1)
return str1
except:
asc =
ord(str1[0]) * 256 + ord(str1[1]) - 65536
if asc >= -20319 and asc <= -20284:
return 'a'
if asc >= -20283 and asc <= -19776:
return 'b'
if asc >= -19775 and asc <= -19219:
return 'c'
if asc >= -19218 and asc <= -18711:
return 'd'
if asc >= -18710 and asc <= -18527:
return 'e'
if asc >= -18526 and asc <= -18240:
return 'f'
if asc >= -18239 and asc <= -17923:
return 'g'
if asc >= -17922 and asc <= -17418:
return 'h'
if asc >= -17417 and asc <= -16475:
return 'j'
if asc >= -16474 and asc <= -16213:
return 'k'
if asc >= -16212 and asc <= -15641:
return 'l'
if asc >= -15640 and asc <= -15166:
return 'm'
if asc >= -15165 and asc <= -14923:
return 'n'
if asc >= -14922 and asc <= -14915:
return 'o'
if asc >= -14914 and asc <= -14631:
return 'p'
if asc >= -14630 and asc <= -14150:
return 'q'
if asc >= -14149 and asc <= -14091:
return 'r'
if asc >= -14090 and asc <= -13119:
return 's'
if asc >= -13118 and asc <= -12839:
return 't'
if asc >= -12838 and asc <= -12557:
return 'w'
if asc >= -12556 and asc <= -11848:
return 'x'
if asc >= -11847 and asc <= -11056:
return 'y'
if asc >= -11055 and asc <= -10247:
return 'z'
else:
return ''
return ''
def main1(str_input):
a = multi_get_letter(str_input)
b =
''
for i in a:
b= b+i
print b
#return b


if __name__ == "__main__":
#str_input='欢迎你'
# main1(str_input)
main1('精功眼镜#全国青少年近视教育辅导站#学生视力检测配镜中心#潍坊市青少年低视力复健中心#山东省潍坊市饰品眼镜检测中心眼镜检测站 ')
main1(
'顺鑫工商代理 ')
main1(
'顺鑫工商代理')
main1(
'新鑫')

某些BUG
#某些中文符号无法正常弄出来
#多音字无法正常处理

#某些字处理过程中有错误发生,比如“鑫”无法转换对应的首字母

有没有大神能解决一下?