UTF-8大小写的问题

时间:2023-01-14 22:22:04
请问将UTF8大写字符转换成小写的时候,需要将其先转为Unicode,再转换为小写,然后再转换为UTF8吗?这个方法好像很笨,有没有好方法呢?

9 个解决方案

#1


如果只是指ascii中的英文字母的话,它们的大小写都是一个字节的,做个加减法就行了,不用这么麻烦

#2


英文的话UTF8和ascii一摸一样

#3


英文的utf8编码和ascii码是一样的,如果你知道大写和小写的utf8编码在编码表中相差多少,也可以直接加减运算。

#4


我没做过。
我认为应该这样:
遍历 UTF8 的缓冲区,遇到执行 tolower,
需要注意的是,指针的增加问题,UTF8 是变字节编码的。

#5


楼上各位,不光是要英文啊,希腊文,西里尔文等具有大小写的字母都要考虑啊

#6


引用 5 楼 qishiyexu 的回复:
楼上各位,不光是要英文啊,希腊文,西里尔文等具有大小写的字母都要考虑啊

UTF8西欧字符是2字节,也是固定码位,查一查

#7


引用 4 楼 proteas 的回复:
我没做过。
我认为应该这样:
遍历 UTF8 的缓冲区,遇到执行 tolower,
需要注意的是,指针的增加问题,UTF8 是变字节编码的。

我想知道的是,这个tolower怎么写?因为不转换成Unicode好像没什么规律的

#8


每天回帖即可获得10分可用分!小技巧:教您如何更快获得可用分   

#9


结贴,谢谢大家

#1


如果只是指ascii中的英文字母的话,它们的大小写都是一个字节的,做个加减法就行了,不用这么麻烦

#2


英文的话UTF8和ascii一摸一样

#3


英文的utf8编码和ascii码是一样的,如果你知道大写和小写的utf8编码在编码表中相差多少,也可以直接加减运算。

#4


我没做过。
我认为应该这样:
遍历 UTF8 的缓冲区,遇到执行 tolower,
需要注意的是,指针的增加问题,UTF8 是变字节编码的。

#5


楼上各位,不光是要英文啊,希腊文,西里尔文等具有大小写的字母都要考虑啊

#6


引用 5 楼 qishiyexu 的回复:
楼上各位,不光是要英文啊,希腊文,西里尔文等具有大小写的字母都要考虑啊

UTF8西欧字符是2字节,也是固定码位,查一查

#7


引用 4 楼 proteas 的回复:
我没做过。
我认为应该这样:
遍历 UTF8 的缓冲区,遇到执行 tolower,
需要注意的是,指针的增加问题,UTF8 是变字节编码的。

我想知道的是,这个tolower怎么写?因为不转换成Unicode好像没什么规律的

#8


每天回帖即可获得10分可用分!小技巧:教您如何更快获得可用分   

#9


结贴,谢谢大家