linux 中文显示菱形和问号乱码 ,在不改变LANG环境变量的情况下怎么处理

时间:2022-08-19 08:44:55

我在集群安装环境时,再导入中文项目是出现乱码:��������;����Ҫ��;????????。由于集群上有很多软件需要LANG=en_US.UTF-8这个环境配置,所以在解决这个问题不能粗暴的改~/.bashrc的环境配置。然后我在找资料的时候发现一个转换格式的方式。经过测试发现很好用,可以分享个大家。

在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK,而我的问题就是在从windows下导入项目包时的中文编码是GBK,而linux下的编码格式是UTF-8,所以无论怎么改变LANG的设置都会显示乱码,找到了问题,解决问题就不远了,首先yum install convmv;根据资料convmv的具体用法:
convmv -f 源编码 -t 新编码 [选项] 文件名
常用参数:
-r 递归处理子文件夹
--notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
--list 显示所有支持的编码
--unescap 可以做一下转义,比如把%20变成空格
比如我们有一个GBK编码的文件名,转换成UTF-8编码,命令如下:
convmv -f GBK -t UTF-8 --notest GBK编码的文件名。

如果想要递归替换整个目录下的乱码文件可以使用:

convmv -f GBK -t UTF-8 --notest -r 目录名称

ok,这要就大功告成了。