2.解决Linux中文乱码问题

我们从windows系统上传文件到Linux系统中，经常会遇到中文乱码问题。通常，这是因为Windows的字符编码为GBK，而Linux系统的字符集是UTF-8引起的。为了模拟上述情况，我先在Windows中，创建以GBK编码的文件testGBK.txt，然后上传至CentOS系统。最后，我将转换testGBK.txt的字符编码，解决乱码问题。一、创建testGBK.txt打开Notepad++，

kande0707

11414人浏览 · 2022-05-07 22:56:04

kande0707 · 2022-05-07 22:56:04 发布

我们从windows系统上传文件到Linux系统中，经常会遇到中文乱码问题。通常，这是因为Windows的字符编码为GBK，而Linux系统的字符集是UTF-8引起的。

为了模拟上述情况，我先在Windows中，创建以GBK编码的文件testGBK.txt，然后上传至CentOS系统。最后，我将转换testGBK.txt的字符编码，解决乱码问题。

一、创建testGBK.txt

打开Notepad++，随便写几行中文，然后指定为GBK编码，保存。然后上传至CentOS。

二、在CentOS中，testGBK.txt为乱码

并且，其文件编码已经是latin1，即ISO-8859编码。Latin1是ISO-8859-1的别名。使用file命令可以印证。

三、乱码产生的原因

之所以会有乱码问题，是因为文件的编码是GB2312，但在传输的过程中，因为传输工具用的字符编码是latin1，所以传输上去的文件已经被标识为latin1了。但testGBK.txt里面存放的却是GB2312编码的内容，而CentOS被告知是latin1编码，所以，CentOS就使用latin1的字符编码去解码，结果，当然是乱码。

四、解决乱码问题

使用iconv命令进行转码。具体如下：

#将GB2312的文件testGBK.txt转编码为UTF-8，并输出为：result1.txt

iconv -f GB2312 -t UTF-8 testGBK.txt -o result1.txt