mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)

时间:2024-03-31 21:46:00

一:异常信息:errorCode:1366

Caused by: java.sql.SQLException: Incorrect string value: '\xE7\xAE...' for column 'description' at row 1

二:异常原因:字符集冲突

mysql insert入库的时候,由于插入数据编码与数据库字段字符集不一致,导致数据无法插入。

三:追本溯源

在mysql数据库中执行show character set,可以看到不同的字符集的最大长度不同。

mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)

如果执插入utf8编码数据,数据库表中字段字符集是latin。(查询字段字符集方法:show full columns from user;)

mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)

如果最大长度为3的utf8字符集存储到最大长度为1的latin数据库字段中,数据会被截断,无法正常插入,导致异常。

我们可以通过 下面命令来查询它的编码格式:

               show variables like 'character%';

        发现它的编码格式变成了Latin1  如图:

 

                      mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)


四:解决办法

修改数据库的字符集编码

MySQL配置文件在Windows下叫my.ini,在MySQL的安装根目录下;在Linux下叫my.cnf,该文件位于/etc/my.cnf。

(1)window服务器

mysql数据库的配置文件my.ini,此文件放在mysql根目录下。在此文件下查找default-character-set属性,并将其值更改为utf8,要是包含其他特殊字符需要改为utf32:default-character-set = utf8(或者default-character-set = utf32

(2)linux服务器
修改my.cnf
vi /etc/my.cnf
在[client]下添加

   default-character-set=utf8   


在[mysqld]下添加

default-character-set=utf8   


在新的版本5.5以上,如果这样修改的话,会造成无法启动的错误,
报的是pid文件更新问题。

经过查看mysql日志,如下:

mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)

是default-character-set参数不可用。

新版本mysql(mysql5.5以上的版本)配置方法是

在[mysqld]下把default-character-set=utf8换成character-set-server=utf8就可以了

注意:character-set-server=utf8不可与default-character-set=gbk同时存在,否则可能引发mysql服务无法启动,发生系统错误1067,把该语句注释即可。

重启mysql可以使用 sudo /etc/init.d/mysql restart
注意修改数据库编码以后,需要把以前的数据库删除掉,重新建立。


注意:

         在用navicat可视化软件时,需要更改一下设置:

“编辑数据库”,字符要改为utf32或utf8,下面我们就去改,同时在表的右键点击“设计表”,看到如下,点击表的设计:

mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)

点击字符集改为utf32,排序规则也要相应的改变(我遇到的1366问题就是通过修改Navicat的字符集和排列规则为utf32,成功运行纠结了好几天的问题)。详情可以参考百度经验: https://jingyan.baidu.com/article/624e74594e508834e8ba5aca.html

mysql出现1067异常或1366错误的解决方案(字符集冲突导致插入数据异常)

五:补充知识
(1)字符(Character)是指人类语言中最小的表义符号。例如'A'、'B'等;
给定一系列字符,对每个字符赋予一个数值,用数值来代表对应的字符,这一数值就是字符的编码(Encoding)。例如,我们给字符'A'赋予数值0,给字符'B'赋予数值1,则0就是字符'A'的编码;

给定一系列字符并赋予对应的编码后,所有这些字符和编码对组成的集合就是字符集(Character Set)。例如,给定字符列表为{'A','B'}时,{'A'=>0, 'B'=>1}就是一个字符集;

(2)字符序(Collation)是指在同一字符集内字符之间的比较规则;
确定字符序后,才能在一个字符集上定义什么是等价的字符,以及字符之间的大小关系;
每个字符序唯一对应一种字符集,但一个字符集可以对应多种字符序,其中有一个是默认字符序(Default Collation);

MySQL中的字符序名称遵从命名惯例:以字符序对应的字符集名称开头;以_ci(表示大小写不敏感)、_cs(表示大小写敏感)或_bin(表示按编码值比较)结尾。例如:在字符序``utf8_general_ci''下,字符``a''和``A''是等价的;

(3)MySQL字符集设置
系统变量:
– character_set_server:默认的内部操作字符集
– character_set_client:客户端来源数据使用的字符集
– character_set_connection:连接层字符集
– character_set_results:查询结果字符集
– character_set_database:当前选中数据库的默认字符集
– character_set_system:系统元数据(字段名等)字符集