MySQL中支持emoji表情的存储

时间:2023-12-19 08:19:44

由于需要实现emoji表情评论的功能,所以数据库需要支持emoji表情的存储,根据查询的资料最终实现了该功能,现将实现的过程以及过程遇到的一些问题记录下来,供大家参考和交流。

mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。下面介绍了关于如何修改mysql数据库的编码格式变为utf8mb4的具体方法。

Linux系统中MySQL的配置文件为my.cnf。(注:有空把mysql默认编码改为utf8的实现过程也记录下来)

Winows中的配置文件为my.ini。

1.修改mysql的配置文件

找到/etc/mysql路径下的my.cnf文件,通过vi命令打开该文件并进行编辑,需添加如下所示配置:

[client]

default-character-set=utf8mb4

[mysqld]

character-set-client-handshake = FALSE

character-set-server = utf8mb4

collation-server = utf8mb4_unicode_ci

init_connect=’SET NAMES utf8mb4'

[mysql]

default-character-set=utf8mb4

修改完毕之后,通过wq保存退出

2.修改database/table和column的字符集

进入mysql中,按下述所示进行命令的执行:

1) 修改database的字符集:

ALTER DATABASE 数据库名 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;

示例:

ALTER DATABASE xxxdb CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;

2) 步骤1)执行完成之后,需要执行use 数据库名,指明当前需要进行字符集修改的数据库;示例:use xxxdb;

3)修改table的字符集:

ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

示例:

ALTER TABLE user_comments CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

4) 修改column的字符集:

ALTER TABLE 表名 CHANGE 字段名 字段名 该字段原来的数据类型 CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

示例:

ALTER TABLE user_comments CHANGE content content TEXT CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

上述修改完毕,exit退出mysql

3.重启mysql

这里重启的时候我一开始用的是service mysql restart,最后发现这条命令并不管用,重启没有成功,导致后面查看字符集的时候,并没有达到想要的字符集的状态。
所以采用下面的方法才可以正确的重启mysql.

3.1停止msql的运行

通过/etc/init.d/mysql执行stop命令

3.2启动mysql

通过/etc/init.d/mysql执行start命令

4.检查字符集:

进入mysql中,用SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR Variable_name LIKE 'collation%';命令查看字符集的情况

上述步骤实现之后便可成功使用emoji表情存储进mysql数据库的功能了。

————————————————————————————————————————————————————————————————

由于mysql数据库是需要备份和还原的,所以带有emoji表情的.sql文件的导入和导出的时候需要注意执行时的编码格式,以下为导入与导出的具体操作:

5.带有emoji表情的sql文件的导入与导出(主要为windows中的导出)

(若是在服务端的代码中的导出为:mysqldump –default-character-set-utf8mb4 –u 用户名 –p 数据库名 > 导出该文件的物理路径;导入的命令不需要指明编码格式,只需要正常的执行命令便可)

5.1导出

在进行把后缀名为.sql的文件,且文件数据中包含emoji表情的数据,进行备份导出的时候,此时不要使用第三方软件进行导出,而是使用命令行的形式执行该导出动作,其主要原因是使用第三方导出该文件时,由于其默认的导出的编码格式为utf-8,该编码格式最多只支持3个字节,而一个emoji表情有4个字节,这将导致emoji表情的数据变成乱码。所以在本地导出的时候具体操作步骤如下:

一、 打开cmd,先找到mysqldump这个执行文件所在的路径;

二、 在路径后输入mysqldump –default-character-set-utf8mb4 –u 用户名 –p 数据库名 > 导出该文件的物理路径,按“Enter”,即可完成导出功能,在导出的物理路径中即可找到已被导出的该文件。

5.2导入

linux系统中的.sql文件导入到本地的时候,不要使用Navicat Premium来进行导入,而是使用如下所示的命令行中的source .sql文件的物理路径,来进行如下的导入。