utf-8 编码可能2个字节、3个字节、4个字节的字符,但是 MySQL 的 utf8 编码只支持3字节的数据,而移动端的表情数据是4个字节的字符。如果直接往采用 utf-8 编码的数据库中插入表情数据,Java 程序中将报SQL异常:
java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x92\x94’ for column ‘name’ at row 1
at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1073)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3593)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3525)
at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1986)
at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2140)
at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2620)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1662)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1581)
可以对4字节的字符进行编码存储,然后取出来的时候,再进行解码。但是这样做会使得任何使用该字符的地方都要进行编码与解码。
utf8mb4编码是utf8编码的超集,兼容utf8,并且能存储4字节的表情字符。
采用utf8mb4编码的好处是:存储与获取数据的时候,不用再考虑表情字符的编码与解码问题。
更改数据库的编码为utf8mb4:
1. MySQL的版本
utf8mb4 的最低 MySQL 版本支持版本为 **5.5.3+**,若不是,请升级到较新版本。
2. MySQL驱动
5.1.34 可用,最低不能低于 5.1.13
3. 修改MySQL配置文件
修改 MySQL 配置文件 _my.cnf_(windows为_my.ini_)
my.cnf一般在etc/mysql/my.cnf位置。找到后请在以下三部分里添加如下内容:
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'
4. 重启数据库,检查变量
SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';
Variable_name | Value |
---|---|
character_set_client | utf8mb4 |
character_set_connection | utf8mb4 |
character_set_database | utf8mb4 |
character_set_filesystem | binary |
character_set_results | utf8mb4 |
character_set_server | utf8mb4 |
character_set_system | utf8 |
collation_connection | utf8mb4_unicode_ci |
collation_database | utf8mb4_unicode_ci |
collation_server | utf8mb4_unicode_ci |
collation_connection
、collation_database
、collation_server
是什么没关系,但必须保证:
系统变量
描述
character_set_client
(客户端来源数据使用的字符集)
character_set_connection
(连接层字符集)
character_set_database
(当前选中数据库的默认字符集)
character_set_results
(查询结果字符集)
character_set_server
(默认的内部操作字符集)
这几个变量必须是utf8mb4
。
5. 数据库连接的配置
数据库连接参数中:characterEncoding=utf8
会被自动识别为 utf8mb4
,也可以不加这个参数,会自动检测。
而 autoReconnect=true
是必须加上的。
6. 将数据库和已经建好的表也转换成utf8mb4
修改数据库字符集:
1 | ALTER DATABASE db_name DEFAULT CHARACTER SET character_name [COLLATE ...]; |
把表默认的字符集和所有字符列改为新的字符集:
1 | ALTER TABLE tbl_name CONVERT TO CHARACTER SET character_name [COLLATE ...] |
只是修改表的默认字符集:
1 | ALTER TABLE tbl_name DEFAULT CHARACTER SET character_name [COLLATE...]; |
修改字段的字符集:
1 | ALTER TABLE tbl_name CHANGE c_name c_name CHARACTER SET character_name [COLLATE ...]; |
查看数据库编码:
1 | SHOW CREATE DATABASE db_name; |
查看表编码:
1 | SHOW CREATE TABLE tbl_name; |
查看字段编码:
1 | SHOW FULL COLUMNS FROM tbl_name; |
查看当前数据库编码:
1 | SHOW VARIABLES LIKE 'character_set_%'; |
mysql-connector-java驱动包在5.1.13+才支持utf8mb4
1 | set global character_set_server=utf8mb4; |
修改配置文件:
1 | --修改mysql的my.cnf文件中的字符集 |