對于mysql 5.5 而言,如果不設定字符集,mysql默認的字符集是 latin1 拉丁文字符集;
但隨著各種業務的進一步發展,除了各個國家的本身語言字符,經常也會有一些表情符號出現在應用程序中,而在mysql 5.5 之前,UTF-8編碼只支持1-3個字節,支持BMP這部分的Unicode編碼區;從MySQL 5.5開始,可以支持4個字節UTF編碼 utf8mb4 ,一個字符能夠支持更多的字符集,也能夠支持更多表情符號。
utf8mb4兼容utf8,且比utf8能表示更多的字符,是utf8字符集的超集。所以現在一些新的業務,比如ISO等,會將MySQL數據庫的字符集設置為utf8mb4。
今天在處理一個應用需求的時候,就遇到這樣一個問題:
當然調整的最好方法是客戶端,mysql數據庫的字符集都修改為utf8mb4,但這樣修改量比較大,而且如果客戶端一部分修改為utf8,一部分為utf8mb4的話,容易發生混亂。
經過幾次測試后,MySQL數據庫的my.cnf中關于字符集的配置修改為下面的配置了:
[client]
default-character-set=utf8mb4
[mysqld]
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'
skip-character-set-client-handshake = true
[mysql]
default-character-set = utf8mb4
使用MySQL字符集時的建議
• 建立數據庫/表和進行數據庫操作時盡量顯式指出使用的字符集,而不是依賴于MySQL的默認設置,否則MySQL升級時可能帶來很大困擾;
• 數據庫和連接字符集都使用latin1時雖然大部分情況下都可以解決亂碼問題,但缺點是無法以字符為單位來進行SQL操作,一般情況下將數據庫和連接字符集都置為utf8是較好的選擇;
• 使用mysql C API時,初始化數據庫句柄后馬上用mysql_options設定MYSQL_SET_CHARSET_NAME屬性為utf8,這樣就不用顯式地用 SET NAMES語句指定連接字符集,且用mysql_ping重連斷開的長連接時也會把連接字符集重置為utf8;
• 對于mysql PHP API,一般頁面級的PHP程序總運行時間較短,在連接到數據庫以后顯式用SET NAMES語句設置一次連接字符集即可;但當使用長連接時,請注意保持連接通暢并在斷開重連后用SET NAMES語句顯式重置連接字符集。
全面了解mysql中utf8和utf8mb4的區別:https://www.jb51.net/article/90037.htm
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。
您可能感興趣的文章:- MySQL查看與修改字符集的方法實例教程
- 如何修改MySQL字符集
- MAC下修改mysql默認字符集為utf8的方法
- mysql 啟動1067錯誤及修改字符集重啟之后復原無效問題
- Linux下MySQL 5.5/5.6的修改字符集編碼為UTF8的方法
- MySQL修改默認字符集編碼的方法
- mysql通過my.cnf修改默認字符集為utf-8的方法和注意事項
- MySql表、字段、庫的字符集修改及查看方法
- mysql修改數據庫編碼(數據庫字符集)和表的字符編碼的方法
- 修改mysql默認字符集的兩種方法詳細解析
- mysql字符集和數據庫引擎修改方法分享
- MySQL修改字符集的實戰教程