MySQL有个utf-8的坑

MySQL 的 utf8 实际上不是真正的 UTF-8。utf8 只支持每个字符最多三个字节,而真正的 UTF-8 是每个字符最多四个字节。

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

MySQL 一直没有修复这个 bug,他们在 2010 年发布了一个叫作 utf8mb4 的字符集,绕过了这个问题。当然,他们并没有对新的字符集广而告之(可能是因为这个 bug 让他们觉得很尴尬),以致于现在网络上仍然在建议开发者使用 utf8,但这些建议都是错误的。

简单概括如下:

(1)MySQL 的 utf8mb4 是真正的 UTF-8。

(2)MySQL 的 utf8 是一种专属的编码,它能够编码的 Unicode 字符并不多。

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄