- utf8mb4_general_ci(utf8mb4_general_cs)是一个遗留的校对规则,不支持扩展。它仅能够在字符之间进行逐个比较
- ci(case insensitive), 即 "大小写不敏感"
- cs(case sensitive), 即 "大小写敏感"
- utf8mb4_unicode_ci(utf8mb4_unicode_cs)校对规则仅部分⽀持 Unicode 校对规则算法。⼀些字符还是不能⽀持。并且,不能完全⽀持组合的记号。这主要影响越南和俄罗斯的⼀些少数民族语⾔,如:Udmurt 、Tatar、Bashkir和Mari。
- utf8mb4_unicode_ci(utf8mb4_unicode_cs)的最主要的特⾊是⽀持扩展,即当把⼀个字母看作与其它字母组合相等时。例如,在德语和⼀些其它语⾔中 ‘ß' 等于 ‘ss' 。
注
- utf8mb4_general_ci(utf8mb4_general_cs)也适用与德语和法语,除了‘ß'等于 ‘s' ,而不是 ‘ss' 之外。如果你的应用能够接受这些,那么应该使用 utf8_general_ci(utf8_general_cs),因为它速度快。否则,使用 utf8mb4_unicode_ci(utf8mb4_unicode_cs),因为它比较准确。
utf8mb4_general_ci(utf8mb4_general_cs)和 utf8mb4_unicode_ci(utf8mb4_unicode_cs)的区别
- 使用 utf8mb4_general_ci(utf8mb4_general_cs)和 utf8mb4_unicode_ci(utf8mb4_unicode_cs)两种校对规则下面的比较相等:
- Ä = A
- Ö = O
- Ü = U
- 两种校对规则之间的区别是:
utf8mb4_general_ci -> ß =
s
utf8mb4_unicode_ci -> ß =
ss
- utf8mb4_general_ci(utf8mb4_general_cs)校对速度快,但准确度稍差
- utf8mb4_unicode_ci(utf8mb4_unicode_cs)准确度高,但校对速度稍慢