https://bugs.mysql.com/bug.php?id=76553
utf8mb4 character set treats Sushi Emoji (U+1F363) and Beer Emoji (U+1F37A) as same characters, when using utf8mb4_general_ci or utf8mb4_unicode_ci. Because both collations are treating same weight 0xfffd for Emoji. This issue is not limited to Emoji, but possible to all SMP characters.
https://bugs.mysql.com/bug.php?id=76553
To treat these Emoji as different characters, either utf8mb4_bin or utf8mb4_unicode_520_ci should be used. However, utf8mb4_unicode_520_ci has another issue, so called Haha-Papa issue means Mother-Father issue in Japanese. "ハ" (U+30CF KATAKANA LETTER HA), "パ" (U+30D1 KATAKANA LETTER PA), and "バ" (U+30D0 KATAKANA LETTER BA) can not be recognized different characters.
元々はRailsのハハパパ問題解決のためにどういうストーリーだとより問題が伝わるかめちゃくちゃMySQLのUnicodeの挙動について調べてたら、寿司ビール問題の原理も説明できることに気づいた。
梶山さんに外部からissue報告してもらったほうが開発をつつきやすいと言われて寿司ビール問題としてissue報告したところ、MySQL開発陣はバカ受けだったらしい。
Use a spacebar or arrow keys to navigate