서비스를 제작하며 어떤 charset과 collation을 선택해야 하는지 확인
서비스에 소셜로그인을 메인으로 설정했더니 접근성이 좋은탓인가 닉네임을 이모지로 설정하는 경우도 2~3% 정도 발생
utf8mb4_0900_ai_ci
해당 collation이 성능이 가장 뛰어나고, 신규 서비스이므로 마이그레이션 관련 문제도 고려할 필요가 없고
최종적으로는 ‘가나다’와 ‘ㄱㅏㄴㅏㄷㅏ’를 동일하게 인식하는 것을 사용하기 위해 0900_ai_ci 사용
utf8mb4_general_ci와 utf8mb4_unicode_ci
general
- 속도를 향상시키기 위해 고안된 많은 지름길을 사용하면서 가능한 한 잘 수행하는 것을 목표로 하는 단순화된 정렬 규칙 세트입니다. 유니코드 규칙을 따르지 않으며 특정 언어나 문자를 사용하는 경우와 같은 일부 상황에서는 바람직하지 않은 정렬이나 비교가 발생합니다.
unicode
- 광범위한 언어에서 정확하게 정렬되는 범용 정렬 및 비교를 위한 공식 유니코드 규칙을 기반으로 합니다.
- general에 비해 약 5%정도 느림
ci