Unicode unifica los caracteres del mundo en un conjunto común, usado en Unix, Windows, macOS, Plan 9, Java, etc. Incluye caracteres modernos, antiguos, históricos, símbolos matemáticos y emojis.

Considera interoperabilidad con codificaciones previas a Unicode reservando áreas de compatibilidad para conversión inversa. Aún así, al mezclar conjuntos o variantes (CP932, CP51932, eucJP-MS) pueden ocurrir caracteres incorrectos.

Ejemplos de codificación por formato

00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F
UTF-8 A Ω 😊
41 CE A9 E8 AA 9E F0 9F 98 8A
UTF-16 A Ω 😊
0041 03A9 8A9E D83D DE0A
UTF-32 A Ω 😊
00000041 000003A9 00008A9E 0001F60A