ユニコードは世界中の文字を共通文字セットに収録することを目的とし、現代文字だけでなく古代文字、数学記号、絵文字なども含みます。

既存の文字コードとの互換性を考慮し、ラウンドトリップ変換を可能にする互換領域も用意されています。ただしShift_JISやEUC-JPの変種では文字化けが起こる場合があります。

各文字エンコーディング形式の例

00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F
UTF-8 A Ω 😊
41 CE A9 E8 AA 9E F0 9F 98 8A
UTF-16 A Ω 😊
0041 03A9 8A9E D83D DE0A
UTF-32 A Ω 😊
00000041 000003A9 00008A9E 0001F60A