INDEX
UTF-16 の文字符号の拡張方法。
サロゲート‐ペア(surrogate pair)
Unicode は、当初 2byte(65536種類)で全世界の文字を含める予定だったが、文字数が足りなくなったため UTF-16 では、2文字分を組み合わせ 4byte で文字を表す。
例えば、「𠮷」(下が長いつちよし U+20bb7)。「𠮟」(口へんに七 U+20B9F しか・る)。「𩸽」(魚へんに花 U+29E3D ホッケ)。「𪚥」(龍が4個 U+2a6a5)。
って、書いたけど、FSWiki が euc-jp なので表現できない…
最終更新時間:2021年09月18日 18時59分28秒 指摘や意見などあればSandBoxのBBSへ。