トップ 履歴 一覧 カテゴリ ソース 検索 ヘルプ RSS ログイン

Data/SurrogatePair

INDEX

UTF-16 の文字符号の拡張方法。

サロゲート‐ペア(surrogate pair)

Unicode は、当初 2byte(65536種類)で全世界の文字を含める予定だったが、文字数が足りなくなったため UTF-16 では、2文字分を組み合わせ 4byte で文字を表す。

例えば、「𠮷」(下が長いつちよし U+20bb7)。「𠮟」(口へんに七 U+20B9F しか・る)。「𩸽」(魚へんに花 U+29E3D ホッケ)。「𪚥」(龍が4個 U+2a6a5)。

って、書いたけど、FSWiki が euc-jp なので表現できない…

最終更新時間:2021年09月18日 18時59分28秒 指摘や意見などあればSandBoxのBBSへ。