字元編碼與程式設計(五)：Unicode的編碼

Universal Character Set (UCS) and Unicode Transformation Format (UTF)

對於Unicode如何組成二進位資料這件事情，各方有不同的想法，因而發展出多套各有特色的Unicode編碼方式，其中最出名或最被廣泛使用的三大編碼機制為：UTF-32(UCS-4)、UTF-16(UCS-2)、與UTF-8。它們的編碼細節以及優劣分析將在下面說明。

UTF-32編碼細節

字元編碼表其實就是數字與文字的對應，加上Unicode的字碼範圍又這麼大，因此很直覺的就可以想到把Unicode的字碼當成一個32位元(4個位元組)的整數來儲存。這是最直接最原始的編碼辦法，下表將以4個文字範例做為解釋：

文字	Unicode編號	編碼結果(BE)	編碼結果(LE)
A	41	00 00 00 41	41 00 00 00
Ü	DC	00 00 00 DC	DC 00 00 00
⿂	2FC2	00 00 2F C2	C2 2F 00 00

夜行者

伊蜜澤瑞

夜行者發表在痞客邦留言(4) 人氣(6,698)

[25/04/21] 訪客於文章「比較幾個網路檔案系統：CIFS、NFS、...」留言：
你的分享非常詳細且實用！感謝分析這三種檔案系統！我是部落...
[25/04/07] 訪客於文章「淡水舢舨DIY紙模型...」留言：
您好，幾次造訪中港河碼頭，看到僅存的幾艘仍採傳統漁法的舢舨船...
[23/10/08] Dack 於文章「文字命令式的操作環境為什麼一直沒有被淘汰...」留言：
神人po文，跪著看...
[23/10/08] Dack 於文章「文字命令式的操作環境為什麼一直沒有被淘汰...」留言：
愛用命令列介面，不夠用時叫Python一起上之人路過...
[22/06/30] 訪客於文章「淡水舢舨DIY紙模型...」留言：
您好！謝謝您的分享！很棒的文章可以跟您要舢板模型的電子檔嗎...
[22/06/30] 訪客於文章「淡水舢舨DIY紙模型...」留言：
您好！謝謝您的分享！很棒的文章可以跟您要舢板模型的電子檔嗎...
[21/11/13] 邱錦江於文章「關於資料備份這件事...」留言：
我是個長期備份者，97年的電腦資料還在。公司的NAS 伺服器...
[21/09/11] 訪客於文章「文字命令式的操作環境為什麼一直沒有被淘汰...」留言：
謝謝你深入淺出的解釋，學到很多！...
[21/05/20] 訪客於文章「淡水舢舨DIY紙模型...」留言：
您好！謝謝您的分享！可以跟您要舢板模型的電子檔嗎？謝...
[21/05/20] 訪客於文章「淡水舢舨DIY紙模型...」留言：
您好！謝謝您的分享！可以跟您要舢板模型的電子檔嗎？謝...

伊蜜澤瑞

歡迎光臨我在痞客邦的小天地

字元編碼與程式設計(五)：Unicode的編碼

個人資訊

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

誰來我家

參觀人氣