什么是 Base64 編碼
Base64 編碼是最常見的編碼方式,基于 64 個可打印字符來表示任意二進制數(shù)據(jù)的方法,是從二進制轉換到可見字符的過程。
使用場景
數(shù)據(jù)加密或簽名通過 Base64 轉換為字符串存儲或傳輸。
不能傳輸文件的網(wǎng)絡環(huán)境可以轉換 Base64 進行網(wǎng)絡傳輸。
在文本資源(如 HTML 和 CSS文件)中嵌入圖片文件或其他二進制資源。
在 URL、網(wǎng)頁中傳輸少量二進制數(shù)據(jù)等等。
Base64 編碼原理
原理是把每 3 個字節(jié)(每個字節(jié)為 8 位, 3 個字節(jié)為 24 位)重新劃為 4 組(每組為 6位,高位補兩個 0 為 8 位后作為一個新字節(jié),劃分后的每個字節(jié)數(shù)值的范圍是 00000000 - 00111111 即十進制的 0 - 63),然后將劃分后的字節(jié)的數(shù)值作為索引查編碼表,獲得相應的字符,從而得到編碼后的字符串。通過 64 個字符來對任意數(shù)據(jù)進行編碼,因此稱為 Base64。
Base64 標準編碼表:
以字符串 “NEW” 為例,對其 Base64 編碼:
如果要編碼的字節(jié)數(shù)不能被 3 整除,最后會多出 1 個或 2 有效的字節(jié)。將這樣處理,將其用 0 補充至 6 的最小倍數(shù)位后,剩余的空位將使用 “=” 填充處理。例如:
經(jīng)過 Base64 編碼后數(shù)據(jù)會增大,數(shù)據(jù)經(jīng)過 Base64 處理后,由原來每 3 個字節(jié),變?yōu)闉?4 個字節(jié),數(shù)據(jù)大小會變?yōu)樵瓉淼?4/3, 因此數(shù)據(jù)增大 1/3。
對于字符內(nèi)容,相同字符串不同的字符編碼(如 utf-8 與 gbk)的 Base64 編碼結果會不一樣。Base64 是一種通過查表的編碼方法,不能用于加密,即使是自定義編碼表也不行。
JDK 內(nèi)置的 Base64 API
在 JDK 7 之前可以使用 sun.misc.BASE64Encoder 和 sun.misc.BASE64Decoder 來 Base64 編碼解碼,但 com.sun 開頭的包不是公開的,屬于 sun 的內(nèi)部方法,不建議使用。所以可以使用 Apache 提供的工具包(commons-codec-1.11.jar)來進行 Base64 編碼解碼。
從 JDK 7 開始 Oracle 發(fā)表了聲明,不希望 Java 程序調(diào)用 JDK 系統(tǒng)包中以 sun 開頭的類(www.oracle.com/technetwork/java/faq-sun-packages-142232.html)。
從 JKD 8 開始,Oracle 已經(jīng)把 Base64 進行優(yōu)化并放到 JDK 的 java.util 包,所以推薦直接使用 java.util.Base64 進行 Base64 編碼和解碼。
- // Base64 編碼
- String encoder = Base64.getEncoder().encodeToString("但愿人長久 千里共嬋娟".getBytes());
- System.err.println(encoder);
- // Base64 解碼
- String decoder = new String(Base64.getDecoder().decode(encoder));
- System.err.println(decoder);
- // 結果
- // 5L2G5oS/5Lq66ZW/5LmFIOWNg+mHjOWFseWpteWonw==
- // 但愿人長久 千里共嬋娟
標準的 Base64 編碼中可能出現(xiàn)字符 + 和 / 字符,不能直接用在 URL 中,需要對其進行處理,把字符 + 和 / 分別變成 - 和 _ ,JDK 也提供了對應的方法。
- // URL安全的 Base64 編碼
- String safeEncoder = Base64.getUrlEncoder().encodeToString("但愿人長久 千里共嬋娟".getBytes());
- System.err.println(safeEncoder);
- // URL安全的 Base64 解碼
- String safeDecoder = new String(Base64.getUrlDecoder().decode(safeEncoder));
- System.err.println(safeDecoder);
- // 結果
- // 5L2G5oS_5Lq66ZW_5LmFIOWNg-mHjOWFseWpteWonw==
- // 但愿人長久 千里共嬋娟
小結
Base64 是基于 64 個可打印字符來表示任意二進制數(shù)據(jù)的方法。
Base64 通常用于數(shù)據(jù)加密或簽名后轉換為可見字符串,文本資源(如 HTML 和 CSS 中)中嵌入圖片文件等等。
原理是把二進制數(shù)據(jù)每 3 個字節(jié)重新劃為 4 組(每三個 8 位字節(jié),即總共24位,可以由四個 6 位 Base64 數(shù)值表示),然后作為索引查編碼表,獲得相應的字符,從而得到編碼后的字符串。
經(jīng)過 Base64 編碼后數(shù)據(jù)會增大,因為每 3 個字節(jié),重新劃分為 4 個字節(jié),數(shù)據(jù)大小會變?yōu)樵瓉淼?4/3, 因此數(shù)據(jù)增大 1/3。
Base64 是一種通過索引查表的編碼方法,不能用于加密。
參考:
https://en.wikipedia.org/wiki/Base64
https://www.ietf.org/rfc/rfc4648.txt
https://www.liaoxuefeng.com/wiki/897692888725344/949441536192576
到此這篇關于java中Base64編碼原理實例講解的文章就介紹到這了,更多相關java中base64編碼原理內(nèi)容請搜索我們以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持服務器之家!
原文鏈接:https://www.cnblogs.com/newobjectcc/p/14391876.html