JavaScript 深度指南：掌握 Base64 编码与解码的最佳实践

2026-02-04 12:56:20 0条评论 58次阅读 0人点赞

在 Web 开发的世界里，数据的流转和处理是永恒的主题。你是否曾遇到过需要将二进制数据（如图片或文件）嵌入到 JSON 或 XML 中发送的场景？或者，你需要确保包含特殊字符的字符串在网络传输过程中不被破坏？这就是 Base64 编码大显身手的时候。

在今天的这篇文章中，我们将深入探讨 JavaScript 中处理 Base64 编码与解码的各种方法。我们会从浏览器原生的 API 说起，逐步深入到更复杂的字符编码处理，最后甚至会通过手写一个编码库来理解其背后的算法原理。无论你是刚刚入门的前端新手，还是寻求最佳实践资深开发者，这篇文章都将为你提供详尽的参考。

1 为什么我们需要 Base64？
2 方法一：使用原生的 btoa() 和 atob()
3 实战挑战：处理 Unicode 字符（中文、Emoji 等）
4 深入底层：手写一个 Base64 编解码器
5 常见应用场景与最佳实践
6 总结

为什么我们需要 Base64？

简单来说，Base64 是一种用 64 个字符来表示任意二进制数据的方法。它通常用于在通常处理文本数据的媒介上存储和传输二进制数据。最常见的例子就是在 HTML 中直接嵌入图片，或者在发送 HTTP 请求时对凭证进行编码。

方法一：使用原生的 btoa() 和 atob()

JavaScript 为我们提供了两个非常直观的全局函数来处理 Base64：INLINECODE7ebc721b 用于编码，INLINECODEf06c416e 用于解码。让我们先来看看最基础的使用方法。

1. btoa()：将字符串编码为 Base64

btoa() 函数可以创建一个 ASCII 字符串的 Base64 编码。这里的“btoa”实际上代表“binary to ASCII”。

语法：

const encodedData = window.btoa(stringToEncode);

参数说明：

stringToEncode：这是一个必需的字符串参数。需要注意的是，这里的字符串通常被视为包含单个字节的二进制字符串（即字符编码在 0-255 之间）。

示例 1：基础的字符串编码

让我们尝试将一个简单的英文字符串“Hello World”进行编码。

function encodeStr() {
    const originalString = "Hello World";
    // 使用 btoa 进行编码
    const encodedString = btoa(originalString);
    console.log("原始字符串:", originalString);
    console.log("编码后字符串:", encodedString);
}

encodeStr();

输出：

原始字符串: Hello World
编码后字符串: SGVsbG8gV29ybGQ=

在这个例子中，我们可以看到原本清晰的英文字母被转换成了一串由 INLINECODE6a2c9b7c、INLINECODE11e8ce68、INLINECODE181d87b9、INLINECODE85f7aad0 和 INLINECODEa5a17cde 组成的字符，末尾还可能包含 INLINECODE0b503430 用于填充。这就是 Base64 编码的结果。

2. atob()：解码 Base64 字符串

当我们需要将 Base64 字符串还原为原始内容时，就需要使用 atob() 函数。正如你可能猜到的，这里的“a”代表“ASCII”。

语法：

const decodedData = window.atob(encodedString);

参数说明：

INLINECODE12db6785：必需参数，指由 INLINECODE17cb9342 编码生成的 Base64 字符串。

示例 2：解码字符串

让我们把刚才编码得到的“SGVsbG8gV29ybGQ=”还原回去。

function decodeStr() {
    const encodedString = "SGVsbG8gV29ybGQ=";
    // 使用 atob 进行解码
    const decodedString = atob(encodedString);
    console.log("编码字符串:", encodedString);
    console.log("解码后字符串:", decodedString);
}

decodeStr();

输出：

编码字符串: SGVsbG8gV29ybGQ=
解码后字符串: Hello World

实战挑战：处理 Unicode 字符（中文、Emoji 等）

你可能会想：“既然编码这么简单，我直接拿去编码中文不就行了吗？”

如果你尝试直接用 INLINECODEf7daef11 编码包含中文或 Emoji 的字符串，很可能会遇到一个 INLINECODEf63dd543 错误。这是因为 btoa() 仅支持由单字节组成的 Latin1 字符集（0-255），而中文字符通常占用多个字节，超出了这个范围。

错误的尝试：

// 这行代码会报错
btoa(‘你好世界‘); // Uncaught DOMException: Failed to execute ‘btoa‘ on ‘Window‘...

解决方案：利用 TextEncoder 和 TextDecoder

为了解决这个问题，我们需要先将 Unicode 字符串转换为 UTF-8 的二进制序列，然后再进行 Base64 编码。在现代化的浏览器环境中，我们可以使用 INLINECODEdcf2c466 和 INLINECODE784604af API 来优雅地处理这个问题。

示例 3：支持中文的 Base64 编码与解码

让我们封装两个健壮的函数，分别用于编码和解码 UTF-8 字符串。

/**
 * 将字符串（支持中文）编码为 Base64
 * @param {string} str - 原始字符串
 * @returns {string} Base64 编码后的字符串
 */
function utf8_to_b64(str) {
    try {
        // 1. 将字符串转换为 UTF-8 字节数组
        const encoder = new TextEncoder();
        const uint8Array = encoder.encode(str);
        
        // 2. 将二进制数据转换为二进制字符串（每个字节对应一个字符）
        let binaryString = ‘‘;
        const len = uint8Array.byteLength;
        for (let i = 0; i < len; i++) {
            binaryString += String.fromCharCode(uint8Array[i]);
        }
        
        // 3. 对二进制字符串进行 window.btoa 编码
        return window.btoa(binaryString);
    } catch (e) {
        console.error("编码失败:", e);
        return "";
    }
}

/**
 * 将 Base64 字符串解码为原始字符串（支持中文）
 * @param {string} b64Str - Base64 字符串
 * @returns {string} 解码后的原始字符串
 */
function b64_to_utf8(b64Str) {
    try {
        // 1. 解码 Base64 获取二进制字符串
        const binaryString = window.atob(b64Str);
        
        // 2. 将二进制字符串转换为字节数组
        const len = binaryString.length;
        const bytes = new Uint8Array(len);
        for (let i = 0; i < len; i++) {
            bytes[i] = binaryString.charCodeAt(i);
        }
        
        // 3. 使用 TextDecoder 将字节数组转换为字符串
        const decoder = new TextDecoder();
        return decoder.decode(bytes);
    } catch (e) {
        console.error("解码失败:", e);
        return "";
    }
}

// 测试我们的函数
const originalText = "这是一段包含中文和 Emoji 🚀 的文本。";
const encoded = utf8_to_b64(originalText);
const decoded = b64_to_utf8(encoded);

console.log("原文:", originalText);
console.log("编码:", encoded);
console.log("解码:", decoded);
// 验证是否还原
console.log("验证成功:", originalText === decoded);

深入底层：手写一个 Base64 编解码器

虽然原生 API 已经很好用了，但在某些不支持现代 API 的旧环境（或者为了深入理解算法）中，我们可能需要自己实现一套逻辑。这不仅能帮助我们理解 Base64 的原理，还能让你在不依赖 window 对象的环境（如某些服务端 JS 运行时）中运行代码。

Base64 的核心逻辑是：

编码： 将输入的数据每 3 个字节（24位）分为一组，将其重新分割为 4 个 6 位的单元。每个 6 位单元的值对应 Base64 索引表中的一个字符。
解码： 反向操作，将 4 个字符还原回 3 个字节。

下面是一个完整的、跨浏览器兼容的 Base64 对象实现。为了增加易读性，我添加了详细的中文注释。

示例 4：完整的自定义 Base64 库

let Base64 = {
    // Base64 索引表：定义了 64 个字符的映射顺序
    _keyStr: "ABCDEFGHIJKLMNOPQRSTUVWXYZ" +
        "abcdefghijklmnopqrstuvwxyz0123456789+/=",

    /**
     * 公共方法：编码字符串
     * 该方法包含 UTF-8 编码处理，因此可以直接处理中文
     */
    encode: function (input) {
        let output = "";
        let chr1, chr2, chr3, enc1, enc2, enc3, enc4;
        let i = 0;
        // 预处理：将 Unicode 字符串转换为 UTF-8 格式的二进制字符串
        input = this._utf8_encode(input);

        // 主循环：每次处理 3 个字符（24位）
        while (i > 2;
            enc2 = ((chr1 & 3) <> 4);
            enc3 = ((chr2 & 15) <> 6);
            enc4 = chr3 & 63;

            // 处理输入数据长度不足 3 字节倍数的情况（填充处理）
            if (isNaN(chr2)) {
                enc3 = enc4 = 64;
            } else if (isNaN(chr3)) {
                enc4 = 64;
            }

            // 根据 4 个索引值，从 _keyStr 中查找对应的字符并拼接
            output = output +
                this._keyStr.charAt(enc1) + this._keyStr.charAt(enc2) +
                this._keyStr.charAt(enc3) + this._keyStr.charAt(enc4);
        }
        return output;
    },

    /**
     * 公共方法：解码字符串
     */
    decode: function (input) {
        let output = "";
        let chr1, chr2, chr3;
        let enc1, enc2, enc3, enc4;
        let i = 0;

        // 移除非 Base64 字符（如空格、换行等），确保数据纯净
        input = input.replace(/[^A-Za-z0-9\+\/\=]/g, "");

        // 主循环：每次处理 4 个字符
        while (i < input.length) {
            // 获取当前 4 个字符在索引表中的位置
            enc1 = this._keyStr.indexOf(input.charAt(i++));
            enc2 = this._keyStr.indexOf(input.charAt(i++));
            enc3 = this._keyStr.indexOf(input.charAt(i++));
            enc4 = this._keyStr.indexOf(input.charAt(i++));

            // 将 4 个 6 位索引还原回 3 个 8 位字符
            chr1 = (enc1 <> 4);
            chr2 = ((enc2 & 15) <> 2);
            chr3 = ((enc3 & 3) << 6) | enc4;

            output = output + String.fromCharCode(chr1);

            // 如果没有遇到填充符 '='，则继续后续字符
            if (enc3 != 64) {
                output = output + String.fromCharCode(chr2);
            }
            if (enc4 != 64) {
                output = output + String.fromCharCode(chr3);
            }
        }
        // 后处理：将 UTF-8 二进制字符串还原为 Unicode 字符串
        output = this._utf8_decode(output);
        return output;
    },

    /**
     * 私有方法：将字符串转换为 UTF-8 编码格式
     * 主要处理多字节字符（如中文）
     */
    _utf8_encode: function (string) {
        string = string.replace(/\r
/g, "
");
        let utftext = "";

        for (let n = 0; n < string.length; n++) {
            let c = string.charCodeAt(n);

            // 单字节字符 (ASCII)
            if (c  127) && (c > 6) | 192);
                utftext += String.fromCharCode((c & 63) | 128);
            }
            // 三字节字符（大部分中文）
            else {
                utftext += String.fromCharCode((c >> 12) | 224);
                utftext += String.fromCharCode(((c >> 6) & 63) | 128);
                utftext += String.fromCharCode((c & 63) | 128);
            }
        }
        return utftext;
    },

    /**
     * 私有方法：将 UTF-8 字符串解码为原始字符串
     */
    _utf8_decode: function (utftext) {
        let string = "";
        let i = 0;
        let c = 0, c2 = 0, c3 = 0;

        while (i < utftext.length) {
            c = utftext.charCodeAt(i);

            if (c  191) && (c < 224)) {
                c2 = utftext.charCodeAt(i + 1);
                string += String.fromCharCode(((c & 31) << 6) | (c2 & 63));
                i += 2;
            }
            else {
                c2 = utftext.charCodeAt(i + 1);
                c3 = utftext.charCodeAt(i + 2);
                string += String.fromCharCode(((c & 15) << 12) | ((c2 & 63) << 6) | (c3 & 63));
                i += 3;
            }
        }
        return string;
    }
};

// 测试自定义库
let originalString = "Base64 编码测试";
let encodedString = Base64.encode(originalString);
console.log("自定义库编码:", encodedString);
console.log("自定义库解码:", Base64.decode(encodedString));

常见应用场景与最佳实践

现在我们已经掌握了如何进行编码和解码，接下来让我们看看在实际项目中哪些地方最常用到这些技术。

1. 前端图片预览与上传

在处理用户头像上传时，我们可以利用 FileReader API 将用户选择的文件转换为 Data URL（本质上就是 Base64 编码的字符串）。这样无需先上传到服务器，浏览器就可以直接预览图片。

示例 5：图片转 Base64 预览

// 假设 input 是一个 
function previewImage(file) {
    const reader = new FileReader();
    
    reader.onload = function(e) {
        // e.target.result 就是图片的 Base64 字符串
        const img = document.createElement(‘img‘);
        img.src = e.target.result;
        document.body.appendChild(img);
        console.log("图片长度:", e.target.result.length);
    };
    
    // 读取文件并转为 Data URL
    reader.readAsDataURL(file);
}

2. 避免直接存储敏感信息

虽然 Base64 可以让数据变得不可读，但请记住：Base64 是编码，不是加密。任何人都可以轻松地将 Base64 字符串解码回原文。因此，切勿使用 Base64 来存储密码或敏感的个人身份信息（PII）。对于敏感数据，请务必使用真正的加密算法（如 AES、RSA）。

3. 性能优化建议

体积膨胀： Base64 编码会使数据体积增加约 33%。因此，不要对大文件（如视频、大型图片）进行 Base64 编码并在网络传输，这会显著增加带宽消耗和延迟。
服务端处理： 如果可能，尽量在服务端处理二进制数据流，而不是在浏览器端进行大量的 Base64 转换运算，以免阻塞 UI 线程。

总结

在这篇文章中，我们全面覆盖了 JavaScript 中 Base64 编码与解码的知识点。我们学习了如何使用原生的 INLINECODE50f2811f 和 INLINECODE0fb0e9b6 方法，探讨了处理 Unicode 字符（中文）时的坑与解决方案，并深入研究了底层算法的实现原理。

掌握这些技能后，你可以更加自信地处理复杂的前端数据交互任务。希望这篇文章对你有所帮助，祝你在编码之路上越走越远！如果你在实践过程中遇到任何问题，欢迎随时回来查阅这篇指南。

投稿给我们	如何建站？
vps是什么？	如何安装宝塔？
如何通过博客赚钱？	便宜wordpress托管方案
免费wordpress主题	这些都是免费方案

豆丁博客