base64 编码的本质:将 8bit 二进制数转化为 6bit 的可打印字符。
Base64编码用于需要将二进制数据转为文本数据进行储存和传输的场景。Javascript内部的字符串,都以utf-16的形式进行保存,因此编码的时候,我们首先必须将utf-8的值转成utf-16再编码;
解码的时候,则是解码后还需要将utf-16的值转回成utf-8。问:为什么在进行http传输的时候,需要将Byte数组进行base64编码呢?
答:因为http协议是文本协议,不同于二进制协议(如Thrift)那样直接进行二进制传输。base64是一种编码算法。为什么叫base64呢?因为这种算法只支持可打印字符中的64个(26个大写字母、26个小写字母、0-9这9个数字、+、/)(再加上作为垫字的"=",实际上是65个字符)。
问:什么是可打印字符?
答:ASCII码的范围是0-127,其中0-31和127这33个字符属于控制字符(Control characters)。
剩下32-126这95个字符属于可打印字符(Printable characters),包括数字、大小写字母、常用符号。早期的一些传输协议,例如传输邮件的SMTP协议,只能传输可打印的ascii字符。导致原本8bit字节码范围(范围0-255)超过了可用的范围。
比如当邮件传输图片资源的时候,某一个Byte值是10111011B,对应十进制187不属于ASCII码范围,因此无法被传输。
这个时候,base64编码应运而生了,它利用6bit字符表达了原本的8bit字符。问:原本的字节码是8bit,base64怎么能够用 6bit 来容纳 8bit 的内容呢?
答:既然单一字符的位数有限,我们可以增加字符的数量。8和6的最小公倍数是24,这就意味着我们可以用4个base64字符来表示3个传统的8bit字符。
相比8bit的字符编码,base64编码会多占用三分之一的字节长度,以此为代价实现了更好的兼容性。
相关文章
- 循序渐进,搞懂什么是贪心算法
- TSL 和 SSL 是什么?它们有何关系?-定义:SSL(安全套接层)是一种早期的加密协议,用于在互联网通信中保障数据传输的安全性。它通过加密和身份验证机制,确保客户端(如浏览器)与服务器之间的通信不被窃听或篡改。 版本:SSL 1.0(未发布)、SSL 2.0(1995年,已废弃)、SSL 3.0(1996年,已淘汰)。 问题:SSL 3.0 及早期版本存在严重安全漏洞(如 POODLE 攻击),目前已被现代系统禁用。 2. TLS(Transport Layer Security) 定义:TLS(传输层安全协议)是 SSL 的继任者,旨在提供更安全的通信协议。TLS 由国际互联网工程任务组(IETF)标准化,逐步替代了 SSL。 版本:TLS 1.0(1999年,已淘汰)、TLS 1.1(2006年,已淘汰)、TLS 1.2(2008年,广泛使用)、TLS 1.3(2018年,最新标准)。 优势:更强的加密算法(如 AES、ChaCha20)、更高效的握手过程、支持前向保密(Perfect Forward Secrecy)等。 SSL 与 TLS 的关系 继承关系 TLS 直接基于 SSL 3.0 设计,可以视为 SSL 的升级版。TLS 1.0 最初命名为 SSL 3.1,后因标准化需要更名为 TLS。 协议兼容性
- 算法中,什么是哈希值,哈希值怎么生成的,有什么用?
- 任何国家都无法限制数字货币。为什么呢? 要想明白这个问题需要具备一点区块链的基础知识: 区块链使用的大致技术包括以下几种: a.点对点网络设计 b.加密技术应用 c.分布式算法的实现 d.数据存储技术 e.拜占庭算法 f.权益证明POW,POS,DPOS 原因一: 点对点网络设计 其中点对点的P2P网络是bittorent ,由于是点对点的网络,没有中心化,因此在全球分布式的网
- 什么是Base64算法?什么情况下用Base64算法?
- 什么是限流?常见的限流算法
- 数据结构开篇(普普通通浅浅聊数据结构)什么是数据结构 、什么是算法、重要性、如何学好数据结构呢
- Spark-机器学习(1)什么是机器学习与MLlib算法库的认识
- 用通俗易懂的方式告诉你什么是EM算法
- 网络安全 | 什么是负载均衡器?-算法