????浏览器缓存机制与分类

????前言
????浏览器缓存分类
????按缓存位置分类
????按失效策略分类
????总结

????*★,°*:.☆(￣▽￣)/$:*.°★* ????

????欢迎来到猫先生的****博文，本文主要讲解浏览器缓存机制与分类????

????我是猫先生????????

????喜欢的朋友可以关注一下，下次更新不迷路????

????前言

处理好浏览器缓存对提升系统的性能有很大的帮助，为什么要使用缓存，我们一般请求资源后直接使用，当我们再次请求资源时，还要继续从服务器拿到数据吗？答案不以为然，当第一次请求资源后，可以进行缓存，然后再次请求资源时可以直接从缓存中读取，提高了效率。

????浏览器缓存分类

浏览器的缓存分为了很多种，大概分为以下几类：
按缓存位置：memory cache， disk cache， Service Worker 等
按失效策略：Cache-Control，ETag等
我们在Network的Size中会看B、KB、M等，这些都是网络请求，而memory cache、disk cache等这些都是从缓存中读取。
浏览器缓存机制与分类（一）

浏览器请求的时候怎么进行缓存操作呢？具体如下：

浏览器缓存机制与分类（一）

操作的系统的一般都是先读内存，再读硬盘。请求资源遵循找到即返回，找不到则继续；优先级为：

Service Worker
memory cache（内存的缓存）
disk cache（硬盘中的缓存）
网络请求

我们可以看到，有的是内存缓存，有的是硬盘缓存，那么两者有什么区别呢？
内存缓存(from memory cache)：内存缓存具有两个特点，分别是快速读取和时效性：

快速读取：内存缓存会将编译解析后的文件，直接存入该进程的内存中，占据该进程一定的内存资源，以方便下次运行使用时的快速读取。
时效性：一旦该进程关闭，则该进程的内存则会清空。

硬盘缓存(from disk cache)：硬盘缓存则是直接将缓存写入硬盘文件中，读取缓存需要对该缓存存放的硬盘文件进行I/O操作，然后重新解析该缓存内容，读取复杂，速度比内存缓存慢。

????按缓存位置分类

memory cache

memory cache 是内存中的缓存，它是浏览器为了加快读取缓存速度而进行的自身的优化行为。几乎所有网络请求都会自动加入到memory cache ，但是由于数量大和浏览器的占用内存不能无限扩大，故它属于短期存储。关闭浏览器tab便会失效；该页面的缓存占用内存超级多，则会在关闭tab前，排在前面的缓存便失效。

内存中的缓存
短期存储
网络请求几乎都会自动加入

preloader、preload

memory cache使用的话有两种方式.

preloader
浏览器打开网页，先请求html，若有js、css等资源，会使用CPU资源进行解析并执行。之前是串行模式，即请求js/css-解析执行-请求下一个js/css-解析执行。我们会发现解析时候，网络请求是空闲的，使用preloader则可以在解析资源的同时，还能请求下一批资源，使用preloader请求来的资源会放到memory cache，供之后解析执行操作
preload
显式的预加载资源，也会放到memory cache。比如<link rel="preload"></link>
memory cache保证了页面中两个相同请求，都实际请求最多一次，比如（两个src相同的<img>，两个href相同的<link>），匹配缓存时，不仅匹配相同的url，还会比较他们的类型、CORS中的域名规则等。脚本（script）类型被缓存的资源是不能用在(image)类型的请求中，即使他们的src相等。

disk cache

disk cache 也叫做HTTP cache，属于硬盘上的缓存，允许跨会话，跨站点情况使用，比如；两个站点使用一张图片，持久存储在文件系统。通过HTTP头部信息判断资源是否缓存、是否仍可用，是否过时重新请求。比读取内存慢些，绝大部分缓存都来自disk cache。

持久存储
跨站点、快会话
HTTP头部判断

Service Worker

Service Worker 是由开发者编写的额外的脚本，且缓存位置独立，出现也较晚，使用还不算太广泛。memory cache与disk cache都是通过浏览器内部判断，Service Worker可以直接操作缓存，储存在Application中的Cache Storage 。关闭浏览器或者tab缓存依然存在。除非手动调用cache.delete(resource)或者容量超出限制，被浏览器全清空。
Service Worker没能命中缓存，则会用fetch()方法继续获取资源，此时memory cache或者disk cache进行下一次找缓存工作。Service Worker 的 fetch() 方法获取的资源，即便它并没有命中 Service Worker 缓存，甚至实际走了网络请求，也会标注为 ServiceWorker缓存。
浏览器缓存机制与分类（一）

网络请求

为了提升之后请求的缓存命中率，自然要把这个资源添加到缓存中去。

根据 Service Worker 中的 handler 决定是否存入 Cache Storage (额外的缓存位置)
根据HTTP头部字段（Cache-control，Pragma等）决定是否加入disk cache
preloader、preload保存一份资源的引用

????按失效策略分类

强缓存

当客户端请求时，先访问缓存数据库看缓存是否存在，存在直接返回，不存在，请求真实服务器，响应后加入到缓存数据库。
强缓存，直接减少了请求数，是提升最大的缓存策略。 它的优化覆盖率请求数据的三个步骤。如果考虑缓存来优化页面性能，则强缓存应该被首选。
实现方式有两种：Expires、Cache-contrl

Expires

这个是HTTP1.0字段，表示缓存到期时间，是绝对时间（当前时间+缓存时间），在响应消息头设置后，在未过期之前步需要再次请求。但是弊端很大：

Expires: Thu, 10 Nov 2017 08:45:11 GMT

修改本地时间、时差等都会造成客户端与服务端时间不一致
写法复杂

Cache-contrl

表示缓存的最大有效时间，该时间为相对时间。

Cache-control: max-age=2592000

max-age：即最大有效时间
must-revalidate：如果超过了 max-age 的时间，浏览器必须向服务器发送请求，验证资源是否还有效。
no-cache：虽然字面意思是“不要缓存”，但实际上还是要求客户端缓存内容的，只是是否使用这个内容由后续的对比来决定。
no-store: 真正意义上的“不要缓存”。所有内容都不走缓存，包括强制和对比。
public：所有的内容都可以被缓存 (包括客户端和代理服务器，如 CDN)
private：所有的内容只有客户端才可以缓存，代理服务器不能缓存。默认值。
max-age到期应该重新验证，no-cache是必须验证，（max-age，must-revalidate等价于no-cache），Cache-control优先级高于Expires。

对比缓存

对比缓存也叫做协商缓存，当强制缓存失效（超过规定时间），就会使用对比缓存，由服务器决定缓存内荣是否失效。
浏览器先请求缓存数据库，返回一个缓存标识。之后浏览器拿这个标识和服务器通讯。如果缓存未失效，则返回 HTTP 状态码 304 表示继续使用，于是客户端继续使用缓存；如果失效，则返回新的数据和缓存规则，浏览器响应数据后，再把规则写入到缓存数据库
对比缓存在请求数和没有缓存是一致的，但是返回304，返回的仅仅是状态码，没有实际的文件内容，因此 节省了响应体体积，缩短网络传输时间。 和强制缓存来说提升幅度较小。对比缓存有两种方式：

Last-Modified & If-Modified-Since

1 服务器用Last-Modified字段告知客户端资源最后一次被修改的时间

Last-Modified: Mon, 10 Nov 2018 09:10:11 GMT

浏览器储存这个值和内容
下一次请求相同资源时时，浏览器从自己的缓存中找出“不确定是否过期的”缓存。因此在请求头中将上次的 Last-Modified 的值写入到请求头的 If-Modified-Since 字段。
服务器会将 If-Modified-Since 的值与 Last-Modified 字段进行对比。如果相等，则表示未修改，响应 304；反之，则表示修改了，响应 200 状态码，并返回数据。

缺陷：

资源更新速度以秒以下单位则会失效，因为它的时间单位最低为秒
文件是服务器动态生成的，那么方法的更新时间永远都是生成时间，尽管文件未变化

Etag & If-None-Match

Etag & If-None-Match解决了上述问题。Etag 存储的是文件的特殊标识(一般都是 hash 生成的)，服务器存储着文件的 Etag 字段。之后的流程和 Last-Modified 一致，只是 Last-Modified 字段和它所表示的更新时间改变成了 Etag 字段和它所表示的文件 hash，把 If-Modified-Since 变成了 If-None-Match。服务器同样进行比较，命中返回 304, 不命中返回新资源和 200。

Etag 的优先级高于 Last-Modified

????总结

调用 Service Worker 的 fetch 事件响应
查看 memory cache
查看 disk cache。这里又细分：
- 如果有强制缓存且未失效，则使用强制缓存，不请求服务器。这时的状态码全部是 200
- 如果有强制缓存但已失效，使用对比缓存，比较后确定 304 还是 200
发送网络请求，等待网络响应
把响应内容存入 disk cache (如果 HTTP 头信息配置可以存的话)
把响应内容的引用存入 memory cache (无视 HTTP 头信息的配置)
把响应内容存入 Service Worker 的 Cache Storage (如果 Service Worker 的脚本调用了 cache.put())

本文参考：一文读懂前端缓存

秒客网