HTTP协议缓存策略深入详解之ETAG妙用

2019-02-28 15:54:24

Etag是什么：

Etag 是URL的Entity Tag，用于标示URL对象是否改变，区分不同语言和Session等等。具体内部含义是使服务器控制的，就像Cookie那样。

　　HTTP协议规格说明定义ETag为“被请求变量的实体值” 。另一种说法是，ETag是一个可以与Web资源关联的记号（token）。典型的Web资源可以一个Web页，但也可能是JSON或XML文档。服务器单独负责判断记号是什么及其含义，并在HTTP响应头中将其传送到客户端。

实例详解：

也许读者们看完这个概念，还是搞不清楚这个etag响应头消息到底是干什么的，具体如何使用，所以接下来的篇幅我会用一个实际的例子来详细阐述etag的妙用。

想必许多网友都有订阅某些大虾的RSS的习惯吧，但是大虾也是人，也要吃饭睡觉打豆豆，所以不可能无时无刻的在从事文学创作，因此一般产量较高的大虾也许平均每天能更新两篇已经是不错了，但是网友们却总是不断的去刷新RSS订阅的内容，期望在下次刷新中又有新的劲爆文章出现，如果我们每次刷新，都要从服务器端重新获取内容（事实上，几乎一天内95%以上的刷新返回的都是相同内容，因为刚才也说了，大虾一般一天也就出一两篇新文章而已，所以大部分时间内，内容都是相同的），如果订阅量相当巨大，这对于服务器的压力还是带宽都是一个严重的挑战。其实真正需要服务器重新返回内容是大虾们更新了新的文章后，而其他时间我们无论怎么刷新服务器最好能做到不需返回任何数据，这才是一个比较好的方案，而我们的主角etag响应头的出现正是为了解决这个问题。

浏览器端实现

当我们订阅了某大虾的RSS，如图，我们点击左下角“RSS”按钮：

然后我们进入了rss订阅的相关页面，此时我们打开tamper data查看下http请求和响应的一些内容（这里我们截获http请求和响应信息的工具是基于FF浏览器的tamper data插件，如果您对这个插件不熟悉，请参考我的另外一篇介绍该工具的文章-- Tamper Data安装与使用简介）。如下图：

从上图我们可以看到，服务器端返回响应值为200，并发送回了相应的网页内容，在http响应头中有etag消息头，值为

Etag="fca75d26f6dc8111a7d1b24e9debd652"，我们不需要去关心这个响应头的内容是什么，我们只需要将这这个

头信息的值记录下来，随便创建一个notepad之类的东西保存好，以备接下来的实验使用。

然后我们刷新，希望能从webserver端获取该大虾新的文章，这时候我们用tamper data查看下http头中有哪些内容，如下图：

从此图中我们可以看到If-None-Match="fca75d26f6dc8111a7d1b24e9debd652"，而该值的内容和我们先前第一次

刷新返回的http响应中的etag响应头的值完全一样。

如果某大虾并没在这段时间内发表任何文章，于是webserver端的rss文件没有任何变化，于是If-None-Match值和server端

的etag值相比较完全相等，这时候服务器就会认为客户端已经有最新的rss文件内容的缓存了，于是服务器就会发送一个响应码

为“304”的http响应，304响应想必大家都知道是什么意思了，没错，他不包含任何响应的内容，只是提示客户端缓存的内容是最新的，

如下图

如果某大虾刚发表了一篇新的文章，因此在webserver中的rss的内容发生了改变，因此他的etag值就会发生改变，于是服务器会拿http请求中的If-None-Match的

值和改变和的etag值做对比，显然不正确的，于是webserver就会发送一个新的rss内容给客户端，这里我不能强制要求某大虾来配合我们的实验去立马发表新文章，

所以我们就变相做，也就是我们故意修改http请求头中的If-None-Match的值，这样就和服务器端的etag就不会匹配了，显然这时候服务器就会受骗发送一份“新”的

rss内容回来，如下图：

这里我们将http请求中的If-None-Match的值改为了"modifiedForOurTest", 显然与响应中的Etag="fca75d26f6dc8111a7d1b24e9debd652"不同，因此服务器就被受骗认为浏览器没有最新的文件内容，于是就返回了全新的响应内容（状态码200），而事实上浏览器端是有最新的内容的缓存的。

结束语：

好了，到这里，对这个etag响应头的讲解就结束了，如果反应不错，下一篇我们将介绍并实例详解cache-control的用法，敬请期待：）

2019-06-24 14:24:50

如何在代码中设置LinearLayout的高度
如何在代码中设置LinearLayout的高度

2019-06-25 15:08:02

Tag name should use a unique prefix followed by a colon
意思就是你的tag 名字要使用 app名:tag 的形式比如：

2019-06-27 09:30:44

elementUI里CheckBox组件的change回调如何在使用自定义传参的条件下保留默认传参？
@change="checked=>方法名(checked,你想传的额外参数...)"

2019-07-02 21:55:47

Nginx出现500 Internal Server Error 错误的解决方案
Nginx 500错误（Internal Server Error 内部服务器错误）：500错误指的是服务器内部错误，也就是服务器遇到意外情况，而无法履行请求。在高并发连接的情况下，Nginx是Apache服务器不错的替代品。Nginx同时也可以作为7层负载均衡服务器来使用。根据测试结果，Nginx 0.6.31 + PHP 5.2.6 (FastCGI) 可以承受3万以上的并发连接数，相当于同等环境下Apache的10倍。

2019-07-05 15:26:08

跨账号同地域VPC和VBR互通
跨账号同地域VPC和VBR互通

2019-07-09 11:14:11

VirtualBox下安装CentOS7系统
VirtualBox下安装CentOS7系统

2019-07-09 19:27:15

linux虚拟机安装完毕之后，ifconfig命令提示command not found
用虚拟机安装了centos

2019-07-09 20:19:37

VirtualBox下安装CentOS7系统
VirtualBox下安装CentOS7系统

2019-07-09 20:23:42

如何在windows服务器上面创建定时任务
在Linux上面运行java程序要比在windows上面跑稳定很多，但是总有些情况下我们的程序跑在了windows上面，这就需要我们对windows server有所了解。今天给大家介绍下如何在windows服务器上面创建定时任务来定时执行java程序。

2019-07-09 20:25:19

linux实现自动远程备份（scp+ssh）
刚上线的服务器需要备份日志，要备份到另一台服务器上去，为了减少工作量，采用linux的定时任务去自动执行。因服务器都是linux的，因此采用linux的远程复制scp命令。但这里涉及到一个问题，就是scp命令执行时需要输入密码，在网上大概搜集了下有两种方法：①一种是采用except方法（会存储明文密码）；②采用ssh生成密钥的方式。这里我采用第二种方式。耗时两天，中途遇到各种问题，不过总算解决了