Expires、Cache-Control、Last-Modified、ETag是RFC 2616(HTTP/1.1)協(xié)議中和網(wǎng)頁緩存相關(guān)的幾個字段。前兩個用來控制緩存的失效日期,后兩個用來驗證網(wǎng)頁的有效性。要注意的是,HTTP/1.0有一個功能比較弱的緩存控制機制:Pragma,使用HTTP/1.0的緩存將忽略Expires和Cache-Control頭。我們這里以Apache2.0服務(wù)器為例,只討論HTTP/1.1協(xié)議。
Expires
Expires字段聲明了一個網(wǎng)頁或URL地址不再被瀏覽器緩存的時間,一旦超過了這個時間,瀏覽器都應(yīng)該聯(lián)系原始服務(wù)器。RFC告訴我們:“由于推斷的失效時間也許會降低語義透明度,應(yīng)該被謹(jǐn)慎使用,同時我們鼓勵原始服務(wù)器盡可能提供確切的失效時間。”
對于一般的純靜態(tài)頁面,如html、gif、jpg、css、js,默認(rèn)安裝的Apache服務(wù)器,不會在響應(yīng)頭添加這個字段。Firefox瀏覽器接受到相應(yīng)后,如果發(fā)現(xiàn)沒有Expires字段,瀏覽器根據(jù)文件的類型和“Last-Modified”字段來推斷出一個合適的失效時間,并存儲在客戶端。推測出的時間一般是接受到響應(yīng)時間后的三天左右。
Apache的expires_module模塊可以在Http響應(yīng)頭部自動加上Expires字段。在Apache的httpd.conf文件中進(jìn)行如下配置:
#啟用expires_module模塊
LoadModule expires_module modules/mod_expires.so
# 啟用有效期控制
ExpiresActive On
# GIF有效期為1個月
ExpiresByType image/gif A2592000
# HTML文檔的有效期是最后修改時刻后的一星期
ExpiresByType text/html M604800
#以下的含義類似
ExpiresByType text/css “now plus 2 month”
ExpiresByType text/js “now plus 2 day”
ExpiresByType image/jpeg “access plus 2 month”
ExpiresByType image/bmp “access plus 2 month”
ExpiresByType image/x-icon “access plus 2 month”
ExpiresByType image/png “access plus 2 month”
對于動態(tài)頁面,如果在頁面內(nèi)部沒有通過函數(shù)強制加上Expires,例如header(”Expires: ” . gmdate(”D, d M Y H:i:s”) . ” GMT”),Apache服務(wù)器會把Wed, 11 Jan 1984 05:00:00 GMT
作為Expires字段內(nèi)容,返回給瀏覽器。即認(rèn)為動態(tài)頁面總是失效的。而瀏覽器仍然會保存已經(jīng)失效的動態(tài)頁面。
可以發(fā)現(xiàn)Firefox瀏覽器總是緩存所有頁面,不管失效、不失效還是沒有聲明失效時間。即使緩存中聲明了一個網(wǎng)頁的實效日期是1970-01-01 08:00:00,瀏覽器仍然會發(fā)送該文件在緩存中的Last-Modified和ETag字段。 如果在服務(wù)器端驗證通過,返回304狀態(tài),瀏覽器就還會使用此緩存。
Cache-Control
Cache-Control字段中可以聲明多些元素,例如no-cache, must-revalidate, max-age=0等。這些元素用來指明頁面被緩存最大時限,如何被緩存的,如何被轉(zhuǎn)換到另一個不同的媒介,以及如何被存放在持久媒介中的。但是任何一個Cache-Control指令都不能保證隱私性或者數(shù)據(jù)的安全性。“private”和“no-store”指令可以為隱私性和安全性方面提供一些幫助,但是他們并不能用于替代身份驗證和加密。
Apache的mod_cern_meta模塊允許文件級Http響應(yīng)頭部的控制,同時它也可以配置Cache-Control頭(或任何其他頭)。響應(yīng)頭文件是放在原始目錄的子目錄中,根據(jù)原始文件名所命名的一個文件。具體用法請參閱Apache的官方網(wǎng)站。
其中Cache-Control : max-age表示失效日期。如果沒有啟動mod_cern_meta模塊,Apache服務(wù)器會把Expires字段中的日期換算成以秒為單位的一個delta值,賦值給max-age。如果啟動mod_cern_meta模塊,并且配置了max-age值,Apache會將這個覆蓋Expires字段。同時,max-age隱含了Canche-Control: public。這樣瀏覽器接受到的Cache-Control : max-age和Expires值就是一致的。
如果失效日期Cache-Control : max-ag=0或者是負(fù)值,瀏覽器會在對應(yīng)的緩存中把Expires設(shè)置為1970-01-01 08:00:00。
Last-Modified
Last-Modified和ETag是條件請求(Conditional Request)相關(guān)的兩個字段。如果一個緩存收到了針對一個頁面的請求,它發(fā)送一個驗證請求詢問服務(wù)器頁面是否已經(jīng)更改,在HTTP頭里面帶上”ETag”和”If Modify Since”頭。服務(wù)器根據(jù)這些信息判斷是否有更新信息,如果沒有,就返回HTTP 304(Not Modify);如果有更新,返回HTTP 200和更新的頁面內(nèi)容,并且攜帶新的”ETag”和”Last-Modified”。
使用這個機制,能夠避免重復(fù)發(fā)送文件給瀏覽器,不過仍然會產(chǎn)生一個HTTP請求。
一般純靜態(tài)頁面本身都會有Last-Modified信息,Apache服務(wù)器會讀取頁面文件中的Last-Modified信息,并添加到http響應(yīng)頭部。
對于動態(tài)頁面,如果在頁面內(nèi)部沒有通過函數(shù)強制加上Last-Modified,例如header(”Last-Modified: ” . gmdate(”D, d M Y H:i:s”) . ” GMT”),Apache服務(wù)器會把當(dāng)前時間作為Last-Modified,返回給瀏覽器。
無論是純靜態(tài)頁面還是動態(tài)頁面,F(xiàn)irefox瀏覽器巧妙地按照接受到服務(wù)器響應(yīng)的時間設(shè)置緩存頁面的Last-Modified,而不是按照http響應(yīng)頭部中的Last-Modified字段。
ETag
既然有了Last-Modified,為什么還要用ETag字段呢?因為如果在一秒鐘之內(nèi)對一個文件進(jìn)行兩次更改,Last-Modified就會不正確。因此,HTTP/1.1利用Entity Tag頭提供了更加嚴(yán)格的驗證。
Apache服務(wù)器默認(rèn)情況下,會對所有的靜態(tài)、動態(tài)文件的響應(yīng)頭添加ETag字段。
在Apache的httpd.conf文件中可以通過FileETag指令配置該選項。FileETag指令配置了當(dāng)文檔是基于一個文件時用以創(chuàng)建Etag(entity tag)響應(yīng)頭的文件的屬性。在Apache 1.3.22及以前,ETag的值是對文件的索引節(jié)(INode),大?。⊿ize)和最后修改時間(MTime)進(jìn)行Hash后得到的。 如果一個目錄的配置包含了‘FileETag INode MTime Size’而其一個子目錄包含了‘FileETag -INode’那么這個子目錄的設(shè)置(并會被其下任何沒有進(jìn)行覆蓋的子目錄繼承)將等價于‘FileETag MTime Size’。
在多臺負(fù)載平衡的服務(wù)器環(huán)境下,同一個文件會有不同的etag或者文件修改日期,瀏覽器每次都會重新下載。設(shè)置‘FileETag None’可以使響應(yīng)頭不再包含ETag字段。
新聞熱點
疑難解答