近兩年的情況表明,網站啟用https已是大勢所趨。但由于懶,一直沒有動作。在David Yin的激勵下,終于在人際稀少的春節(jié)前夕把SEO每天一貼轉換成https了。
使用https加密目前看有利有弊。利,首先是安全,減少被劫持、篡改的機會。弊,主要是速度上的,由于證書驗證、多次握手、CPU消耗等原因,https頁面速度會被拖慢一點。但https無疑是未來趨勢。
改為https對SEO按說應該有好處,不過實際情況如何還有待驗證。Google方面早就表明https是排名因素之一,雖然只是個很小因素。百度以前曾經提到過,百度不會主動抓取https頁面,但2015年百度站長平臺發(fā)布消息,百度對https頁面優(yōu)先收錄、優(yōu)先排名:
“從相關性的角度,百度搜索引擎認為權值相同的站點,采用https協(xié)議的頁面更加安全,排名上會優(yōu)先對待。此次技術升級之后,百度搜索將同一個域名的http版和https版作為一個站點來處理,優(yōu)先收錄https頁面;”
從http改到https后的一段時間,搜索引擎需要重新抓取、判斷、計算,收錄,排名和流量都可能有起伏。說是起伏,恐怕主要是下降。雖然從http版本全站做了301轉向到https版本,我們都知道,百度對301轉向處理很慢、很保守,需要持續(xù)觀察什么時候能完成正確判斷并傳遞權重。Google也表明過,301轉向不能完全傳遞權重,是有損耗的。
就SEO每天一貼來說,另一個可能造成麻煩的是,這個網站以前做過多次URL路徑變化和301轉向,還換過域名,現(xiàn)在再多加一次301轉向,多層轉向有可能造成搜索引擎不愿意跟蹤,不能完全傳遞權重。本博客外鏈增加最多的時候還是剛剛開博的頭兩年,那時候的鏈接都是指向最早的URL的,到現(xiàn)在的https新URL,經過了3-4次轉向,這恐怕是搜索引擎會跟蹤的轉向數(shù)的上限了。所以,可能會丟失一部分無法挽回的外鏈效果。
接下來本博客的主要關鍵詞排名可能會下降甚至消失一段時間,能不能恢復也是未知之數(shù)。但長痛不如短痛,既然是趨勢,無論如何也得跟進。
簡單說一下把網站從http轉換到https的過程,也許對讀者有借鑒意義。下面只是我做轉換的過程,并不是最優(yōu)方法,按說應該先在單獨的服務器上測試https版本,我并沒有。公司網站最好更謹慎點。
購買SSL證書
這個是必須的,現(xiàn)在價格并不貴。到David Yin帖子看一下,便宜的3年只是幾十塊錢。安裝SSL證書的技術問題,無法在這討論了,不明白的問技術人員吧。
備份、備份
這個也是必須的。對SSL安裝、服務器配置不熟悉的站長來說,轉換過程不一定是那么順利的。
新版本代碼改動
SL證書安裝后,https版本就可以訪問了。原來網站上的所有URL都需要改到https版本,包括鏈接、圖片、JS等,所以可能需要修改文章數(shù)據(jù)庫、模板、插件等。
本博客使用WordPress,要在后臺把博客地址改為https版本:
這樣,絕大部分導航中的鏈接就由WP系統(tǒng)自動改為https版本了。但很可能還有一些導航性質的鏈接是硬編碼在模板中的,比如這個博客帖子下面的版權聲明,那是人工寫在模板里的,別忘了改。
帖子正文中人工加的內部鏈接也需要自己改。如果使用了phpMyadmin,用下面指令跑一下數(shù)據(jù)庫就行了:
update wp_posts set post_content = replace(
post_content, ‘http://www.seozac.com/’,
‘https://www.seozac.com/’);
帖子里的圖片路徑也就同時改了。
如果沒有使用數(shù)據(jù)庫管理工具,寫個簡單php程序運行一下也可以。
因為只是用指令在數(shù)據(jù)庫執(zhí)行了一下,沒有也沒辦法人工檢查所有頁面,可能有漏掉的鏈接、圖片之類的,讀者要是發(fā)現(xiàn)了,麻煩告訴我一下。
這里我還遇到了些沒解決的問題。新浪微博組件和百度分享按鈕組件貌似都不支持https,原理上應該可以把JS下載下來放到自己服務器上,但暫時沒時間弄這個,先拿掉了。
檢查新版本頁面源代碼
訪問一下https版本頁面,包括首頁、欄目頁、內頁、sitemap,查一下源代碼,看看還有沒有http地址的存在,不僅頁面可見部分,還得看看head部分,JS等,比如head里的canonical標簽是否改到https版本了?程序生成的sitemap里的URL是否改為https版本了?
全站301轉向
全站做http到https的301轉向。LAMP服務器為例,在.htaccess文件中加:
RewriteEngine On
RewriteCond %{SERVER_PORT} 80
RewriteRule ^(.*)$ https://www.seozac.com/$1 [R=301,L]
RewriteCond %{HTTP_HOST} ^seozac.com [NC]
RewriteRule ^(.*)$ https://www.seozac.com/$1 [L,R=301]
這個代碼只是舉例,也是我的博客用的實際代碼,還有其他寫法也可以,只要實現(xiàn)了301就行。
訪問原h(huán)ttp版本頁面,檢查301是否生效。
百度站長平臺和Google Search Console
搜索引擎抓取301轉向后,應該可以自行判斷網站已經從http轉到https了。另一個通知搜索引擎的方法是通過站長平臺。
在Google Search Console中,把https網站加入并驗證,不需要使用Change of Address功能??梢栽趆ttp及https版本的賬號下,用Fetch as Googlebot功能看看兩種版本的URL是否返回正確頭信息和頁面源代碼。
百度站長平臺好像不支持兩個版本都加入站長平臺。不過在原來http賬號下,管理站點屬性部分有這樣一個選項:
點這句話右面的設置按鈕,出來一個對話框,問是否確認支持https協(xié)議,點“是”后變成這樣:
希望這樣百度就知道應該把http和https兩個版本動作一個網站處理。
持續(xù)觀察抓取、收錄、排名、流量
這是接下來兩三個月要做的事了,以后有進展再來報告。
目前可以報告的是,原始日志顯示,百度及Google蜘蛛都抓取正常,已經抓取了301及轉向后的頁面。我是26號凌晨4-6點安裝SSL證書、加301轉向的,26號中午Google已經索引了幾十個https頁面(然而,沒有首頁,可能對待首頁比較謹慎):
并且一些https頁面(并不是所有已經索引了的https頁面)已經進入排名,和原來的http版本位置基本是一樣的。
百度到目前為止,還沒有索引https頁面。
盡量改正外部鏈接
可能的話,把外部鏈接改到新的https地址。