上周學(xué)院已發(fā)布百度搜索對HTTPS站點的全流程支持方案,可還是陸續(xù)收到站長提問,做了HTTPS站點,在平臺如何提交數(shù)據(jù),如何使用工具,下面學(xué)院君再給大家細細講解:
1、HTTPS站點請先使用平臺HTTPS認證工具,經(jīng)過平臺工具驗證后,可加速搜索對HTTPS和http站點間的抓取切換
2、平臺已全面支持HTTPS站點,HTTPS站點可使用平臺所有工具,可參考教育文章《百度對HTTPS站點全流程支持方案文字概述》
3、HTTPS認證工具只是協(xié)議的切換,站長平臺對站點本身的各項統(tǒng)計數(shù)據(jù)不會因為協(xié)議的切換而發(fā)生變化, HTTPS認證之后所有工具都無痛切換,正常使用
4、注意:HTTPS站點添加子站點的時候,如果是HTTPS的子站在添加的時候就把協(xié)議頭帶上,不帶的話會默認算成http的
HTTPS優(yōu)勢
HTTPS是基于tls和ssl加密的http協(xié)議,網(wǎng)絡(luò)傳輸是加密的,因此它的安全是顯而易見的,包括防竊聽、篡改、劫持。
HTTPS的收錄機制
1、Spider如何發(fā)現(xiàn)HTTPS
1)、根據(jù)網(wǎng)頁中的超鏈接是否是HTTPS,網(wǎng)絡(luò)中會有一些超鏈,如果是HTTPS會認為是HTTPS站點。
2)、根據(jù)站長平臺提交入口的提交方式,例如主動提交,如果在文件當中提交的是HTTPS鏈接會以HTTPS的形式來發(fā)現(xiàn)。
3)、參考前鏈的抓取相對路徑,第一個網(wǎng)頁是HTTPS的,網(wǎng)站內(nèi)容里面的路徑提供的是相對路徑,會認為這種鏈接是HTTPS。
4)、參考鏈接的歷史狀況,使用這種方式的原因主要是為了糾錯,如果錯誤提取HTTPS會遇到兩種情況,一種因為HTTPS不可訪問會抓取失敗,第二即使能抓成功可能展現(xiàn)出來的可能不是站長希望的,所以會有一定的糾錯。
2、HTTPS鏈接的抓取
現(xiàn)在比較常見的兩種,第一種是純HTTPS抓取,就是它沒有http的版本,第二個是通過http重定向到HTTPS,這兩種都能正常的進行抓取跟http抓取的效果是一樣的。
3、HTTPS的展現(xiàn)
對于HTTPS數(shù)據(jù),展現(xiàn)端會有明顯的提示
站長平臺支持全站HTTPS配置
1、HTTPS配置
之前有一些站長改HTTPS,會疑問為什么站點有些鏈接是以http的形式來抓呢?為什么沒有全站都是以HTTPS的形式來抓取呢?因為以前的機制是url級的,HTTPS抓完一條替換一條,整站需要全抓完才能全部替換掉,現(xiàn)在大家訪問站長平臺可以發(fā)現(xiàn),左邊工具欄多了HTTPS認證的功能,站長平臺已經(jīng)全站支持HTTPS,點這個功能后會有提示引導(dǎo)我們?nèi)ピ趺醋觯?strong>需要提醒是需要全站支持HTTPS,才進行點擊,如果不支持的話對站點會有一些副作用。
2、HTTPS驗證
當站長在平臺上做了配置以后首先會有HTTPS驗證,驗證確認站長是否誤配,具體會檢查https鏈接是不是可抓取的。另外會對HTTPS的證書校驗,包括它的合法性、是否過期、跟它本身的域名是否一致,從這三個角度做校驗。
3、HTTPS生效
校驗通過后,生效方式從這三個角度進行
1)、全站抓取以HTTPS的方式來抓,這會在抓取上做一定的切換
2)、全站的展現(xiàn)樣式也會直接切換成HTTPS,用了這個功能的好處是會比以前快很多,會略過已收錄的網(wǎng)頁直接到HTTPS。
常見問題:
1、站長升級HTTPS是不是會影響爬蟲抓取?不會。爬蟲對https的合法鏈接都能抓
2、站長升級HTTPS是不是會影響索引量?不會的,建庫做了相應(yīng)升級,HTTPS的建庫是不會有延遲的。
3、站長升級HTTPS是不是會影響排名點擊流量?不會,HTTPS改造是不涉及到域名切換,或者說老域名到新域名樣式的轉(zhuǎn)變等等這個是不涉及的,可以做到完全無損的切換。
4、站長升級的HTTPS是不是會影響移動適配?不會有這種情況。
5、站長升級HTTPS是不是會影響站長平臺工具?不會,站長平臺鏈接提交等工具已經(jīng)都支持HTTPS了。
站點建議
1、建議站長從http到HTTPS的301跳轉(zhuǎn),不建議只有HTTPS,而無http到HTTPS的跳轉(zhuǎn)關(guān)系,只用HTTPS訪問對用戶來說,可能會遇到問題。
2、不建議HTTPS、http這兩種版本并存,這種情況存在三種問題,第一個它的維護成本比較高,需要維護兩個版本;第二個做不到絕對安全,http訪問有不安全風(fēng)險;第三有不一致的可能性,隨著長遠的發(fā)展這兩個版本可能會越來越不一致,會影響用戶體驗,我們建議站長做了HTTPS之后能對HTTPS做一定的跳轉(zhuǎn)預(yù)設(shè)。
3、HTTPS回退到HTTP極不建議。例如線上已經(jīng)展示HTTPS的鏈接給用戶點擊,如果站長回退到http,用戶在瀏覽器里面點開的時候會展現(xiàn)死鏈的樣式是非常不建議的,做這個之前一定考慮。如果實在想做回退,請在站長平臺提交HTTPS校驗,并建議站點提前至少24小時在平臺提交回退,這樣能夠保證站長的點擊不會出現(xiàn)死鏈的形式,這點非常重要。
4、HTTPS網(wǎng)頁沒有建設(shè)完成之前不要在互聯(lián)網(wǎng)上提供超鏈接,之前遇到過好幾個case,本身HTTPS并沒有做完,兩個版本都存在,但是http是用戶可訪問的,或者說HTTPS的頁面是一個臨時性的假頁面,這樣站點有可能就以HTTPS的形式展現(xiàn)出來,會引起用戶體驗問題。
原文:http://zhanzhang.baidu.com/college/articleinfo?id=1018
發(fā)表評論: