<var id="dbnhz"><dl id="dbnhz"></dl></var>
<var id="dbnhz"></var>
<var id="dbnhz"><video id="dbnhz"></video></var>
<var id="dbnhz"></var><cite id="dbnhz"><strike id="dbnhz"><thead id="dbnhz"></thead></strike></cite>
<cite id="dbnhz"></cite>
<var id="dbnhz"></var><var id="dbnhz"></var><cite id="dbnhz"><strike id="dbnhz"></strike></cite>
<var id="dbnhz"><strike id="dbnhz"></strike></var>
  • 鄭州網站建設_網站制作_網頁設計_手機建站-鄭州建站

  • 手機網站 專注網站建設 品牌的力量 值得信賴

    服務熱線: 15136144056/15638281969

當前位置:首頁 > 建站知識 > 新速觀點 > 正文

新速觀點 - seo學習筆記 - 搜索引擎原理

發布時間:2015年01月16日 02:53 | 發布者:新速科技 | 瀏覽次數:2129次


最近一直在學習wordpress,這個是一個非常有利于優化的一套程序

搜索引擎原理

SEO就是搜索引擎優化的意思,通過優化自己的網站來提升自己在搜索引擎的排名。對于seo,只有理解了搜索引擎的工作原理,很多的seo技巧很自然的可以想到。
搜索引擎的工作原理,大概分為三步:

  • 爬行和抓取
  • 索引
  • 排名

爬行和抓取

搜索引擎用來爬行和訪問頁面的程序叫spider(蜘蛛)或者bot(機器人)。搜索引擎訪問頁面時候類似于用戶通過瀏覽器訪問,拿到的都是html文件,存儲到原始的數據庫中。

為了盡可能多的抓取網上的所有鏈接,蜘蛛會跟蹤一個頁面上的鏈接,從一個頁面爬到另一個頁面。(因此,我們在一些論壇,或者其他地方放上自己網站的鏈接,自己的網站就可以很快被收錄。)理論上,這樣是可以把網上所有的網頁都抓取到的。但是實際上并不能實現。蜘蛛只會抓取他認為比較重要的頁面。那么,哪些是他認為比較重要的呢?下面就是其中兩條:

  • 網站和頁面權重比較高的
  • 更新頻率比較快的。如果蜘蛛發現一個網站不怎么更新,自然沒必要經常跑過來看。

這些都給我們一些啟示,比如經常更新網站,或者寫好的文章定時發布,不要出現間斷等等。

索引

在前面,蜘蛛將抓取的html文件存入原始的數據庫,還需要進一步處理。這個過程,就相當于我們的語文題目“用一句話概括全文”了,當然搜索引擎是用幾個關鍵詞來概括全文。怎樣用幾個詞來概括全文呢?如果讓人來做,大概會如此進行:先把哪些多余的html標簽刪除了,在把哪些版權信息之類的東西去掉,再把“之乎者也”或者“的得地”這些不影響意思的詞語去掉等等。搜索引擎的大致步驟也是如此。經過一些列的處理,搜索引擎交出了這樣的答卷:

網頁id 關鍵詞
網頁1 關鍵詞1,關鍵詞2
網頁2 關鍵詞3,關鍵詞4
··· ······

這樣,其實是得到一個網頁對應若干關鍵詞,(這種數據結構被稱為正向索引)這是沒辦法直接用的。比如,用戶要搜索關鍵詞2,搜索引擎要把含有關鍵詞2的所有網頁顯示出來,就要把在整個數據庫李查找一遍。進一步的加工就是,一個關鍵詞對應若干個網頁,就是反向索引。形式如下:

關鍵詞 網頁
關鍵詞1 網頁1,網頁2
關鍵詞2 網頁3,網頁4
··· ······

排名

蜘蛛抓取了頁面,索引程序計算得到了反向索引就可以等著用戶的輸入了。比如用戶輸入“wordpress教程”,搜索引擎顯示找到了N個包含這個關鍵字的網站,然后來個兵器譜排名顯示。(不知道www.xinsu360.com能否奪得兵器譜上第一名呢?)

實際上,很多網頁都會包含“wordpress教程”這個關鍵詞,可能有幾十萬,幾百萬,都計算他們的相關性也挺復雜的,但是絕大多數人用百度的時候只看前兩頁的。這個有點像華山論劍,要給天下高手來個排名,也不是每個人都有資格去華山的,也不是每個網頁都有資格參與相關性計算的。實際上,選出前1000個網頁進行相關性計算就可以滿足要求。海選之后,就剩下了1000個人參加華山論劍了。

但是,問題來了:還沒有進行相關性計算,怎么知道哪1000個相關性最高?因此,海選是不需要比武(相關性計算),主要是根據頁面權重來的。

海選之后,就是另一輪比拼——相關性計算,相關性高的排前面,相關性低的排在后邊。這么,自然沒什么問題。

相關性的計算方法,與下面的幾個因素有關:關鍵詞密度,關鍵詞位置等等。關鍵詞在title,h1標簽中,相關性會高一些??梢岳斫?,看文章先看看各級標題就可以大概了解內容。我的一點點感受就是寫文章的時候,標題中含關鍵字(否則就是作文離題了,不僅僅是迎合seo);可以先把文章的大綱列出來,把各級標題放在h1標簽中,這個不但是利于搜索引擎的優化,而且對自己可以理清思路,綱舉則目張,對用戶可以更清楚文章的思路,快速檢索需要的信息。

海選玩了(選出匹配子集),計算相關性完了,排名大體就確定了,然后搜索引擎進行一些調整,之后顯示出來,就是用戶看到的了。


久久天天躁狠狠躁夜夜爽_国产精品久久久久久无码_日本XXXX高清色视频在线播放_精品久久久久中文字幕日本
<var id="dbnhz"><dl id="dbnhz"></dl></var>
<var id="dbnhz"></var>
<var id="dbnhz"><video id="dbnhz"></video></var>
<var id="dbnhz"></var><cite id="dbnhz"><strike id="dbnhz"><thead id="dbnhz"></thead></strike></cite>
<cite id="dbnhz"></cite>
<var id="dbnhz"></var><var id="dbnhz"></var><cite id="dbnhz"><strike id="dbnhz"></strike></cite>
<var id="dbnhz"><strike id="dbnhz"></strike></var>