第190部分(第4/4 頁)
資料庫中進行匹配,如果發現標題中含有這個關鍵字,那麼就可以認為這本“書”就是使用者所需要找的內容,便將這本“書”所在的“書架”告訴使用者,讓他去訪問。
書即網站,書所在書架則就是網站的地址連結。
後來,搜尋引擎規模化,公司化之後,財大氣粗的公司擁有大量的資金,可以購置大量的伺服器和硬碟,於是便開始了將網站上的所有網頁都給抓取下來,也就是說,使用者不但可以進行標題搜尋還可以進行全文搜尋。這無疑是一種進步,因為標題通常情況下所包的資訊只有那麼多,不可能涵蓋所有內容。
但是,這是一個資訊大爆炸的時代,網際網路就是一個知識的海洋,網站成千上萬,一個關鍵詞搜尋出來的結果往往也有成千上萬,如果在這些結果中找到自己所需要的資訊,又成為了一個難題。
這是所有搜尋引擎都在研究的問題,歸根結底,就是將網頁進行排序,越好的網頁應該越排前列,這樣使用者就不需要花費多少時間就能找到自己所需要的資訊。
說起來容易做起來卻是相當困難,各個搜尋引擎公司都有自己的排序演算法,這些都是商業機密,不對外公開。而使用者都是非常現實的,如果你的產品好,的確可以帶來便利,那麼他就會使用,並且還會推薦別人使用。
林鴻所發現的這個BckRwp就是看到別人推薦才發現的,並且一用之下發現它的演算法的確很強,通常情況下都能很快找到自己所要找的資訊。
他經過研究發現,這個搜尋引擎使用了一種名為PageRdnk的演算法。
實際上,林鴻也不知道到底是不是叫這個名稱他之所以稱之為PageRdnk,是因為這個名詞多次出現在原始碼中。
林鴻將整個原始碼通讀了一遍,他發現PaqRank分為十一個等級,從gk到pO級,級別越高就代表著質量越好那麼該網站的排名也就越高。
至於如何計算網站的PR值也非常巧妙-,則是根據
本章未完,點選下一頁繼續。