PageRank

此blog的起頭就是為了這個.............
有好朋友問起它的算法及如何提昇
那就解釋一下嚕!!!!!!!
以下是Wikipedia百科對它的解釋：
ps:看得完此篇文章，且懂一點點它的計算方式的傢伙們，我佩服你!!!!

PageRank，網頁排名，又稱網頁級別、Google左側排名或佩奇排名。PageRank™是以公司創辦人拉里·佩奇（Larry Page）命名。是一種由搜索引擎根據網頁之間相互的超鏈接計算的網頁排名。它經常和搜索引擎優化有關。 PageRank系統被Google用來體現網頁的相關性和重要性。Google的創始人拉里·佩奇和謝爾蓋·布林1998年在斯坦福大學發明了這項技術。

PageRank 通過網絡浩瀚的超鏈接來往來確定一個頁面的等級。Google 把從 A 頁面到 B 頁面的鏈接解釋為 A 頁面給B頁面投票 Google 根據投票來源（甚至來源的來源，即鏈接到A頁面的頁面）和投票目標的等級來決定新的等級，簡單的說，一個高等級的頁面可以使其他低等級頁面的等級提升。

PageRank讓鏈接來"投票"

一個頁面的「得票數」由所有鏈向它的頁面的重要性決定。到一個頁面的超鏈接相當於對該頁投一票。一個頁面的 PageRank 是由所有鏈向它的頁面（「鏈入頁面」）的重要性經過遞歸算法得到的。一個有很多鏈入的頁面會有很高的等級，相反如果一個頁面沒有任何鏈入頁面，那麼它沒有等級。

2005年初，Google 為網頁鏈接推出一項新屬性 nofollow，令網站管理員和網誌作者可以做出一些 Google 不會計算為投票的鏈接；這些鏈接不算作"投票"。nofollow 的設置可以抵制評論垃圾。

Google 工具條上的 PageRank 從 0 到 10。它似乎是一個對數標度算法。這個算法的細節是未知的。PageRank 是 Google 的商標，PageRank 技術已經申請專利。

PageRank 算法中的點擊算法是由 Jon Kleinberg 提出的。

PageRank算法

簡單的

假設一個由4個頁面組成的小團體：A，B， C 和 D。如果所有頁面都鏈向A，那麼A的PR（PageRank）值將是B，C 及 D的和。

PR(A) = PR(B) + PR(C) + PR(D)

繼續假設B也有鏈接到C，並且D也有鏈接到包括A的3個頁面。一個頁面不能投票2次。所以B給每個頁面半票。以同樣的邏輯，D投出的票只有三分之一算到了A的 PageRank 上。

換句話說，根據鏈處總數平分一個頁面的PR值。

最後，所有這些被換算為一個百分比再乘上一個繫數q。由於下面的算法，沒有頁面的PageRank會是0。所以，Google通過數學系統給了每個頁面一個最小值1 − q。

所以一個頁面的 PageRank 是由其他頁面的PageRank計算得到。Google 不斷的重複計算每個頁面的 PageRank。如果您給每個頁面一個隨機 PageRank 值（非0），那麼經過不斷的重複計算，這些頁面的 PR 值會趨向於正常和穩定。這就是搜索引擎使用它的原因。

完整的

這個方程式引入了隨機瀏覽的概念，即有人上網無聊隨機打開一些頁面，點一些鏈接。一個頁面的PageRank值也影響了它被隨機瀏覽的概率。為了便於理解，這裡假設上網者不斷點網頁上的鏈接，最終到了一個沒有任何鏈出頁面的網頁，這時候上網者會隨機到另外的網頁開始瀏覽。

為了對那些有鏈出的頁面公平，q = 0.15(q的意義見上文)的算法被用到了所有頁面上, 估算頁面可能被上網者放入書籤的概率。

所以，這個等式如下:

p₁,p₂,...,p_N是被研究的頁面，M(p_i)是鏈入p_i頁面的數量，L(p_j)是p_j鏈出頁面的數量，而N是所有頁面的數量。

PageRank值是一個特殊矩陣中的特徵向量。這個特徵向量為

R是等式的答案

如果p_j不鏈向p_i, 而且對每個j都成立時，等於 0

這項技術主要的弊端是，舊的頁面等級會比新頁面高，因為新頁面，即使是非常好的頁面，也不會有很多鏈接，除非他是一個站點的子站點。

這就是 PageRank 需要多項算法結合的原因。PageRank 似乎傾向於維基百科頁面，在條目名稱的搜索結果中總在大多數或者其他所有頁面之前。原因主要是維基百科內相互的鏈接很多，並且有很多站點鏈入。

Google 經常處罰惡意提高 PageRank 的行為。Google 究竟怎樣區分正常的鏈接交換和不正常的鏈接堆積仍然是商業機密。

sunfar

硬邦邦

sunfar 發表在痞客邦留言(0) 人氣(135)

硬邦邦

電腦資訊記事本：記載不了解的電腦軟硬體，找到的科技新知，有趣的，無聊的，通通記上去!!一步一步慢慢挖掘科技好玩的地方，有興趣的朋友，也一起來分享吧

PageRank

PageRank算法

簡單的

完整的

自訂側欄

好康商品

近期文章

文章分類

熱門文章

google FireFox

文章彙整

submitexpress

參觀人氣

部落客

推薦連結

部落客廣告

Blog觀察

PageRank

黑米

哈部落