2009年8月3日 星期一

淺談網路世界的Power Law現象〈一〉── 什麼是Power Law

Posted by Mr. Friday

這次系列的主題是網路世界裡的Power Law。這個主題其實很不好寫,因為這個數學模型到處在生活中都看得到,而且在不同的場合、不同的環境下,人們往往對這個現象有著不同的意義詮釋。因此這 個題目可以說是包羅萬象,即使今天這個主題只把範圍限制在網路世界裡,能夠寫的內容還是相當的多。

何謂Power Law?

Power Law好像沒有什麼好記的中文名字,「冪次現象」是我所能查到的最廣用的中文翻譯,但大多數人聽到這四個字依舊是一頭霧水。不過也許換個角度,我把它改叫「長尾理論裡的那條曲線」,或許大部分的人就有印象了。這並不是在亂扯,最早開始談論長尾理論的文章〈Wired - The Long Tail〉裡,就明確的說到Power Law這個字眼。不過在解讀它的商業意義之前,還是先來了解一下這是什麼東西吧。

數學模型:

根據Wikipedia 上的說明,Power Law其實是指下面這個函式:

其中o(xk)是代表big O為xk的任何x function,你就姑且忽略當作不存在吧。

為什麼叫Power Law,因為Power指的就是次方的意思。這個函式裡面,即使x的值只增加一點點,對f(x)的影響可是以次方級數影響著。例如今天若a=1,k=2,我們得到一個f(x)=x2,不難看出x如果變成2倍,對f(x)的影響可是2的平方:4倍。換句話說,今天x如果變成c倍,對f(x)的影響則是c的k次方倍。

好吧相信很多人離開了學校就不想再看到數學式子,所以我們直接看圖形吧。如果今天k<0,就可以輕易的得到下面圖形:

一圖抵得千言萬語。我們不是常聽到什麼長尾理論、80/20法則嗎?背後的數學起源都跟這個Power Law有關。

Zipf與Pareto分配、80/20法則:

嚴格講起來,Power Law還有機率分配上還有好幾種變形,當中最有名的就是Zipf與Pareto Distribution。在這邊容我偷懶一下,引用一下對岸學生寫的幂律分布研究简史

對”長尾”分佈研究做出重要貢獻的是Zipf和Pareto,雖然他們並不是這種分佈的最早發現者。

1932年,哈佛大學的語言學專家Zipf在研究英文單詞出現的頻率時,發現如果把單詞出現的頻率按由大到小的順序排列,則每個單詞出現的頻率與它 的名次的常數次冪存在簡單的反比關係:P(r)~r^(-α),這種分佈就稱為Zipf定律,它表明在英語單詞中,只有極少數的詞被經常使用,而絕大多數 詞很 少被使用。實際上,包括漢語在內的許多國家的語言都有這種特點。物理世界在相當程度上是具有惰性的,動態過程總能找到能量消耗最少的途徑,人類的語言經過 千萬年的演化,最終也具有了這種特性,詞頻的差異有助於使用較少的辭彙表達盡可能多的語義,符合”最小努力原則”。分形幾何學的創始人 Mandelbrot對Zipf定律進行了修訂,增加了幾個參數,使其更符合實際的情形。

19世紀的義大利經濟學家Pareto研究了個人收入的統計分佈,發現少數人的收入要遠多於大多數人的收入,提出了著名的80/20法則,即20% 的人口佔據了80%的社會財富。 個人收入X不小於某個特定值x的概率與x的常數次冪亦存在簡單的反比關係:P[X≥k]~x^(-k),上式即為Pareto定律。

當中的Pareto Distribution是直接從個人收入統計找出來的分配,根據Wikipedia列舉的例子,還有好些現象也呈現了Pareto Distribution:

  • 人類居住地的分佈 ( 城市與鄉鎮的數目對比,城市數目極少,而鄉鎮很多 )
  • 網路TCP封包的檔案大小 ( 多數封包是小檔案,僅有少數為大檔案 )
  • 投資股市的個體戶獲益 ( 賺大錢的僅為少數人… )
  • 砂粒的體積
  • 流星的體積
  • 森林火災的影響面積

若真正要算生活中可見的Power Law現象,可絕對遠不止這些。不過也由於這個分布的出現範圍太廣,也因此各行各業的人們看到了上面的圖形,都可能有著不同的解讀。以下就讓我們直接找一個現象,直接來看人們是怎麼是解讀它的吧。

Web世界的Power Law現象解讀:長尾理論

在網路世界裡面存在著很多充滿著Power Law的有趣的現象,而當中最有名的解讀,當推「長尾理論」。長尾一詞在2004年Wired雜誌編輯Chris Anderson在雜誌上發表同名文章:The Long Tail 之後,一舉成為所有網路業人士琅琅上口的名詞。長尾理論這篇文章可以說非常漂亮地解釋了網際網路上的商業模式、以及這個商業模式的利基點到底和以往實體店面銷售有何不同。Chris Anderson隨後也出了一本書專門講述這個現象:The Long Tail: Why the Future of Business Is Selling Less of More,繁體中文版由天下雜誌代理。

簡單的說,假如把人對於同一類商品的需求羅列出來,例如書籍,我們將能發現人們多半只對當中的少數暢銷商品有興趣,絕大多數的商品只有很少的人有意 願購買。 這裡我們可以就用Power Law來解釋這個現象:80%的人只願意買當中20%的商品,而其餘80%的商品則只有20%的人想購買。以傳統書店的做法,由於商店內陳列空間有限,為 了追求最大的獲益,於是他們註定得捨棄那80%不受人注意的商品,只陳列那20%最暢銷的商品,對書店來說也只損失了那20%的客戶。在網際網路出現之 前,一直都是如此。

然而在網際網路興起之後,出現了Amazon。Amazon的優勢十分明顯:它幾乎沒有上架費,所以不必捨棄那80% 的書籍,可以把所有的商品通通搬上Amazon的「店面」。結果呢?Amazon成功了。人們發現Amazon的藏書可真是前所未有的豐富,越是翻閱越是 驚嘆:怎麼這本書也有!那本書也有!之前找好久都找不到的書、Amazon上都有!當然了,Amazon這麼作可不是單純的作功德:藉由豐富的藏書量、發 掘過去被實體書店所放棄的那20%客群才是它背後的真正目的。如今,藉由發掘那80%長期被實體書店忽略的藏書與低廉的價格,Amazon建立了一大批長 期的忠實顧客,如果把它設計良好的網站介面、書迷推薦系統、良好的商譽與服務品質也加進去,Amazon儼然已經成為網路業的傳奇。

在Chris Anderson的文章裡,寫了這麼一段話,解釋了網路業與傳統實體商店的最大差別:

Hit-driven economics is a creation of an age without enough room to carry everything for everybody. Not enough shelf space for all the CDs, DVDs, and games produced. Not enough screens to show all the available movies. Not enough channels to broadcast all the TV programs, not enough radio waves to play all the music created, and not enough hours in the day to squeeze everything out through either of those sets of slots.

This is the world of scarcity. Now, with online distribution and retail, we are entering a world of abundance. And the differences are profound.

結語

Power Law的法則在生活中到處都看得到,而也由於它能夠解釋網路商業模式的成功之處,因此它對網路人士來說可算別具意義。不過除了長尾理論之外,還有許多現象可以用這條法則來作有趣的解讀,就請各位繼續期待之後的文章吧。

沒有留言: