March 13,2007
I love data
「Data沒什麼了不起,但只要數量一大,就能從裡面看到很多事」
我對數據一直很有興趣。小時候很期待選舉,不是因為選舉帶來的熱鬧氣氛,而是因為隔天報紙上會出現許多的圖表,描述各面向的選舉數據。我每次都會盯著數據那一頁看很久,一個結果一個結果仔細看,找找看數據中有沒有什麼有趣的地方。現在我還是很愛數據,在簡立峰老師還沒到Google任職前,我曾經聽過老師的幾次演講,有一次老師在講他有關Anchor text mining的研究,聽老師講到「Data沒什麼了不起,但只要數量一大,就能從裡面看到很多事」,我聽得只有直點頭的份。但要遇到喜歡的數據是需要緣分的 (Googler除外XD),所以看到中意的數據時我都會把握機會先收再說 。
今天在Google Book Search Blog 看到一篇 Earth viewed from books ,也是一個有趣的數據觀察。裡面統計了當代書籍中描述世界各個地點的次數,然後將次數分佈圖示在世界地圖上。如下圖所示:
這圖應該可以反映各個地方的開化程度與知名程度。幾個小觀察:
- 美國、西歐、日本整片亮晶晶不令人意外,印度和菲律賓也許是因為英美有統治過,對其了解比較深,所以書上提到機會也多。
- 澳洲整體看來好像比非洲還不如
- 台灣還蠻亮的
作者說他藉助於一些其他人幫忙寫好的工具和Google的資料與設施 ,只花了45分鐘就完成了這張圖,Google對資料狂來說真是個天堂啊。
引述該文作者的結語:「Wow, data is fun.」
technorati tags: google, book, data, "informationvisualization
引用URL
http://cgi.blog.roodo.com/trackback/2848719