February 3,2007
生活圖表
事情, 但經過一種計算與呈現, 反而更容易看
到真實, 甚至很多數字本身的存在是沒意義的,
是要水平或垂直的比較才能夠揭露些事實.
*1
當然我曾不只一次寫過, 我的計劃說穿了就是幫
我回答: "你最近過得如何?" 這樣一個簡單的問題,
只是這個問題說小不小, 說大不大.
1. 這個跟誰問的有很大的關係, 無論是親疏遠近,
或者是過去建立在甚麼關係之中, 雖然這個是不
用量化, 但每個質性都有其權重.
2. 時間點也是一個很大的議題, 這個最近是指幾天,
幾週, 還是幾個月到幾年呢? 甚至可以用多少話
來講完, 會跟內容很大的關係.
3. "如何" 通常就會有一個量級的表示, 甚至是個比
較級, 不然至少是一個形容詞的燈號或指標來表
示, 而該如何表示這就是很大的問題.
雖然我知道要寫出一個系統來幫我回答是不可能
的, 但是否有可能寫一個系統來輔助我, 這是有可能
的, 例如從 Blog 可以看到我一個廣泛的呈現, 但到
一對一的個人化還是要自己來.
包含 "部落格觀察", 說穿了就是一個幫我去查
詢我平常會做來衡量我部落格的事情, 本身並沒有超
脫我能做的事, 也是一種行為輔助系統, 甚至這個
"排行榜" 本身就是我會做的事, 只是將之自動化.
甚至我寫到這邊時, 我在想進一步的在 privacy
加強, 也就是必須登入的人才能看到沒有認領或使用
貼紙的人的排行, 所有人都只能看到 PR 值, 且 PR
值到整數就好.
如同當時就只用等級做 10 分位等級的部落個評
量, 所以就是跟 Google 的 PR 沒甚麼兩樣了, 所以
就沒甚麼差了, 畢竟我知道我們去承擔這些人的爭議
是相當累的事.
不然來玩一個遊戲, 就是甚至登入的人必須擁有
的 Blog 到一個等級以上才行, 這樣讓他去看排行與
數字才不會曲解與誤解.
畢竟數字這種東西, 是最好欺騙的, 因為人不可
能去消化過多的數字, 但當數字一簡化, 就會出現很
多問題, 例如從總數來看, 是看不出來是否 80/20
或長尾分配的現像.
必須去切分十分位, 或者是標準差來去表示, 才
能夠揭露這些事情, 甚至分佈這種事情, 可能還是要
畫圖才有意義, 但人也不可能一可氣看上百個圖, 還
是必須簡化到兩三個數字的表.
但反個想法, 有些數字反而過多過細是沒意義的,
反倒是要簡化到一個歷史曲線才是有意義的, 就像我
常說的機器 Loading 50% 不算高, 10% 不算低, 必
須跟之前做比較.
一個是簡化, 一個是延伸, 這兩個看似是很矛盾
的事情, 但經過一種計算與呈現, 反而更容易看到真
實, 甚至很多數字本身的存在是沒意義的, 是要水平
或垂直的比較才能夠揭露.
排行榜是怎樣都是存在的, 甚至應該是賣錢的,
只是我相信在網路中應該要更開放與透明才對, 雖然
有些人反而更擔心的不是這個.
只是我是認為只要是公開可取得的, 而不是透過
甚麼不正常管道或封閉管道取得的資料, 且能夠讓使
用者去選擇開放與隱藏, 基本上比較不會有隱私侵犯,
因為更重要的是那種大家對數字的誤解是更可怕的.
最後還是一個有趣的問題: 當這些資訊都被揭露
或計算之後, 真正的目的是甚麼? 當然就破題的觀點
就是了解自己與了解朋友, 但了解之後呢?
所以結果還是心態的問題, 因為無論是文字, 數
字, 或者是行為等等, 都是在於解讀者與了解者的動
機與目的, 這個是不可能去限制的.
*2
[連結]
1. 數字人生
http://mypaper.pchome.com.tw/news/subdiary/3/2290175/20030219105715/
2. 我的MyZilla生活圖表
http://blog.roodo.com/genehong/archives/1731721.html
3. MRTG(II)
http://www.ithome.com.tw/plog/index.php?op=ViewArticle&articleId=1966&blogId=410
4. 不只是捷運日記
http://blog.yam.com/genehong/article/7337995
[TAG]統計, 資料探勘, 資料呈現
**********************************************
*1
02/02/07 04:38 pm, 已經離開中正紀念堂往淡
水方向了, 準備回台南, 雖然事情還是很多, 但生活
還是要過的.
*2
02/02/07 05:16 pm, 到淡水了.