January 18,2007

從業績預測開始(上)

    [前言]所有的預測都是基於 "天底下無新鮮事", 但
          要找到舊事也不是那麼簡單.


    *1

        我在博客來畫的第一個非系統的圖, 起因是一場
    遊戲, 就是大家當閒來無事時, 為了要證明對博客來
    的了解, 從現在的業績來預測今天結束的業績.

        那些理論上是經理級以上與張天立玩的遊戲, 而
    我只是一個小小的工程師, 當然是沒有地位說甚麼話,
    但我在想這是一個有趣的題目, 就來做做看.

        當然最簡單的方式是, 把現在的業績對應到昨天
    同時間的業績, 很容易的用外插法就出來了, 但一下
    子就發現用昨天的業績曲線是不夠準的.

        因為許多群體行為都是以週為單位的在運作, 所
    以很快的就多做一個上週同星期的業績曲線的外插,
    發現這個曲線明鮮的準確多了.

        而我當時突發起想, 為何不把預測的數值畫成一
    MRTG 呢? 如此可以一目了然這數值的變動與準確性,
    所以花了點時間, 把目前業績當作網路流入, 預測業
    績當作網路流出, 畫出個 MRTG.

        經過幾天, 很明顯的看出來在中午之前, 因為雙
    方的樣本空間較少, 此時線圖還相當發散, 但到下午
    4:00 後, 幾乎是穩定的收斂到晚上結帳業績.

        很有趣的, 本來只是個業績預測曲線, 但後來發
    現只要系統或大環境有個風吹草動, 這曲線就會發生
    較大的誤差.

        大環境的風吹草動包含某某政要去逝, 棒球隊拿
    下冠軍等等的狀況, 但最重要的還是博客來自己本身
    的行銷配套差異, 一有改變, 就會有明鮮的差距.

        系統部份大都是減分的, 也就當系統出問題, 就
    無法達到預期的業績, 所以在五年後的今天, 這個就
    成為檢驗系統穩定度最好的圖表.

        但因為跟上週同期作比較, 這也必須保証那天是
    穩定的, 換句話說, 那天若是系統有出問題, 或者是
    有個大促銷開始, 或者是大促銷的結束, 這個圖型就
    必然失去意義.

        只是天底下無新鮮事, 雖然拿上週同期的意義不
    高, 可是至少有一天應該跟今天差不多吧? 所以就有
    了終極版的銷售預測想法出現.

        也就是說, 把今天既有的業績拿來跟過去所有業
    績作比較, 可以找到最接近相同曲線的日子, 而拿那
    幾天來作預測會比拿昨天或上週同期更準確才對.

        可是一下子就面臨到三個問題, 如何才能找到最
    接近的曲線的意思, 另一個是算出最佳解那幾天所要
    面臨的效率問題, 以及是算出來那幾天最接近的結果
    本身事實上就是很發散的.

        當然前兩個問題對我不是太困難, 問題是第三個
    就讓我傷透腦筋, 因為只取一天樣本空間是不夠或有
    很明鮮的不穩定性, 但取複數個時, 又有一個問題是
    到最後用平均或甚麼方法嗎?

    *2

    [連結]

    1. MRTG(I)
http://www.ithome.com.tw/plog/index.php?op=ViewArticle&articleId=1965&blogId=410

    2. MRTG(II)
http://mypaper.pchome.com.tw/news/subdiary/3/1669083/20021030132237/

    [TAG]MRTG, 預測, OLAP, DataMining

    **********************************************

    *1
        01/18/07 09:35 am, 現在在淡水捷運站, 看樣
    子是蠻早出門的一天, 事實上是可以更早些.

    *2
        01/18/07 03:23 pm, 在博客來, 本想說先存檔,
    但發現才寫不到一半, 就拆成上下好了.


Posted by genehong at 樂多Roodo! │15:33 │回應(0)引用(0)資料探勘
樂多分類:網路/3C 共同主題:電腦知識區 工具:編輯本文
Ads by Roodo! 

引用URL

http://cgi.blog.roodo.com/trackback/2655245