February 15,2007
資料探勘所須的背景
科目, 而能夠充份應考而有機會或把握考上的
水準, 或者是唸過這個系到大三的所有科目,
以及這個研究所對這門專業的科目.
*1
基本上一般概念的統計, 與資料探勘往往畫上等
號, 甚至是個主從式的集合, 也就是交集很大, 但事
實上這是很危險的.
我有說過, 要能夠真正了解 Data Mining 的人,
最好是有統計的背景, 不然就是對數值方法或數值分
析較熟的人.
甚至我是期望念過統計系所, 或者是數學相關系
所的的人, 因為這有最好的語言與符號基礎, 去了解
與操作甚麼是資料探勘.
但若是統計出身的人, 雖然比別人更好進入這環,
只是有一個很可怕的刻版印像要突破, 因為統計與資
料探勘有很不同的前提.
1. 統計往往是處理從母體做抽樣的, 但資料探勘的
資料就是全部的母體.
2. 除了像時間序列這些學門外, 大部份都是處理已
發生的一段時間資料, 但資料探勘處理的是所有
到現在剛剛的全部資料.
只是除了這兩點以外, 我認為統計系的人比任何
人有更好的開始了解資料探勘, 而此時若能在加學數
值方法與演算法, 那就很不錯的.
當然我在很久以前寫過, 資料探勘是個綜合學科,
最好是數學/統計, 程式設計, 系統管理與分析調校,
以及商業行銷語言這幾項背景的人, 來玩資料探勘是
最好不過的.
我有時還會加註最好對 "社會", "經濟", 或者
是 "會計", "物理" 等等科系, 有附修的水準, 應該
是說不能偏廢這些基礎學科.
雖然這邊我又可以拿出我少數會拿來引用的話:
"只是一個經濟學家的經濟學家, 絕不是一個好的經
濟學家", 更足以拿來做資料探勘的註解.
只是甚麼是 "背景" 呢? 我通常是用最簡單的兩
個條件:
1. 念過這個系所要考的相關科目, 而能夠充份應考
而有機會或把握考上的水準.
2. 唸過這個系到大三的所有科目, 以及這個研究所
對這門專業的科目.
當然若要做程度檢核的話, 最簡單的就是去考考
看能不能考的上, 不然報名費太貴的話, 就拿考古題
來寫吧.
若是每一科都能拿到 60 分以上, 就差不多有一
定的基礎, 但若能夠 80 分的把握, 那就可以保証考
得上, 只是考上那一間了.
而附修的話, 大概是可以到轉學考的程度就好了
吧, 不用有太高的要求, 這有點像是甚麼部定四選一
那樣, 只是不能用打混的心態去學習.
雖然我知道寫下去有人會懷疑有多少人做得到,
但我相信不難, 因為我知道有不少人做的比我好, 因
為我做到的只是個基礎的開始.
有時觀看那些天才挺讓人討厭的, 因為自己只是
庸才, 只能做庸才的事, 但自己學習能力又是在水準
以上, 且工作的關係又無法停止學習, 若不是把這個
當作興趣的話, 一定會很沮喪.
相較那些人而言, 自己可以說是以管窺天而已,
就像是我在一次又一次的成長中, 發現自己以前的不
足, 那怎可能停下來呢?
我在之前寫下幾篇 "當網管的必備條件" 系列文
章, 我也是在接近 30 歲時才逐漸完成, 若我在 20
歲時看到這篇文章, 或許我可以更早的達到也說不定.
我或許也來該整理一篇我上述說的科系許科目,
我想我到現在應該還是有不足的地方, 甚至我常說:
"每五年該唸一次最新版的 Computer Structure" 那
樣吧.
*2
[連結]
1. 資料採礦概述
http://www.ithome.com.tw/plog/index.php?op=ViewArticle&articleId=3198&blogId=410
2. 01/28/04, 資料採礦前言(一)
http://mypaper.pchome.com.tw/news/subdiary/3/1235110679/20040128230346/
3. 有關 Data Mining 的兩三事 (1)
http://www.ithome.com.tw/plog/index.php?op=ViewArticle&articleId=5313&blogId=410
[TAG]DataMining, 資料探勘, 專業
***********************************************
*1
02/14/07 07:16 pm, 現在過中正紀念堂站, 準備
回淡水, 又結束白天的生活.
*2
02/14/07 07:53 pm, 到站了.