資料探勘是一種資料分析技術,
儘管OLAP提供了資料多維度分析和決策輔助的功能,
但我們需要在現存的大量資料中進行更深一層的分析,
將這些資料轉換成有用的資訊和知識,
資料探勘的出現就是為了滿足這樣的需求,
是近幾年來相當熱門的一個研究領域。
資料探勘已有一些成熟的技術並運用在各種不同的應用上,
例如銷售管理、生產控制、市場行銷分析等,
以下介紹一些重要的資料探勘技術:
1.關聯規則(association rule)
從大量資料中發現某些資料的關聯性,
一個典型的例子是購物籃分析(Market Basket analysis),
透過資料分析發現商品被顧客同時購買的關聯性,
這些關聯性的發現可提供廠商擬定銷售策略及調整商品擺放位置,
刺激顧客購買而提高營收。
2.分類(classification)
利用已知資料及其分類屬性值,
來建立資料分類的模型,
則此分類模型可用來預測未知的新資料是屬於哪一種分類。
一個例子是信用額度核准,
利用現有顧客的基本資料和信用狀況建立顧客信用狀況的分類模型,
將新顧客代入此分類模型就可以預測顧客未來的信用狀況而決定核准多少信用額度。
3.群集分析(cluster analysis)
不同於分類依照事先定義好的分類屬性將資料分類,
而是將性質相似的資料進行分群,
同一群的資料性質相似,
不同群的資料則性質差異大。
一個應用的例子是利用客戶購買資料將客戶進行分群,
藉此發掘出同一群潛在的顧客,
根據該群的偏好購物商品對這批潛在的顧客進行推銷。
4.序列模式(sequence pattern)
序列模式與關聯規則使用的推導方式相似,
不同的是關聯規則在於找出商品之間的關聯性,
序列模式主要是以時間為考慮的因素,
分析不同項目發生的先後順序關係。
例如透過顧客購買商品的序列模式,
可以了解顧客購買商品的行為,
針對價值高的顧客進一步做個人化的行銷,
提高顧客的忠誠度。
補充資料:
Data Mining 探索(上)
Data Mining 探索(下)
資料探勘與DMX