RE: 多謝樓上二位仁兄的捧場,繼續ing。。
數據挖掘解決了什么問題? 一、直接問題 分類問題 根據事先定義好的類別,對數據進行分類。 例如:某銀行根據用戶信用記錄,對信用卡、貸款等用戶數據進行挖掘,區分 出信用風險分別為高、中、低的三類人群。 類似給你一個客戶的相關信息,預測一下他未來一段時間是否會不再消費?信用度 是好/一般/差?是否會使用你的某個商品?將來會成為你的高/中/低價值的客戶? 是否會響應你的某個促銷活動?等等 估值問題 把分類的結果用連續數值的方式表示。 例如:某銀行根據用戶信用記錄,對信用卡、貸款等用戶數據進行挖掘,給每 個用戶進行信用評分(0-1之間)。0.7以上的為高風險,0.3以下的為低風險。 預測問題 用分類或者估值的結果,估計將來會發生的情況。 例如:某銀行根據用戶信用卡消費記錄,對用戶信用卡消費記錄進行挖掘,預 測用戶下一年的信用卡消費估值,并提供更好的個性化服務 二、間接問題 關聯問題 判斷兩件事情同時或者順序發生的可能性。 例如:京東上,客戶買完刻錄光盤后,往往會購買光盤套。 中國鮮花網上,買鮮花的客戶往往可能會買花瓶。 聚類問題 在沒有預先定義類別的情況下,根據數據的自有特征進行分類。 例如:購買不同類別玩具的用戶,聚類成為不同“亞文化商品”消費的人群 可視化和描述問題 對數據挖掘的結果描述。 例如:某B2C商城用戶中,女性人群消費的增長趨勢高于男性人群的增長趨勢
小結:首先有正確的方法,其次才是正確的算法 數據挖掘往往是多種不同方法的算法在不同層次的組合 例:商城要針對老客戶進行促銷,首先要通過聚類區分客戶群, 其次才是對應不同的客戶群采取不同的預測促銷策略。這就是 聚類和分類的綜合應用。 該帖于 2010-4-26 9:06:00 被修改過 |