RE: 多謝樓上二位仁兄的捧場,繼續(xù)ing。。
數(shù)據(jù)挖掘解決了什么問題? 一、直接問題 分類問題 根據(jù)事先定義好的類別,對數(shù)據(jù)進行分類。 例如:某銀行根據(jù)用戶信用記錄,對信用卡、貸款等用戶數(shù)據(jù)進行挖掘,區(qū)分 出信用風(fēng)險分別為高、中、低的三類人群。 類似給你一個客戶的相關(guān)信息,預(yù)測一下他未來一段時間是否會不再消費?信用度 是好/一般/差?是否會使用你的某個商品?將來會成為你的高/中/低價值的客戶? 是否會響應(yīng)你的某個促銷活動?等等 估值問題 把分類的結(jié)果用連續(xù)數(shù)值的方式表示。 例如:某銀行根據(jù)用戶信用記錄,對信用卡、貸款等用戶數(shù)據(jù)進行挖掘,給每 個用戶進行信用評分(0-1之間)。0.7以上的為高風(fēng)險,0.3以下的為低風(fēng)險。 預(yù)測問題 用分類或者估值的結(jié)果,估計將來會發(fā)生的情況。 例如:某銀行根據(jù)用戶信用卡消費記錄,對用戶信用卡消費記錄進行挖掘,預(yù) 測用戶下一年的信用卡消費估值,并提供更好的個性化服務(wù) 二、間接問題 關(guān)聯(lián)問題 判斷兩件事情同時或者順序發(fā)生的可能性。 例如:京東上,客戶買完刻錄光盤后,往往會購買光盤套。 中國鮮花網(wǎng)上,買鮮花的客戶往往可能會買花瓶。 聚類問題 在沒有預(yù)先定義類別的情況下,根據(jù)數(shù)據(jù)的自有特征進行分類。 例如:購買不同類別玩具的用戶,聚類成為不同“亞文化商品”消費的人群 可視化和描述問題 對數(shù)據(jù)挖掘的結(jié)果描述。 例如:某B2C商城用戶中,女性人群消費的增長趨勢高于男性人群的增長趨勢
小結(jié):首先有正確的方法,其次才是正確的算法 數(shù)據(jù)挖掘往往是多種不同方法的算法在不同層次的組合 例:商城要針對老客戶進行促銷,首先要通過聚類區(qū)分客戶群, 其次才是對應(yīng)不同的客戶群采取不同的預(yù)測促銷策略。這就是 聚類和分類的綜合應(yīng)用。 該帖于 2010-4-26 9:06:00 被修改過 |