商業(yè)智能在CRM中的應(yīng)用
本文以企業(yè)管理信息系統(tǒng)為基礎(chǔ),從探討CRM本身的特點(diǎn)出發(fā),結(jié)合數(shù)據(jù)挖掘的原理、SQLSERVER2005的BI平臺(tái)中的分析服務(wù)和報(bào)表服務(wù),進(jìn)行一個(gè)實(shí)例的分析。對(duì)CRM系統(tǒng)的一些關(guān)鍵性領(lǐng)域存在的問題,提出期望的解決方法。
一、背景思考
(一)商業(yè)智能概述
商業(yè)智能(Business Intelligence,簡稱BI)的概念最早是Gartner Group的Howard Dresner于1996年提出來的。商業(yè)智能概念涵蓋了查詢報(bào)表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等所有以幫助企業(yè)決策為目的的技術(shù)及其應(yīng)用。
商業(yè)智能的關(guān)鍵是從實(shí)際的營運(yùn)數(shù)據(jù)中,進(jìn)行數(shù)據(jù)預(yù)處理,然后抽取(Extraction)、轉(zhuǎn)換(Transformation)和裝載(Load),即ETL過程,利用各種技術(shù)或工具,最終得到一個(gè)企業(yè)級(jí)的決策信息。
對(duì)于零售行業(yè)的決策信息獲得,通過一個(gè)比較形象的,更貼近我們零售企業(yè)日常應(yīng)用的過程來表現(xiàn),即數(shù)據(jù)庫的知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,KDD )。而在科研中稱的“知識(shí)發(fā)現(xiàn)”,在工程領(lǐng)域也常被稱為“數(shù)據(jù)挖掘”。
下圖展示了知識(shí)發(fā)現(xiàn)的過程:
(二)CRM概述
在布賴恩•伍爾夫的基礎(chǔ)性研究《Measured marketing》中描述到,統(tǒng)計(jì)中發(fā)現(xiàn)消費(fèi)額在前30%的顧客貢獻(xiàn)的消費(fèi)額是75%,而消費(fèi)額后30%的顧客貢獻(xiàn)的消費(fèi)額僅僅是3%。這足以說明顧客在購買能力上的不均等性。以顧客為中心的零售經(jīng)濟(jì)學(xué)的宗旨是讓顧客滿意,將企業(yè)的有限的資源投入到最有價(jià)值的顧客身上,為自己的忠誠顧客提升更有價(jià)值的服務(wù)。這和零售產(chǎn)出管理是異曲同工的。
而對(duì)于一個(gè)客戶關(guān)系管理系統(tǒng),其主旨也在于幫助企業(yè)通過技術(shù)手段,分析客戶的行為和他們的價(jià)值,以提供更優(yōu)的消費(fèi)服務(wù)及客戶體驗(yàn)。
通常,CRM系統(tǒng)分為分析型、運(yùn)營型、協(xié)作型。對(duì)于一個(gè)零售企業(yè)的客戶關(guān)系管理系統(tǒng),通常是以各種介質(zhì)的卡作為載體去綁定顧客的身份,從而貼近顧客,服務(wù)顧客。所以對(duì)于一個(gè)零售企業(yè)的客戶關(guān)系管理必然會(huì)涉及到卡管理,同時(shí)涵蓋客戶分析和溝通等。
通常對(duì)于數(shù)據(jù)分析的需求,可以分為:
1、客戶概況分析:客戶的層次、風(fēng)險(xiǎn)、愛好、習(xí)慣等;
2、客戶忠誠度分析:基于類別管理,考查客戶類別轉(zhuǎn)移和變節(jié),及考查經(jīng)濟(jì)忠誠和關(guān)系忠誠;
3、客戶利潤分析:不同客戶所消費(fèi)的產(chǎn)品的邊緣利潤、總利潤額、凈利潤等;
4、客戶性能分析:不同客戶所消費(fèi)的產(chǎn)品按種類、渠道、銷售地點(diǎn)等指標(biāo)劃分的銷售額;
5、客戶未來分析:尋找客戶數(shù)量、類別等情況的未來發(fā)展趨勢,以爭取客戶;
6、客戶產(chǎn)品分析:主要針對(duì)商品的關(guān)聯(lián)分析,及涉及的供應(yīng)鏈優(yōu)化;
7、客戶促銷分析:包括郵報(bào)或降價(jià)等促銷活動(dòng)的管理。
二、應(yīng)用實(shí)例
(一)顧客類別管理
本實(shí)例的目的是創(chuàng)建一個(gè)簡單的顧客分類,在顧客分類的基礎(chǔ)上,進(jìn)行相應(yīng)的商品品類購買的分析。
基于顧客類別管理的理論,不可能在分析時(shí)直接針對(duì)單一顧客進(jìn)行分析,肯定是對(duì)同一類別的顧客,進(jìn)行相應(yīng)的消費(fèi)行為習(xí)慣分析等。這就如同商品要進(jìn)行品類管理的道理一樣。當(dāng)只有進(jìn)行顧客的類別管理時(shí),才能去考查類別人數(shù)轉(zhuǎn)移量,這是會(huì)員管理成效的一個(gè)重要指標(biāo)。也只有這樣,才能對(duì)變節(jié)率等指標(biāo)進(jìn)行
考查。
我們通常進(jìn)行的顧客分類,都是利用客單量或購物頻次劃一根線,來界定分類的象限。而真正的顧客聚類,通常考慮了客單、頻次或者收入等等綜合因素而實(shí)現(xiàn)。通過簡單的劃線式分類,無法達(dá)到“人以群分”的效果。
(二)聚類分析
聚類算法有能力發(fā)現(xiàn)用來對(duì)數(shù)據(jù)進(jìn)行分組的隱性變量,因此對(duì)于零售行業(yè)來說,聚類算法是一種非常流行的數(shù)據(jù)挖掘技術(shù)。
對(duì)于聚類算法來說,常用的有兩種:K-平均和K-中心點(diǎn)。
在SQLSERVER2005 BI Development Studio中的聚類算法也有兩種,K-means算法和EM算法,這兩種都是屬于K-平均算法的。
K-means算法是以距離值的平均值對(duì)聚類成員進(jìn)行分配,每個(gè)對(duì)象是在一個(gè)聚類中,聚類和聚類之間互不重疊, 通常被認(rèn)為是硬聚類。而EM算法試用概率進(jìn)行度量,一個(gè)點(diǎn)可能屬于多個(gè)聚類,每個(gè)聚類有不同的概率,聚類之間是可以重疊的,通常被稱為軟聚類。對(duì)于離散屬性的聚類是適合使用EM算法的。
Microsoft的聚類算法有一個(gè)可收縮原理,對(duì)于一個(gè)可收縮的框架,當(dāng)進(jìn)行重復(fù)訓(xùn)練時(shí),對(duì)于不會(huì)在聚類之間移動(dòng)的數(shù)據(jù),都把他們壓縮,不加載到內(nèi)存,這樣就壓縮了內(nèi)存空間。
SLQ Server Analysis Services有兩個(gè)主要的數(shù)據(jù)挖掘?qū)ο螅和诰蚪Y(jié)構(gòu)和挖掘模型。挖掘結(jié)構(gòu)用來定義挖掘問題的對(duì)象,而挖掘模型是挖掘算法對(duì)挖掘結(jié)構(gòu)的具體應(yīng)用。
本節(jié)中下面的例子,是在SQL Server Analysis Services服務(wù)的平臺(tái)上,新建的一個(gè)analysis services項(xiàng)目, 應(yīng)用可收縮的k-means聚類算法模型,以某大型超市近半年的會(huì)員消費(fèi)數(shù)據(jù)基礎(chǔ),只通過客單量和頻次兩個(gè)維度,對(duì)會(huì)員進(jìn)行簡單分類。總共分成了4類會(huì)員。在后面報(bào)表應(yīng)用時(shí),將簡單的以A、B、C、D來標(biāo)識(shí)。首先如下圖顯示:
需值得注意的是,在進(jìn)行數(shù)據(jù)預(yù)處理的時(shí)候,須先進(jìn)行數(shù)據(jù)的清洗。將一些垃圾數(shù)據(jù)清除,將需要的數(shù)據(jù)進(jìn)行加工。
對(duì)于SLQ Server Analysis Services的挖掘結(jié)果的發(fā)布,可以直接通過DMX語言進(jìn)行查詢,或者通過SQLSERVER2005 BI Development Studio來創(chuàng)建報(bào)表模型來展示。報(bào)表模型的使用在下一節(jié)中敘述。這里先說明下DMX語言的使用。
數(shù)據(jù)挖掘擴(kuò)展插件 (DMX) 是一種語言,在 Microsoft SQL Server 2005 Analysis Services (SSAS) 中可以使用該語言創(chuàng)建和處理數(shù)據(jù)挖掘模型。可以使用 DMX 創(chuàng)建新數(shù)據(jù)挖掘模型的結(jié)構(gòu)、為這些模型定型并對(duì)其進(jìn)行瀏覽、管理和預(yù)測。DMX 由數(shù)據(jù)定義語言 (DDL) 語句、數(shù)據(jù)操作語言 (DML) 語句以及函數(shù)和運(yùn)算符構(gòu)成。譬如在上例中如何找到哪些是“B類會(huì)員”的:
SELECT t.cardcode From [Guestsort] PREDICTION JOIN OPENQUERY([Hd31],
'SELECT [cardcode],[pjkdl],[pjkdpc] FROM [dbo].[guestsort] ') AS t
ON [Guestsort].[Pjkdl] = t.[pjkdl] AND [Guestsort].[Pjkdpc] = t.[pjkdpc]
where Cluster() = 'B類會(huì)員'
當(dāng)然如果不想這部分會(huì)員的分類叫“B類會(huì)員”,而改稱為“白銀會(huì)員”或其他稱呼,那么也是可以通過DMX語言來修改挖掘模型的內(nèi)容得到。
(三)報(bào)表發(fā)布
上一節(jié)提到了發(fā)布數(shù)據(jù)可以通過Reporting Services來展示。Reporting Services提供了一個(gè)創(chuàng)建定制報(bào)表的機(jī)制,這個(gè)報(bào)表通常包含文本和圖形,可以通過HTML、Email、打印形式和Microsoft Office文檔發(fā)布。基于Web的報(bào)表可以是交互式的,通過增加報(bào)表參數(shù)實(shí)現(xiàn)交互目的。
本節(jié)中下面的例子,是基于顧客類別管理的基礎(chǔ)上,對(duì)A、B、C、D不同類別的顧客所關(guān)心、購買的商品品類進(jìn)行的統(tǒng)計(jì)分析。如果將這個(gè)過程進(jìn)一步細(xì)分的話,那就是針對(duì)商品級(jí)別的關(guān)聯(lián)規(guī)則的應(yīng)用,這個(gè)在這里不進(jìn)行討論。這里只是通過商品品類和會(huì)員類別的矩陣式展示,較簡單地體現(xiàn)Reporting Services的功能。
同樣在SQLSERVER2005 BI Development Studio可以去創(chuàng)建一個(gè)Reporting Services項(xiàng)目。數(shù)據(jù)源可以是關(guān)系數(shù)據(jù)庫,也可以是Analysis Services等。具體的過程不描述了,從數(shù)據(jù)源中最終的報(bào)表文本或圖形等,進(jìn)行生成、部署,最終可以通過web的方式進(jìn)行瀏覽。 下圖示意了一個(gè)簡單數(shù)據(jù)的發(fā)布:
通過web展示的矩陣格式,行代表商品類別,列代表會(huì)員類別,以顯示不同類別會(huì)員對(duì)不同品類商品的購買情況。
同時(shí)上圖也示意了一個(gè)交互的過程,可以通過用戶指定的商品類別來查看感興趣的數(shù)據(jù)。比如查看中類3000的商品被A、B、C、D四類會(huì)員的購買頻次及品類金額情況。當(dāng)然也可以增加其他的查詢條件。
對(duì)感興趣的類別支持樹形結(jié)構(gòu)的自由展開,下鉆到小類,子類。如上圖的30000小類和30001小類就展開明細(xì)到各自的子類中。
對(duì)于報(bào)表的結(jié)果可以導(dǎo)出到XML,HTML,PDF,EXCEL等等文件中。
報(bào)表平臺(tái)支持同時(shí)也支持對(duì)各種角色的權(quán)限管理及日常的訂閱服務(wù)等。
三、應(yīng)用前景
從目前的實(shí)際應(yīng)用來看,聚類分析作為數(shù)據(jù)挖掘的一種算法模型,還有很多需要值得去調(diào)整的地方,譬如:如何數(shù)據(jù)預(yù)處理,如何剔除大型促銷等,造成的數(shù)據(jù)異動(dòng)……
而對(duì)于CRM本身的7大分析需求,也需要更多地挖掘模型進(jìn)行實(shí)踐。比如考查顧客類別轉(zhuǎn)移時(shí),可以使用序列聚類算法。產(chǎn)品分析時(shí),可以使用關(guān)聯(lián)規(guī)則。而對(duì)于同一種業(yè)務(wù)場景,應(yīng)用不同算法也將得到不同的結(jié)果。因此可以通過挖掘準(zhǔn)確性圖表,對(duì)挖掘模型本身進(jìn)行不斷的修正。
可以預(yù)期在未來的應(yīng)用過程中,結(jié)合商業(yè)智能理論的應(yīng)用,通過顧客關(guān)系管理,將為顧客帶來更美好的消費(fèi)體驗(yàn),給零售商帶來更多的銷售提升。