相關(guān)性分析
我們希望一個項目內(nèi)的客群是豐富的,而且店鋪之前是可以互相影響的,但如何判斷這個標(biāo)準(zhǔn)在以往的手段中是無法做到的。為此我們引入相關(guān)性分析作為分析手段。
相關(guān)性分析可以在眾多數(shù)據(jù)中找到兩個不同品牌、樓層的統(tǒng)一性,從而確定兩者是否存在強(qiáng)相關(guān)。舉例來說,可以分析兩個位置不相關(guān)、品類不相關(guān)的品牌,在銷售周期區(qū)間是否有同樣的銷售波動曲線。
如圖中,在規(guī)定時段內(nèi),某商場全部品牌和其余每一個品牌的相關(guān)性。分別展示了正向強(qiáng)相關(guān)的兩個品牌和負(fù)向相關(guān)的品牌。在單位時間內(nèi),正相關(guān)品牌具備強(qiáng)烈的趨同銷售曲線趨勢,這可以判定該品牌組合即使不在同一樓層和品類,仍可能享有同一客群。
用輪詢方式計算了規(guī)定時段內(nèi),某商場全部品牌和其余每一個品牌的相關(guān)性。分別展示了正向強(qiáng)相關(guān)的兩個品牌和負(fù)向相關(guān)的品牌。在單位時間內(nèi),正相關(guān)品牌具備強(qiáng)烈的趨同銷售曲線趨勢,這可以判定該品牌組合即使不在同一樓層和品類,仍可能享有同一客群。
而存在負(fù)相關(guān)的品牌則說明該品牌組合可能存在完全不同的客群,根據(jù)這個算法,可以計算出某一品類與另一品類之間的相關(guān)性和相互作用。
從上圖可以看出,餐飲則與其他業(yè)態(tài)關(guān)聯(lián)性不強(qiáng),這可以判斷餐飲客人的消費(fèi)習(xí)慣并不和其他品牌相關(guān);另一方面,配套業(yè)態(tài)品牌內(nèi)循環(huán)非常強(qiáng)烈,說明該品類客群內(nèi)部消化情況很重,同時對于其他品類也有貢獻(xiàn);最后零售業(yè)內(nèi)部關(guān)聯(lián)數(shù)量為0,則說明這個品類的客群有可能是非常不同的。綜上均需要進(jìn)一步分析,以便于得到更完整的結(jié)論。
品牌相關(guān)性分析算法相對簡單,不用過多的數(shù)學(xué)計算,對于客群、店鋪銷售數(shù)據(jù)不完整的情況下,分析客群是非常有效的。但必須要確定數(shù)據(jù)的真實(shí)性和可靠性,且數(shù)據(jù)清洗過程必須嚴(yán)密,否則數(shù)據(jù)不能得到有效結(jié)果。最后相關(guān)性閥值一定要有所取舍,否則會得到一張非常繁雜的報表。
根據(jù)以上計算,配合每月分析,可以得到各品類客群的流動性分析,判斷企劃引流是否奏效。
時間序列分析
當(dāng)判斷一個品牌是否具備強(qiáng)勁交易能力,或者判斷生命周期時,應(yīng)該對其進(jìn)行時間序列分析。時間序列分析是指將原來的銷售分解為四部分來看——趨勢、周期、時期和不穩(wěn)定因素,然后綜合這些因素,提出銷售預(yù)測。強(qiáng)調(diào)的是通過對一個區(qū)域進(jìn)行一定時間段內(nèi)的連續(xù)遙感觀測,提取圖像有關(guān)特征,并分析其變化過程與發(fā)展規(guī)模。
通過時間序列分析,可以尋找到數(shù)據(jù)的長期趨勢變化、季節(jié)性周期變化、循環(huán)變化、隨機(jī)性變化。一般在這個領(lǐng)域使用的模型有AR 、 MA、 ARMA等。
計算的過程,除了需要計算自相關(guān)性和偏自相關(guān)性,還需要在計算結(jié)果后以AIC BIC進(jìn)行驗證,同時其中數(shù)學(xué)期望的指定非常重要,它會影響算法的準(zhǔn)確是否偏差過大。
某個品牌的銷售能力可以通過去除白噪聲的趨勢進(jìn)行預(yù)判,這是時間序列分析的最大益處。在沒有過多參考參數(shù)情況下,數(shù)據(jù)的同方差性、自相關(guān)性對于判斷自身銷售趨勢有著重要的影響。
如一個品牌的銷售,我們可以用移動平均模型進(jìn)行預(yù)測:
但需要注意,時間序列模型無法判斷相對于樣本較長期的數(shù)據(jù)預(yù)測,根據(jù)以往經(jīng)驗,不得超過3倍q值或k值,否則會導(dǎo)致預(yù)測數(shù)據(jù)平穩(wěn)化,從而失去算法預(yù)測意義。且置信區(qū)間會隨著預(yù)測周期的延長而變?yōu)槔葼?,預(yù)測方差檢驗會越來越大,也就失去了判斷的標(biāo)準(zhǔn)。實(shí)際經(jīng)營中,交易能力的判斷也許會影響商業(yè)調(diào)改、經(jīng)營預(yù)警等等經(jīng)營環(huán)節(jié)。
上面介紹了多維度和單維度的數(shù)據(jù)如何分析,但當(dāng)數(shù)據(jù)維度不足時,如何進(jìn)行分類和劃分,以便于達(dá)到分析目的,這便要引用支持向量機(jī)作為分析手段
支持向量機(jī)
支持向量機(jī)最直觀的解釋是可以將低緯度數(shù)據(jù)映射為高維度,比如在只有2~3行會員參數(shù)的情況下(如只有年齡、性別、消費(fèi)金額),可能無法在已有算法內(nèi)進(jìn)行準(zhǔn)確分隔,支持向量機(jī)提供的理論可以將低緯度數(shù)據(jù)映射為多維度數(shù)據(jù),這樣即可在映射后的數(shù)據(jù)中添加超平面,用來分隔數(shù)據(jù),也就是可以基于支持向量機(jī)的方法進(jìn)行有效的數(shù)據(jù)回歸和分類。這種算法可以更準(zhǔn)確的分析樣本屬性,更加準(zhǔn)確的分析對方價值。
依照此理論,我對某商業(yè)品牌的按月品牌銷售和國家統(tǒng)計局?jǐn)?shù)據(jù)人均存款指數(shù)和消費(fèi)者價格指數(shù)進(jìn)行輔助,進(jìn)行了SVM回歸,使用高斯核函數(shù),得到預(yù)測值與實(shí)際值殘差極小的結(jié)果。
支持向量機(jī)可以進(jìn)行分類和回歸,最常用的分類應(yīng)用對于顧客分類是非常有效的,同時也可以對商家的經(jīng)營情況預(yù)警進(jìn)行分類。同時如上圖所示,SVM的回歸效果也相當(dāng)不錯。
支持向量機(jī)的關(guān)鍵在于核函數(shù)的選擇,它對于最終結(jié)果起著決定性的作用,因此在核函數(shù)選擇的原則非常關(guān)鍵。有時往往需要多次試驗,會發(fā)現(xiàn)不是所有的品牌都可以利用同一個核函數(shù),這時可以對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化或正則化預(yù)處理