Klientu asmenybės analizė

Psichologija

KLIENTŲ ASMENYBĖS ANALIZĖTIKSLAI

1) Išanalizuoti duomenis ir įvardinti perkamiausias prekes.

2) Susipažinti su klientų amžiumi, išsilavinimu.

3) Sužinoti klientų šeimos statusą ir kiek klientų turi vaikų.

4) Atlikti klientų duomenų klasterizavimą ir suskirstyti į pogrupius tolimesnei analizei.

 

Bendras duomenų taškų skaičius pašalinus nuokrypius yra: 2212 Linijinių koreliacijų tarp kintamųjų vizualizavimui naudojama Heatmap vizualizaciją. Koreliacijos ryšys remiasi Pearsono koreliacijos koeficientu (-1, 0, 1). Koreliacijos parodo ryšio kryptį vieno kintamojo reikšmei didėjant, kito kintamojo reikšmė mažėja arba didėja.

Koreliacija rodo, kad vienam kintamajam didėjant, didėja ir kitas.

Koreliacija rodo, kad vienam didėjant, kitas mažėja. Kuo arčiau -1 ar 1 nuokrypio, tuo priklausomybė stipresnė.

Duomenys sutvarkyti, naujos reikšmės įtrauktos.

 

Klasterizavimas:

Naudojamas padalyti duomenų taškus į keletą grupių taip, kad tų pačių grupių taškai būtų panašesni vienas į kitą ir nepanašūs į kitų grupių duomenų taškus.

Daugelis mašininio mokymo algoritmų veikia geriau, kai skaitiniai įvesties kintamieji yra suskirstyti į standartinį diapozoną. Tam panaudojamas StandartScaler.Standartizacija išskirsto kiekvieną įvesties kintamąjį ir pasiskirstymą priskiria 0 reikšmei, o standartinio nuokrypio 1.'Alkūnės metodas' naudojamas parenkant optimaliausią klasterių skaičių. Šiuo atveju: 4. Atstumui nusakyti tarp taškų klasteriuose apskaičiuojamas WCSS rodiklis(grupės viduje skaičiuoja kvadratų sumas).

0 grupė: didelės išlaidos ir didelės pajamos

1 grupė: žemos išlaidos ir žemos pajamos

2 grupė: žemos išlaidos ir vidutinės pajamos

3 grupė: didelės išlaidos ir vidutinės pajamos

 

IŠVADOS

1) Išanalizuoti duomenis ir įvardinti perkamiausias prekes: perkamiausi vyno ir mėsos produktai.

2) Susipažinti su klientų amžiumi, išsilavinimu: dominuoja 40-50 amžiaus grupės pirkėjai; 50proc. klientų turi aukštąjį išsilavinimą, 38 proc. klientų turi magistro ar daktaro laipsnį, 11 proc. turi vidurinį išsilavinimą.

3) Sužinoti klientų šeimos statusą ir kiek klientų turi vaikų: didesnė dalis klientų gyvena poroje. Dvigubai daugiau klientų yra esantys tėvai.

4) Atlikti klientų duomenų klasterizavimą ir suskirstyti į pogrupius tolimesnei analizei: išskirti 4 pogrupiai.

naujiena
video
video