RFM – výchozí segmentace

minulém článku jsme získali RFM skóre z transakčních dat zákazníků, nyní zákazníky rozdělíme podle skóre do skupin (segmentů). Prvním krokem je rozdělení každé RFM (Recency, Frequency a Monetary) proměnné na intervaly zvlášť, nezávisle na ostatních. Např. rozdělíme zákazníky podle hodnoty F na zákazníky, co nakoupili jednou, dvakrát a třikrát a více. Obdobně rozdělíme R a M. Celkový počet skupin bude dán kombinacemi jednotlivých dělení, např. rozdělíme-li R a F na 3 skupiny a M na 4, vznikne 3*3*4 = 36 výchozích skupin. Dělení lze schematicky znázornit RFM krychlí na Obr. 1. Pozor, stejná velikost malých krychliček je jen schématická, délka intervalů je obvykle různá, správně by se tedy mělo mluvit o kvádrech, ale zvyk se ustálil takto.

Obr. 1 RFM krychle

Problém je nalézt správné hranice a určit počet skupin, na které proměnné dělíme. Každá proměnná by měla být rozdělena nejméně na tři intervaly. Na druhé straně by počet intervalů neměl být příliš veliký. Nesmíme zapomenout, že celkový počet skupin vzniká násobením počtů jednotlivých dělení. Vhodné je rozdělit každý ukazatel na nejvýše 5 intervalů, takže vznikne maximálně 125 skupin.

Existuje několik základních principů rozdělování do intervalů. Na prvním místě je třeba uvést expertní dělení, to vychází z věcné znalosti problematiky. Expert stanoví intervaly uživatelsky podle svých znalostí. U některých ukazatelů existují obecně doporučené hodnoty pro rozdělení, např. ukazatel F se rozděluje na hodnotu jedna, dvě a tři a více. Pro ukazatel R mohou být přirozené hranice 14 dní, jeden měsíc a jeden rok, zde ale záleží na typu zboží. Ostatní způsoby dělení jsou založeny na statistických metodách.

Jedním z nich je dělení založené na průměru a směrodatné odchylce. Při konstrukci dělení se začne od průměru a pak se na obě strany přidávají násobky směrodatné odchylky a vznikají tak hranice intervalů. Např.

kde s je směrodatná odchylka a x̅ značí průměr. Počet intervalů zvolíme podle jejich obsazenosti, krajní intervaly necháme neomezené. Nevýhoda uvedeného postupu spočívá v závislosti průměru a směrodatné odchylky na extrémních hodnotách (viz dále rozdělení ukazatele M).

Při existenci extrémních hodnot, které se vyskytují téměř vždy, rozdělíme intervaly statisticky raději na základě kvantilů. Toto rozdělení vytváří intervaly tak, aby v každém z nich byl přibližně stejný počet případů. Intervaly jsou pak různě dlouhé, ale to není na závadu.

Při rozdělování ukazatele R je nejlepší použít expertní odhad. Ideálně by vycházel z podrobných znalostí charakteru obchodu, ale můžeme použít i univerzální doporučení. Vždy by měla být přítomna skupina čerstvých zákazníků, tedy těch co nakoupili nedávno. Přesná časová hranice pro čerstvé zákazníky závisí na charakteru prodávaného zboží a je ji nutné určit expertně. Další intervaly můžeme stanovit také expertně nebo statisticky, ale pozor na extrémy.

Ukazatel F se dá rozdělit expertně celkem snadno, v základu by jeden interval měl mít hodnotu 1, další 2 a třetí 3 nákupy a více. Poslední interval lze samozřejmě rozdělit podrobněji opět expertně nebo statisticky.

Rozdělit ukazatel M je nejobtížnější, expertní dělení vyžaduje hlubší znalost situace. Dělení komplikuje to, že ukazatel je tzv. sešikmený a zatížený výraznými extrémy. To znamená, že obsahuje relativně málo velmi vysokých hodnot nebo může být dokonce rozdělen exponenciálně, kdy počet zákazníků s rostoucí útratou klesá podle exponenciály (viz Obr. 2). V těchto situacích volíme raději dělení podle kvantilů.

Obr. 2 Ukázka exponenciálního rozdělení ukazatele M

Po prvotním dělení vznikne nemalý počet skupin, určených všemi kombinacemi intervalů jednotlivých ukazatelů. Protože práce s tak velkým počtem skupin není příliš snadná, ukážeme si v dalším článku, jak vytvořit větší smysluplné skupiny.

Doufám, že vás článek inspiroval a přinesl cenné informace, které vám pomohou se segmentací zákazníků. V příštím článku si ukážeme, jak s výslednými skupinami pracovat.  Se správnou segmentací zákazníků můžete snížit své náklady na marketingové výdaje a cílit na správného zákazníka ve správný čas.

Rádi byste se o statistice a analýze dat dozvěděli více? Chcete se stát mistrem ve svém oboru nebo si jen potřebujete doplnit znalosti? V ACREA nabízíme širokou nabídku kurzů pro váš profesní růst. Máte-li jiný dotaz. Nebojte se využít naši nezávaznou konzultaci, při které vám rádi zodpovíme všechny vaše dotazy a najdeme vhodné řešení.

Ing. Ondřej Brom
lektor, analytik a odborný konzultant ve společnosti ACREA. Ve své profesní kariéře se zaměřuji na analytickou činnost převážně v oblasti data miningu. V nemalé míře se podílím na odborné konzultantské činnosti pro oblast aplikace a využití softwarových řešení společnosti ACREA.
Komentáře

Přidat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Vaše osobní údaje budou použity pouze pro účely zpracování tohoto komentáře. Zásady zpracování osobních údajů