Raport PwC “Nowy obraz polskiego konsumenta” pokazuje, że pandemia koronowirusa m.in. spowodowała zwiększenie częstotliwości robienia zakupów przy użyciu komputerów i smartfonów przez Polaków oraz sprawiła, że większość Polaków po złagodzeniu reżimów sanitarnych nadal będzie dokonywać zakupów online. Obecność konsumentów w kanałach cyfrowych oznacza również zwiększenie ilości danych o nich, które stają się dostępne dla firm. A to oznacza konieczność zarządzania tymi danymi i wykorzystywania ich w efektywny sposób.
Dlaczego korzystanie z danych jest istotne?
Posiadanie danych o klientach to warunek konieczny, by stać się data-driven organizacją, ale nie wystarczający. Posiadanie dużych wolumenów danych w rozproszonych systemach (albo plikach excel) nie pozwala na budowanie na tej bazie przewag konkurencyjnych. Do tego niezbędne jest przejście od posiadania danych do używania danych, które wspierają cele biznesowe, czyli odejście od big data na rzecz smart data.
Pierwszym krokiem jest opracowanie strategii danych, która w odniesieniu do celów biznesowych organizacji (krótko- i długoterminowych) określi zapotrzebowanie na dane i zidentyfikuje już posiadane oraz te, które organizacja powinna zacząć zbierać.
W kolejnych krokach niezbędne jest określenie wartości danych z prawnego punktu widzenia (możliwość wykorzystania zgodnie z prawem dla celów biznesowych), integracja danych oraz zarządzanie nimi w centralny sposób w systemie przystosowanym do przetwarzania wielkich wolumenów danych (big data).
Dodatkowo ważnymi elementami są takie obszary jak budowa jednoznacznego identyfikatora klienta (przy użyciu metod deterministycznych oraz probabilistycznych), wytwarzanie insightów konsumenckich dzięki zastosowaniu mechanizmów i algorytmów ML/AI (Machine Learning / Artificial Intelligence), aktywacja danych oraz ciągłe mierzenie oraz optymalizacja.
Dane konsumenckie możemy systematyzować według tego w jaki sposób i z jakich źródeł organizacja je pozyskuje. Możliwie pełny obraz konsumentów otrzymujemy w momencie, kiedy posiadamy dane z różnych źródeł, czyli dane własne organizacji (1st party data), dane pozyskane dzięki współpracy z partnerami biznesowymi (2nd party data), oraz dane gromadzone przez niezależne firmy (3rd party data).
1st party data to dane zbierane z różnych własnych źródeł, np. systemy CRM, CMS, MA, własne strony www, kreacje reklamowe, aplikacje mobilne. Możemy je podzielić na:
Dane osobowe (Personally Identifiable Information - PII) - Imię i nazwisko, adres, email, numer telefonu zbierane poprzez zapisanie się na newsletter, dostęp do treści oraz usług wymagających utworzenia konta/profilu/logowania, wykonania zakupu, płatności czy dostawy, dołączenia do programu lojalnościowego. Pozwala na pełną identyfikację klienta, zgromadzenie wiedzy o tym kim jest, jakie transakcyjne relacje ma na styku z organizacją.
Anonimowe - np. cookies, wyniki kampanii reklamowych, historia wyszukiwań, kontaktów z call center, dane geolokalizacyjne, Device ID, profile w Social Media. Pozwala na wzbogacenie wiedzy i zrozumienie szerszej grupy klientów.
Chmura - w przypadku olbrzymich zbiorów danych (Big data) lepszym rozwiązaniem może okazać się gromadzenie oraz przetwarzanie danych w chmurze, co pozwala na pełne skalowanie przestrzeni na dane oraz mocy służącej do przetwarzania informacji. Znaczna część rozwiązań gromadzących i przetwarzających dane klientów - klasy DMP, CRM, MA i tak już działa w całości w chmurze w modelu Software as a Service (SaaS). Oczywiście przetwarzanie danych osobowych w chmurze podlega rozlicznym regulacjom - GDPR, KNF etc.
On-premise - przechowywanie i przetwarzanie danych klienckich na własnej infrastrukturze informatycznej zapewnia organizacji większą kontrolę nad danymi oraz procesami ale ogranicza wydajność oraz skalowanie do dostępnej infrastruktury. Wymagane jest długofalowe zaplanowanie inwestycji w infrastrukturę sprzętową, oprogramowanie oraz zespoły IT niezbędne do jej utrzymania i rozwoju.
Real time - rozwiązania pozwalające na ciągły input, przetwarzanie oraz output danych w czasie rzeczywistym (w milisekundach/sekundach). Uzyskanie ciągłego wyniku przetworzenia olbrzymiego strumienia danych wejściowych i uzyskanie natychmiastowej reakcji systemu - wyniku operacji na danych, który to może zostać od razu zastosowany. Rozwiązania działające w czasie rzeczywistym wymagają systemów IT o większej wydajności.
Batch (przetwarzanie wsadowe) - rozwiązania wymagające wykonania serii powiązanych zadań rozdzielonych na input, przetwarzanie oraz output danych. Wymagają kolejkowania procesów, wykorzystują znacznie mniej zasobów IT, ale nie pozwalają na output przetworzenia danych w czasie rzeczywistym tylko w zaplanowanych “oknach” czasowych.
Każda z tych metod ma wady i zalety. W jednej organizacji różne dane mogą być przetwarzane na różne sposoby. Dobór metody do typu danych uzależniony jest od faktycznego zastosowania danych (nie wszystkie dane muszą być dostarczane real time aby niosły ze sobą wartość) oraz szacowanych kosztów przetwarzania danych w każdej z metod.
Cookie służące do analizy cross-domenowych zachowań użytkowników w internecie, budowania profili behawioralnych, demograficznych, transakcyjnych etc. w celach brokingu tymi danymi, tworzenia insightów konsumenckich oraz personalizacji przekazu poprzez kanały komunikacji (w narzędziach klasy Data Management Platform/Demand Side Platform) są stopniowo eliminowane z ekosystemu marketingowego.
3rd party cookies blokują już następujące przeglądarki WWW: Firefox, Apple Safari, Microsoft Edge.
Google zapowiada zablokowanie ich w Chrome w 2022 r. (63% udział Chrome w Polskim rynku wg. Gemius Ranking z listopada 2020).
Eliminacja spowoduje wzrost roli 1st party cookies jako jedynych pozostałych na rynku identyfikatorów użytkowników, którymi dysponują wyłącznie właściciele dużych posiadłości online tj. wydawcy stron WWW, platformy ecommerce, porównywarki cen, aplikacje webowe, telekomy, banki etc. Firmy te obecnie już budują swoje ekosystemy online tak jak wcześniej np. Google czy Facebook, lecz z oczywistych względów mniejsze. Są to tzw. walled gardens oparte na 1st party cookies, które umożliwiają wykorzystanie danych m.in. w celach emisji reklam.
Identyfikatory urządzeń (Device ID - IDFA, GAID, MAID) - wykorzystywane są w świecie aplikacji mobilnych do identyfikacji użytkowników.
Apple wraz z iOS 14 zapowiedział, że w 2021r. wprowadzi ograniczenia w zakresie możliwości wykorzystania identyfikatorów urządzeń przez niezależne podmioty.
Użytkownicy iPhone’ów będą musieli wyrazić explicite zgodę przy każdej próbie śledzenie przez rozwiązania 3rd party, a dostawcy aplikacji powinni przygotować odpowiednie etykiety dla swoich rozwiązań w Apple App Store wskazujące: jakie dane używają do śledzenia użytkowników, jakie dane są zbierane w aplikacjach oraz mogą zostać powiązane z tożsamością użytkowników.
Przykład app privacy label w Appstore dla aplikacji Instagram
Źródło: App Store, dostęp: 29.01.2021.
120 mln USD - oszczędność na zmniejszeniu niezbędnych zapasów towarów
1,7 mln - mniej zamówień produktów, których brak na na stanie (out-of-stock)
80 mln USD - wzrost przychodów
Polepszenie doświadczeń klienta poprzez zmniejszenie czasu spędzanego w kolejkach do kas oraz zapobieganiu frustracji w przypadku próby zakupu towarów, które sieć posiada w ofercie ale nie na stanie w danym sklepie.
Marka kosmetyczna od lat gromadzi i analizuje dane o zachowaniach swoich klientów co umożliwia personalizację przekazu, precyzyjną rekomendację produktów, budowę relacji i lojalności m.in. poprzez programy ocen i rekomendacji produktów, zwiększenie sprzedaży, budowę własnych kanałów Direct 2 Consumer.
4,6 mld EURO, 15,6% udziału, +52.4% wzrost rok do roku - sprzedaż w e-commerce (2019)
½ - udział kanałów cyfrowych w wydatkach reklamowych
1,3 mld wizyt na stronach www
33,000 - pracowników przeszkolonych w ramach programu Digital Upskilling
Dzięki zbieraniu danych z różnych kanałów i punktów styku: zachowania konsumentów, ich preferencje czy transakcje, testy produktów np. aplikacja mobilna do “przymierzania” makeupu za pośrednictwem rozszerzonej rzeczywistości, quizy (guided selling) pomagające w doborze koloru włosów, cyfrowe rozwiązania diagnostyczne tj. skin “diagnosis” firma jest w stanie dopasować przekaz do 2,1 kwardyliardów (10 do 27 potęgi) potencjalnych person. W 2021 roku koncern wprowadzi na rynek Perso - oparty na AI, samoobsługowy, spersonalizowany domowy system skin care.
Amerykańska giełdowa spółka dzięki zespołowi data scientist, w oparciu analitykę danych oraz Machine Learning jest w stanie sprzedawać precyzyjnie dopasowane do gustu klientów zestawy ubrań w modelu abonamentowym. Algorytmy rekomendacyjne w połączeniu z armią osobistych stylistów pozwoliły na odpowiedni dobór nie tylko stylu czy rozmiaru odzieży zmniejszając liczbę zwrotów, a zwiększając lojalność.
7,4 mld USD - kapitalizacja rynkowa
1% sprzedawanych produktów to zupełnie nowe towary, które zaprojektowane zostały jedynie w oparciu o algorytmy uczenia maszynowego
Głęboka wiedza o preferencjach klientów, ich cechach fizycznych, demografii, lokalizacji, zakupach etc, połączona z szczegółowymi danymi o cechach wszystkich sprzedawanych towarów - rozmiar, dopasowanie, styl, wzór, marka, cena etc. oraz opiniami i komentarzami konsumentów - m.in. przyczyny zakupów i zwrotów, pozwoliły na zbudowanie unikalnego systemu rekomendacji - prawdziwego Netflixa czy Spotify dla odzieży.