Článok Data-driven marketing Digital transformation

Ako zlé dáta škodia vášmu biznisu

Autor - 27 feb 2023

Na zlé dáta sa dá zvaliť úplne všetko. Sú akýmsi moderným zloduchom, ktorý nám kazí biznis. Lenže zlé dáta nás naozaj dokážu zviesť zo správnej cesty. Môžu byť skreslené, úplne nesprávne, alebo sa im nedá dôverovať.

Harvard Business Review uvádza, že až polovica ľudí, ktorí pracujú s dátami, strácajú čas „lovením“ tých správnych údajov, opravou chýb a overovaním zdrojov dát, ktorým nedôverujú. Častokrát zbytočne. Joseph Santos, hlavný konzultant dátových stratégií spoločnosti Dun & Bradstreet rozlišuje niekoľko typov zlých dát. Hovorí, že sú len symptómom prameniacim z rôznych príčin. „Zlé dáta sú také, ktoré obsahujú preklepy, chyby, zlú diakritku, nekompletné či  zastarané dáta, duplicitné, alebo nesprávne údaje. Takýmto dátam tímy vo firmách nemôžu veriť, alebo ešte horšie - veria im, ale nemali by,“ uvádza Joseph Santos.

Aké sú jednotlivé typy zlých dát, ich príčiny a tiež spôsoby nápravy.

NEKOMPLETNÉ DÁTA

Chýbajúce údaje sú nočnou morou, ktorá môže kompletne zničiť reporty a analýzy. Brzdia akúkoľvek operáciu, ktorá je na nich založená. Údaje buď kompletne chýbajú, alebo sú v nich medzery. Riešením je vybudovanie akéhosi „dátového brankára“, ktorý firmám pomôže predísť tomu, aby sa neúplné dáta k nám vôbec dostali. Príkladom môžu byť dotazníky, ktoré majú všetky odpovede na povinné otázky a disponujú automatickým dopĺňaním, ktoré je založené na robustnom datasete referenčných dát.

DUPLICITNÉ VSTUPY

Ak záznamy v jednej databáze majú rovnaké vlastnosti ako záznamy v inej databáze, hovoríme o duplicite. Ak ich v dátovom ekosystéme máme, môžu vyprodukovať úplne nesprávne výstupy v hodnoteniach a analýzach. To spôsobuje zmätok a takýto výstup je strata času.

Ako na to? Najskôr sa organizácia musí rozhodnúť, ktoré duplicity sú pre biznis potrebné a ktoré nie. Duplicity sa dajú odstrániť klastrovaním (zlučovaním) tak, že najlepšie a najhodnotnejšie údaje si ponecháte a ostatné zlúčite. Na triedenie dát môžete použiť umelú inteligenciu. Model strojového učenia D&B Connect Manage dokáže dosiahnuť takmer 100 percnentné rozlíšenie duplikátov a vytvoriť tzv. zlaté záznamy v datasetoch.

PRÍLIŠ VEĽA RÔZNYCH ZDROJOV DÁT

Je takmer nemožné vyhnúť sa im. V roku 2021 štúdia Dun & Bradstreet zistila, že priemerný balík marketingových technológií používa až 10 rôznych nástrojov na získavanie dát. V dnešnom prostredí sa to však ani inak nedá a je potrebné ich „skrotiť“. Lebo hoci nemajú spoločné procesy, získané dáta sa budú musieť týkať aj iných datasetov. Preto existujú rôzne systémy skladovania dát, ktoré umožňujú ich škálovateľné manažovanie.

Skladom dát sa hovorí aj ‚data lakes“, v doslovnom preklade dátové jazerá. Ak však nalejete všetky dáta na jedno miesto, raz-dva vám z toho vznikne dátový močiar. Okrem technického zabezpečenia údajov, ako sú napríklad rozhrania API, treba premýšľať aj nad klastrovaním a škálovaním dát z rôznych zdrojov v jednom prostredí. Nástroj zhody/zlúčenia vám pomôže spravovať existujúce a nové zdroje údajov vo vašom dátovom jazere.

POKAZENÉ DÁTA

Údaje sú niečo, čo má svoju životnosť a niektoré svoj význam strácajú veľmi rýchlo. Napríklad kontaktné údaje „zostarnú“ v priebehu roka až o 34 percent. To fakticky znamená, že pracujeme s tretinou starých, a teda zbytočných, dát v systéme. Riešením je obohacovanie dát. Súbory údajov je možné pravidelne dopĺňať prostredníctvom spoľahlivých externých zdrojov. Ale ako sa hovorí, nevylievajte s vodou z vaničky aj dieťa. Je totiž jednoduché onálepkovať existujúce datasety ako podradné kvôli ich výkonnosti. Spolupracujte s externými zdrojmi alebo zdrojmi tretích strán, aby ste vaše existujúce kontaktné údaje mali vždy aktuálne.

Ako sme už spomenuli, ročne firmy čelia poklesu aktuálnosti údajov o 34 % alebo viac. A vy potrebujete mať efektívny plán aktualizácie spárovaný s prahom presnosti údajov vašej organizácie. Ich vykonávanie ad hoc môže byť pre vašich používateľov medveďou službou.

„Tieto odporúčania a riešenia sú len kúskami vo veľkej skladačke. Je tu veľký dopyt po správe údajov, aby nedochádzalo ku strate kvality dát a pritekaniu nekvalitných dát do vašich systémov. Dobrou správou je, že väčšina týchto úkonov sa dnes dá automatizovať pomocou umelej inteligencie a strojového učenia,“ pripomína Joseph Santos z Dun & Bradstreet.

Bez správy údajov sa dnes nezaobíde žiadna firma. Vyššie uvedené odporúčania sú, okrem pochopenia toho kde, kedy a ako tieto kroky implementovať, kľúčové pre vašu dátovú stratégiu. Riešenie a hlavná príčina sú rovnaké: správa údajov. Je to funkcia, bez ktorej sa už nezaobídeme. Naša rastúca závislosť od údajov to dokazuje.

Pomôžeme Vám nájsť to správne riešenie pre vaše potreby

Sme odborníci na dáta a analytiku. Radi pomôžeme aj Vašej firme so zvýšením obchodnej výkonnosti. Vyplňte svoje kontaktné údaje a my sa Vám ozveme.