Jak špatná data škodí vašemu byznysu

Na špatná data se dá svést všechno. Jsou jakýmsi moderním zloduchem, který nám kazí byznys. Jenomže špatná data nás opravdu mohou svést ze správné cesty. Mohou být zkreslená, neúplná, ne zcela správná anebo se jim nedá důvěřovat.

Harvard Business Review uvádí, že až polovina lidí, kteří pracují s daty, ztrácí čas „lovením“ těch správných údajů, opravou chyb a ověřováním zdrojových dat, kterým nedůvěřují. Častokrát zbytečně. Joseph Santos, hlavní konzultant datových strategií společnosti Dun & Bradstreet rozlišuje několik typů špatných dat. Říká, že jsou jen symptomem pramenícím z různých příčin. „Špatná data jsou taková, která obsahují překlepy, chyby, špatnou diakritiku, jsou nekompletní nebo zastaralá, duplicitní nebo nesprávná. Takovým datům firmy nemohou věřit, nebo ještě hůře – věří jim, ale neměly by,“ vysvětluje Joseph Santos.

Jaké jsou jednotlivé typy špatných dat, jejich příčiny a způsoby nápravy?
NEÚPLNÉ ÚDAJE

Chybějící data jsou noční můrou, která může zcela zničit reporty a analýzy. Ztěžují jakoukoli operaci, která je na nich založena. Údaje buď zcela chybí, nebo jsou v nich mezery. Řešením je vybudování jakéhosi "strážce dat", který by firmám pomohl předcházet tomu, aby se k nám neúplná data vůbec dostala. Příkladem mohou být dotazníky, které obsahují všechny odpovědi na povinné otázky a mají automatické dokončování na základě robustního souboru referenčních údajů.

DUPLICITNÍ VSTUPY

Pokud mají záznamy v jedné databázi stejné vlastnosti jako záznamy v jiné databázi, hovoříme o duplicitě. Jejich přítomnost v datovém ekosystému může vést ke zcela nesprávným výstupům v hodnoceních a analýzách. To způsobuje zmatek a takový výstup je ztrátou času.

Jak na to? Nejprve musí organizace rozhodnout, které duplicity jsou pro podnikání nezbytné a které nikoli. Duplicity lze odstranit shlukováním (slučováním) tak, že se ponechají nejlepší a nejcennější data a ostatní se sloučí. K třídění dat můžete použít umělou inteligenci. Model strojového učení D&B Connect Manage dokáže dosáhnout téměř stoprocentního rozlišení duplicit a vytvořit tzv. zlaté záznamy v souborech dat.

PŘÍLIŠ MNOHO RŮZNÝCH ZDROJŮ DAT

Je téměř nemožné se jim vyhnout. Studie společnosti Dun & Bradstreet z roku 2021 zjistila, že průměrná sada marketingových technologií využívá až 10 různých nástrojů pro vytěžování dat. V dnešním prostředí to ale jinak nejde a je třeba je "zkrotit". Protože i když nemají společné procesy, data, která získají, budou muset souviset s jinými soubory dat. Proto existují různé systémy datových skladů, které umožňují škálovatelnou správu dat.

Datovým skladům se také v doslovném překladu říká datová jezera. Pokud však všechna data nasypete na jedno místo, dříve nebo později skončíte v datové bažině. Kromě technického zajištění dat, jako jsou rozhraní API, je třeba myslet také na clusterování a škálování dat z různých zdrojů v jednom prostředí. Nástroj pro porovnávání, resp. spojování vám pomohou spravovat stávající a nové zdroje dat v datovém jezeře.

ZKAŽENÁ DATA

Data jsou něco, co má svoji životnost a některá z nich velmi rychle ztrácejí svůj význam. Například kontaktní údaje v průběhu jednoho roku "zestárnou" až o 34 procent. To v praxi znamená, že pracujeme s třetinou starých, a tudíž zbytečných dat. Řešením je obohacení dat. Soubory dat lze pravidelně doplňovat prostřednictvím spolehlivých externích zdrojů. Ale jak se říká, nevylévejte s vodou z vaničky i dítě. Koneckonců je snadné označit stávající datové sady za horší kvůli jejich výkonu. Spolupracujte s externími zdroji nebo zdroji třetích stran, abyste zajistili, že vaše stávající (nejen) kontaktní údaje budou vždy aktuální.

Jak jsme již zmínili, ročně se společnosti potýkají s poklesem aktuálnosti dat o 34 % a více. A vy potřebujete mít účinný plán aktualizace spojený s prahovou hodnotou přesnosti dat vaší společnosti. Ad hoc aktualizace dat může být pro uživatele medvědí službou.

"Tato doporučení a řešení jsou jen dílky velké skládačky. Existuje velká poptávka po správě dat, aby se zabránilo ztrátě kvality dat a přílivu nekvalitních dat do vašich systémů. Dobrou zprávou je, že většinu těchto úkolů lze nyní automatizovat pomocí umělé inteligence a strojového učení," připomíná Joseph Santos z Dun & Bradstreet.

Bez správy dat se dnes neobejde žádný podnik. Kromě pochopení toho, kde, kdy a jak tyto kroky provádět, jsou výše uvedená doporučení klíčová pro vaši datovou strategii. Řešení i hlavní příčina jsou stejné: správa dat. Je to funkce, bez které se již neobejdeme. Naše rostoucí závislost na datech to dokazuje.

 

Sdílejte s ostatními!

Pomozte kolegům z vaší sítě objevit nové poznatky