Big Data statt Bad Data Vor der Analyse steht das Aufräumen
Eine wesentliche Voraussetzung für Big Data Analytics ist die hohe Datenqualität. In der Praxis enthält Big Data aber oftmals Bad Data. Deshalb sind Analyse-Tools gefragt, die bei der Bereinigung der Daten helfen.
Anbieter zum Thema

Über Probleme bei Big Data wird viel geschrieben und diskutiert. Im Fokus stehen dabei häufig der Datenschutz oder Storage-Kosten. Es gibt aber weitere Schwierigkeiten, die in der Praxis auftauchen: Die Daten, die für Big Data Analytics gesammelt und gespeichert werden, sind teilweise Datenmüll. Auf der „Tibco Now 2016“ zum Beispiel berichteten Anwender dem Autor des Beitrags, wie sehr Bad Data zu ihren täglichen Herausforderungen zählt.
Wird das Problem Bad Data rechtzeitig erkannt, bereitet die Datenbereinigung vor der Datenanalyse einiges an Aufwand. Kümmert man sich aber nicht um das Problem Bad Data, steht letztlich die ganze Analytics-Arbeit in Frage. Wie eine Bitkom- und KPMG-Umfrage ergab, nutzt gut ein Drittel (35 Prozent) der Unternehmen in Deutschland Big-Data-Analysen für die Auswertung großer Datenmengen. In der Umfrage gaben vier von fünf Unternehmen an, dass relevante Entscheidungen zunehmend auf Erkenntnissen aus der Analyse von Daten basieren. Wenn die Datenbasis allerdings nicht sauber genug ist, sind meistens auch die Entscheidungsgrundlagen nicht gut genug. Bad Data wird so letztlich zu einem Geschäftsrisiko.
Datenqualität muss stärker in den Fokus
Auch die genannte, aktuelle Bitkom-Umfrage zu Big Data nennt Rechts- und Sicherheitsbedenken sowie ein Mangel an Ressourcen als die größten Hemmnisse für den Einsatz innovativer Datenanalysen. Von einer mangelhaften Datenqualität ist eher nicht die Rede. Tatsächlich aber muss die Datenqualität genauso wie der Datenschutz mehr Beachtung finden, wenn es um Big Data Analytics geht.
Zum einen kann der Datenschutz selbst unter dem Problem Bad Data leiden. Stimmt die Datenqualität nicht, kann es zum Beispiel viel leichter geschehen, dass ungewollt vertrauliche Daten veröffentlicht werden. Zudem ist die Speicherung und Verarbeitung richtiger personenbezogener Daten eine wichtige Forderung des Datenschutzes.
Wie verbreitet Bad Data ist und wie wichtig eine Datenbereinigung oder Datenhygiene ist, zeigt auch der „2016 Data Quality Benchmark Report“: Demnach glauben die befragten Unternehmen, dass durchschnittlich 23 Prozent ihrer Daten nicht korrekt sind, 75 Prozent der Unternehmen sehen negative Auswirkungen auf ihren Kundenservice. Die Probleme bei der Datenbereinigung sehen die Unternehmen insbesondere bei dem Mangel an Wissen, Fähigkeiten und personellen Ressourcen für die Optimierung der Datenqualität.
(ID:44168859)