Die Datenanalyse ist ein Prozess, bei dem neue Erkenntnisse aus gesammelten Informationen mithilfe von Methoden der Statistik gewonnen werden. Die Ergebnisse werden in Form von Kennzahlen, Tabellen oder Grafiken verdeutlicht. Die Datenauswertung steht dabei im Zentrum der quantitativen Forschung und ist meist mit einer eigenen Datenerhebung, etwa durch eine Umfrage, und einem spezifischen Analyseverfahren, etwa der Trendanalyse, verbunden. Die ermittelten Resultate dienen als Grundlage für evidenzbasierte Maßnahmen.
Klassifikation der Daten
Die zahlreichen Varianten von Datenanalysen können in Unterkategorien eingeteilt werden. Von der methodischen Vorgehensweise ausgehend hat sich die Klassifikation in deskriptive, inferenzielle, explorative und konfirmatorische Datenanalyse etabliert. Die deskriptive Datenanalyse zielt darauf ab, den Untersuchungsgegenstand möglichst umfassend darzustellen, wie es etwa bei einer Vollerhebung der Fall ist. Die deskriptive Statistik hat vor allem einen beschreibenden Charakter und hilft in der Anfangsphase von Projekten, einen Untersuchungsgegenstand besser zu überblicken. Die inferenzielle Datenanalyse arbeitet hingegen mit Stichproben und statistischen Schätzungen, um Aussagen über eine größere Grundgesamtheit (z.B. die Zielgruppe eines Unternehmens) zu treffen. Die explorative Datenanalyse findet Anwendung, wenn wenig über die Zusammenhänge der vorhandenen Daten bekannt ist. Diese Auswertungsform soll die grundsätzlichen Strukturen und Zusammenhänge erst herausarbeiten. Die konfirmatorische Datenanalyse erlaubt hingegen die Überprüfung von vorher formulierten Hypothesen, wodurch sowohl die statistische Signifikanz eines Zusammenhangs, als auch seine Effektstärke bestimmt werden kann, beispielsweise im Rahmen einer Regressionsanalyse.
Datenanalyse als Teil der Marktforschung
Aufgrund dieses Facettenreichtums findet die Datenanalyse breite Anwendung in Organisationen. Auch die Möglichkeiten zur Datenerhebung, etwa durch Data Mining, und deren Auswertung sind gewachsen, Stichwort Big Data Analytics. In der empirischen Sozialforschung wird die Datenanalyse verwendet, um mittels sozio-demographischer Daten Erkenntnisse über die Einstellungen und Verhaltensweisen von Gruppen zu gewinnen. Im Feld der Business Intelligence, alias Geschäftsanalytik, trägt die Auswertung unternehmenseigener Daten dazu bei, Prozesse zu optimieren. Die moderne Markt- und Meinungsforschung wäre ohne die Methoden der Datenanalyse undenkbar. Insbesondere die Echtzeitanalyse von Datenströmen gewinnt an Beliebtheit. Immer mehr Unternehmen schaffen Stellen für Datenanalysten und Data Scientists, was einmal mehr die zunehmende Bedeutung aufzeigt.
Datenbereinigung notwendig
Die Datenanalyse hat aber auch Limitationen: So steht und fällt sie mit der Qualität der verwendeten Daten. Ergo muss die Erhebung sorgfältig durchgeführt werden, während für bestehende Daten ist eine intensive Qualitätskontrolle notwendig ist. Daneben müssen mit Blick auf die jeweiligen Erkenntnissinteressen auch die Analyseverfahren informiert ausgewählt werden. Gleiches gilt mit Blick auf das Forschungsdesign und mit Blick auf die Aussagekraft der Studie. Wenn diese Aspekte berücksichtigt werden, kann die Datenanalyse neue Einblicke schaffen, die anderweitig nur schwer bis überhaupt nicht möglich wären.