Startseite Glossar Statistik

Statistik

Studien-Alert:
Immer einen Schritt voraus.

Immer einen Schritt voraus. Erfahren Sie zuerst von neuen Studien-Publikationen.

Jetzt abonnieren

Im allgemeinen Sprachgebrauch wird der Begriff Statistik häufig mit Zahlenansammlungen oder Tabellen gleichgesetzt – sogenannten Statistiken. Hinter dem Begriff Statistik verbirgt sich jedoch eine eigene wissenschaftliche Disziplin. Der Begriff subsumiert all jene Methoden, die zur Untersuchung von Massen- beziehungsweise Messdaten angewendet werden können. Das Ziel dieser Methoden liegt in der Reduktion von Komplexität durch Informationskomprimierung oder in der Aufdeckung von Strukturen, Zusammenhängen oder Gesetzmäßigkeiten. Mithilfe der Statistik lassen sich so Zustände beschreiben, Ursachen aufdecken, Prognosen erstellen, Techniken ableiten und Schlussfolgerungen ziehen. Die Methoden der Statistik lassen sich, je nach Definition, in zwei beziehungsweise drei große Teilbereiche untergliedern: Die deskriptive (beschreibende) Statistik, die Wahrscheinlichkeitsrechnung und die induktive (schließende) Statistik.

Was umfasst die deskriptive Statistik?

Die deskriptive Statistik umfasst die Gewinnung, Aufbereitung, Darstellung sowie graphische und numerische Beschreibung von Daten. Diese Daten werden durch Messung oder Beobachtung erhoben. In der Marktforschung basiert die quantitative Datenerhebung beispielsweise häufig auf Methoden der Befragung (z.B. standardisierten Fragebögen). Neben der rein tabellarischen oder grafischen Aufbereitung, lassen sich die Daten auch über zusammenfassende Statistikmaße beschreiben.

Diese Maße lassen sich in vier Kategorien unterteilen: Lagemaße (oder Maße der zentralen Tendenz), Streuungsmaße, Kenn- und Messzahlen (z.B. Indizes) sowie Zusammenhangsmaße. Bei den sogenannten Lagemaße handelt es sich um statistische Parameter, die Aufschluss über das Zentrum einer Verteilung anhand eines repräsentativen Werts geben. Beispiele dafür sind der Modus (Modalwert), der Median und das arithmetisches Mittel (Mittelwert). Wie gut beziehungsweise wie genau ein Lagemaß die einzelnen Merkmalswerte beschreibt, lässt sich anhand der Streuungsmaße überprüfen. Ein solcher Parameter gibt demnach Aufschluss über das Ausmaß der Streuung um ein Lagemaß, z.B. einen Mittelwert. Zu den wichtigsten Streuungsmaßen zählen die Varianz, die Standardabweichung und die Spannweite. Die deskriptive Statistik greift zudem häufig auf Kenn- und Messzahlen zurück, die die Werte anderer statistischer Kennzahlen zusammenfassen. Sie können mithilfe eines einzigen Zahlenwerts über die Größe eines Sachverhalts informieren (z.B. der Preisindex für Lebenshaltungskosten). Mithilfe der Zusammenhangsmaße lässt sich zudem die Stärke eines Effekts zwischen zwei statistischen Merkmalen beschreiben. Geläufige Maße sind Chi-Quadrat, Rangkorrelationskoeffizient, Kovarianz und Korrelation.

Verfahren der induktiven Statistik

Die Verfahren der induktiven Statistik (Inferenzstatistik) ermöglichen darüber hinaus, aus den vorliegenden Daten Schlussfolgerungen zu ziehen. Häufig handelt es sich dabei um Werte einer Stichprobe, die aus einer Grundgesamtheit gezogen wurde. Mithilfe induktiver Verfahren werden dann Aussagen über die (Verhältnisse in der) Grundgesamtheit getroffen. Die zwei wichtigsten Aufgaben der induktiven Statistik sind die Schätzung von Werten unbekannter Paramater innerhalb einer Grundgesamtheit und der Test von Hypothesen über Werte von Populationsparametern. Um zuverlässige Schlüsse auf eine Grundgesamtheit zu ziehen, wird eine repräsentative Stichprobe benötigt. Die Verfahren und Instrumente der induktiven Statistik umfassen unter anderem Zufallsexperimente, Wahrscheinlichkeitsverteilungen, Stichproben sowie unterschiedliche Schätzverfahren und Parameter- beziehungsweise Hypothesentest, die angesichts ihres Umfangs und teilweise auch ihrer Komplexität an dieser Stelle nicht weiter beschrieben werden können.

Da der Schluss von Stichprobe auf Grundgesamtheit nicht mit absoluter Sicherheit erfolgen kann, bedarf es der Wahrscheinlichkeitsrechnung. Sie ermöglicht eine Schlussfolgerung mit möglichst großer Sicherheit und wird deshalb auch als Bindeglied zwischen deskriptiver und induktiver Statistik bezeichnet. Die Wahrscheinlichkeiten werden anhand relativer Häufigkeitsverteilungen statistischer Merkmale berechnet. Sie sind demnach nicht theoretisch vorherbestimmt, sondern empirisch fundiert.

Merkmale in der Statistik

Die Statistik bedient sich dazu einer besonderen Terminologie: Die für die statistische Analyse erhobenen Eigenschaften werden Merkmale oder Variablen genannt. Diese Merkmale werden an statistischen Einheiten beziehungsweise Merkmalsträgern erhoben. Ein Wert eines Merkmals wird Ausprägung oder Realisation genannt. Die Menge aller für die Untersuchung relevanter Merkmalsträger heißt Grundgesamtheit. Werden alle Merkmalsträger der Grundgesamtheit erfasst, handelt es sich um eine Vollerhebung. Wird nur ein Teil der erfasst, liegt eine Teilerhebung vor. Werden neue (Roh-)Daten für ein spezifisches Untersuchungs- beziehungsweise Erkenntnisziel erhoben, liegt eine sogenannte Primärerhebung vor. Die Primärforschung kommt vorwiegend zum Einsatz, wenn die für das Forschungsziel relevanten Informationen nicht oder nur teilweise durch vorhandenes Datenmaterial (Sekundärdaten) abgedeckt werden. Die Primärforschung unterscheidet sich von der sogenannten Sekundärforschung, die zur Lösung eines Untersuchungsproblems ausschließlich bestehende Datenquellen heranzieht. Da die Sekundärforschung zumeist durch Untersuchungen am Schreibtisch beziehungsweise am PC durchgeführt wird, ist dafür auch die Bezeichnung Desk Research geläufig.

Bei erhobenen Merkmalen wird üblicherweise, je nach der Anzahl ihrer möglichen Ausprägungen, zwischen diskreten und stetigen Merkmalen unterschieden. Diskrete Merkmale besitzen nur endliche beziehungsweise abzählbar unendlich viele Ausprägungen. Ein besonderer Fall sind binäre (dichotome) Merkmale, die nur zwei Werte annehmen können. Im Gegensatz dazu können stetige Merkmale jeden reellen Wert annehmen, und damit theoretisch unendlich viele verschiedene Ausprägungen besitzen.

In der Statistik ist zudem eine Unterscheidung der Merkmale nach Skalenniveaus geläufig. Die Ausprägungen der sogenannten nominalskalierten Merkmale lassen sich nur unterscheiden (zum Beispiel Farben). Es handelt sich dabei um sogenannte qualitative Merkmale. Ordinalskalierte Merkmale können darüber hinaus in eine sinnvolle Rangfolge gebracht werden (zum Beispiel Schulnoten). Im Falle metrischer Merkmale lassen sich sogar die Unterschiede zwischen den einzelnen Ausprägungen bestimmen beziehungsweise interpretieren (zum Beispiel die Zeitdauer in Sekunden). Bei metrischen Merkmalen handelt es sich um sogenannte quantitative Merkmale, sie lassen sich nochmals in intervallskalierte und verhältnisskalierte Merkmale gliedern. Bei intervallskalierten Merkmalen sind Differenzen zwischen den Ausprägungen sinnvoll messbar (zum Beispiel Temperatur in Celsiusgraden). Bei verhältnisskalierten Merkmalen können auch Verhältnisse sinnvoll gemessen werden, da sie einen natürlichen Nullpunkt besitzen (zum Beispiel Stückzahlen).

Hinweis

Bitte beachten Sie, dass es sich bei den einzelnen Begriffserklärungen in unserem Glossar um vereinfachte Erläuterungen handelt. Jeder dieser Begriffe ist zudem aus einer Unternehmensperspektive heraus beschrieben und zum besseren Verständnis gekürzt definiert. Insofern besteht die Möglichkeit, dass einzelne Definitionen nicht zur Gänze wissenschaftlichen Standards entsprechen.

Schon gewusst?

Marktforschung

Marktforschung dient der Gewinnung von Informationen, die Hilfen für Unter­nehmensentscheidungen geben sollen. Mit Hilfe der Daten können beispielsweise Trends und Chancen aufgezeigt werden.

Trendanalyse

Die Trendanalyse versucht gesell­schaftliche und wirtschaftliche Entwick­lungen systematisch aufzudecken. Eine repräsentative Trendanalyse bedarf guter Vorbereitung.

Publishing

Publishing bezeichnet die Publikation eines Werkes. Publizierende können Verlage, aber auch Einzelpersonen über digitale Wege sein. Kennzeichnend für viele Publikationen ist eine ISBN-Nummer.