Erhebung, Merkmale
Zunächst müssen für den betrieblichen Einsatz der Statistik einige Grundbegriffe präzisiert werden. So nennt der Statistiker den Vorgang der Informationsbeschaffung eine Erhebung, wobei er zwischen einer Teilerhebung und einer Vollerhebung unterscheidet. Bei einer Erhebung werden Daten über bestimmte Eigenschaften oder auch Merkmale von Objekten zusammengetragen. Während Eigenschaften meist Überbegriffe bezeichnen, die auf alle Objekte zutreffen, wie etwa den Preis oder das Qualitätsniveau, besitzt jedes einzelne Objekt seine eigene Ausprägung für jede Eigenschaft, d. h. seinen eigenen Preis von 16,50 EUR oder etwa sein eigenes Qualitätsniveau der Stufe gering, mittel oder hoch.
Skalen
Meist werden den Eigenschaften der Objekte Zahlenwerte zugeordnet, d. h., es findet eine Messung der Merkmalsausprägungen der Objekte statt. Dazu verwendet man meist Skalen, die die Ausprägungen der Eigenschaften durch numerische Größen kodieren. In der Praxis unterscheidet man zwischen
- metrisch skalierten Größen (heterograder Fall) wie etwa dem Einkommen, dem Alter oder dem Gewicht, die dadurch gekennzeichnet sind, dass mit diesen Größen mathematische Rechnungen wie etwa die Mittelwertbildung durchgeführt werden können,
- nicht metrisch skalierten Größen (homograder Fall) wie etwa Geschlecht, Nationalität oder Religion, bei denen mathematische Verknüpfungen der Messgrößen wie die Mittelwertbildung keinen Sinn machen. Im homograden Fall betrachtet man meist relative Häufigkeiten oder Anteilswerte über das Auftreten bestimmter Merkmalsausprägungen in der Stichprobe.
Stichproben
Ein in diesem Zusammenhang in der Praxis ständig auftretendes Problem ist die Auswahl einer geeigneten Stichprobe, d. h. die Bestimmung einer geeigneten Menge von Objekten, die stellvertretend für die Menge aller interessierenden Objekte oder auch die Grundgesamtheit steht. Eine Stichprobe oder auch Zufallsauswahl ist dadurch gekennzeichnet, dass die Auswahl der Objekte, die in der Stichprobe untersucht werden, zufällig erfolgt, d. h., jedes Objekt der Grundgesamtheit besitzt die gleiche Wahrscheinlichkeit, in die Stichprobe zu gelangen.
Hochrechnung
Diese Fragestellung ist zentral für die gesamte Statistik, denn allgemein gültige Erkenntnisse über die Grundgesamtheit sind immer nur dann aus der Stichprobe ableitbar, wenn die ausgewählte Menge der Objekte die wichtigsten Merkmale der Grundgesamtheit auch repräsentiert. Nur in diesem Fall ist es möglich, die Ergebnisse der Stichprobe mittels einer Hochrechnung auf die Grundgesamtheit zu übertragen.