cover.eps

Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies

Schummelseite

Title page image

Über den Autor

Thomas Krickhahn hat Wirtschafts- und Sozialwissenschaften studiert und an der philosophischen Fakultät der Martin-Luther-Universität in Halle-Wittenberg promoviert (1995). Er hat eine mehrjährige Erfahrung im Bereich der empirischen Wirtschaftsforschung als Forschungsassistent und wissenschaftlicher Gutachter. Auch als Dozent ist er unter anderem in den Bereichen Volkswirtschaftslehre, quantitative Methoden und Betriebswirtschaftslehre (an Weiterbildungseinrichtungen, Fachhochschulen und Universitäten) langjährig tätig. Er ist Autor mehrerer Publikationen im Bereich der wirtschafts- und sozialwissenschaftlichen Forschung und Lehre. Zurzeit ist er als wissenschaftlicher Projektleiter an der Hochschule Bonn-Rhein-Sieg und als Dozent für die Bonner Akademie (Gesellschaft für DV- und Management-Training, Bildung und Beratung mbH) tätig.

Über den Fachkorrektor

Dominik Poß studierte Volkswirtschaftslehre an der Rheinischen Friedrich-Wilhelms-Universität Bonn. Bereits während seines Studiums legte er sein Augenmerk auf das Fachgebiet Statistik und begleitete als Tutor erfolgreich zahlreiche Studenten durch die Grundvorlesungen der Statistik.

Zur Zeit ist er Doktorand an der Bonn Graduate School of Economics und beschäftigt sich am Institut für Finanzmarktökonomik und Statistik der Universität Bonn mit der Analyse von funktionalen Daten, hochdimensionalen Regressionsproblemen und der Variablenselektion.

Danksagung

Die Niederschrift von Büchern ist mit viel Zeit verbunden. Zeit die der Autor nicht seinen Nächsten widmen kann. Mein Dank gilt daher zuallererst meiner lieben Frau, Susanne Krickhahn. Die Qualität des Werks hängt nicht zuletzt auch an den Menschen, die bei der Erstellung unterstützend mitgewirkt haben. Meiner Lektorin, Frau Esther Neuendorf, und meinem Fachlektor, Herrn Dominik Poß, bin ich für die vielen wertvollen Hinweise und Korrekturen sehr dankbar.

Thomas Krickhahn
Bonn, im Frühjahr 2019

Einführung

Die Statistik und statistische Formeln spielen in den Wirtschafts- und Sozialwissenschaften, aber auch natürlich in den anderen Wissenschaften, ja darüber hinaus in nahezu allen privaten und beruflichen Lebensbereichen eine Rolle.

Auch wenn Sie sich dieses Buch zugelegt haben, um Ihren Statistikschein zu erwerben, werden Sie sicher auch in ganz anderen Situationen davon profitieren, glauben Sie’s mir!

Über dieses Buch

Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies enthält die wichtigsten statistischen Instrumente und Formeln, die Sie im Bereich der Wirtschafts- und Sozialwissenschaften benötigen.

Es ist insbesondere für Schüler, Studierende und Lehrende aus dem Bereich der Wirtschafts- und Sozialwissenschaften konzipiert. Und da Statistik viel mit Formeln zu tun hat, wird in diesem Buch dem Verständnis und der Anwendungskompetenz der einzelnen statistischen Formeln besondere Bedeutung beigemessen. Zu jeder statistischen Formel finden Sie

  • eine Erläuterung des Zwecks, der Aufgabe und der Anwendungsbedingungen,
  • eine Beschreibung der einzelnen Symbole in der Formel,
  • eine Darstellung der einzelnen Arbeitsschritte zur Berechnung der Formel,
  • ein konkretes Anwendungsbeispiel mit vollständigem und erläutertem Lösungsweg sowie
  • eine Interpretation der jeweiligen Lösung beziehungsweise des Ergebnisses.

Sie sehen es schon, es ist das Anliegen von Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies, Ihnen die Statistiken und ihre Formeln nicht nur sozusagen vor die Füße zu kippen, sondern Ihnen auch nötiges Hintergrund- und Zusammenhangswissen zu vermitteln. Insbesondere durch die detaillierte Beschreibung der einzelnen Arbeitsschritte, die Sie bei der Anwendung der Formeln durchlaufen müssen, und durch die Beispiele mit ihren vollständigen Lösungswegen und Ergebnisinterpretationen wird die Voraussetzung dafür geschaffen, dass Sie die Statistiken und Formeln garantiert auch in der privaten und beruflichen Praxis erfolgreich anwenden können.

Anspruch und Ziel ist dabei aber immer:

  • leichte Lesbarkeit,
  • Verständlichkeit der Anleitungen,
  • praktische Anwendbarkeit und
  • systematische und einheitliche Darstellungsweise.

Jedes Kapitel ist so aufgebaut, dass Sie es unabhängig von den anderen lesen und bearbeiten können. Allerdings sind die Inhalte und Themen auch so aneinandergereiht, dass Sie damit am besten eine systematische Einführung und einen optimalen Einstieg in die statistischen Grundlagen erhalten.

Natürlich ist es bei dem Umfang dieses Buches nicht möglich (und das werden Sie sicherlich auch nicht erwartet haben), jedes Detail in der Statistik zu behandeln. Zum Beispiel habe ich die Zeitreihenanalyse komplett ausgelassen. Auch für eine Behandlung der kompliziertesten Statistiken und Formeln ist hier leider nicht der Platz. Dazu sind schließlich die vielen anderen dicken Statistikwälzer da.

Törichte Annahmen über den Leser

Lassen Sie mich ein paar Vermutungen über Sie als Leser meines Buches anstellen:

Vielleicht bereiten Sie sich gerade auf eine Statistikprüfung in der Schule, in der Ausbildung oder in der Uni für das Fach Wirtschaftswissenschaften oder Sozialwissenschaften vor. Es kann auch sein, dass Sie statistische Informationen für Entscheidungen in Ihrer beruflichen Praxis benötigen oder Sie möchten einfach endlich mal die Formeln hinter den Statistiken, die Ihnen tagtäglich in Zeitungen, im Fernsehen und im Internet begegnen, kennenlernen und verstehen.

Die Aussage »Statistiken und statistische Formeln sind wirklich nur für Mathegenies oder in Zahlen verliebte Sonderlinge interessant« wäre eine durchaus törichte Annahme, wenn man sie auf den Leser von Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies beziehen würde.

Wenn Sie ein wenig Kenntnisse in der grundlegenden Schulmathematik mitbringen und ansonsten gerade begonnen haben, sich mit Statistik in Ihrem Fach, an der Hochschule oder in Ihrer beruflichen Praxis zu beschäftigen, dann ist Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies genau das richtige Buch für Sie. Aber auch wenn Sie bereits als Statistikprofi in der Lehre und Ausbildung auf dem Gebiet der Wirtschafts- und Sozialwissenschaften tätig sind, können Sie dieses Buch zur Einführung sinnvoll einsetzen. Sie sehen, selbst für richtige Profis hat es etwas anzubieten.

Wie dieses Buch aufgebaut ist

Wie die Statistik selbst besteht auch Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies – nach einem einführenden Teil – aus zwei großen Hauptteilen. In diesen Teilen spiegeln sich die beiden wesentlichen Gebiete oder auch das »Ying« und »Yang« der Statistik wieder: die beschreibende und die schließende Statistik. Und natürlich finden Sie in diesem Buch wie in allen Büchern der … für Dummies-Reihe auch einen Top-Ten-Teil.

Teil I: Ein paar statistische Grundlagen

Damit Sie nicht gleich ins eiskalte Wasser der statistischen Formelwelt gestoßen werden, erhalten Sie im ersten Teil erst einmal einen allgemeinen systematischen Einstieg in das Fachgebiet der Statistik. Hier werden der Zweck und die wesentlichen Aufgaben sowie der grundlegende Aufbau der Statistik vorgestellt. Damit Sie gleich kompetent informiert sind, erfahren Sie hier außerdem mehr über die Herkunft und Messung der Daten, mit denen Sie dann später Statistiken berechnen und die Ergebnisse interpretieren können.

Teil II: Die beschreibende Statistik

Teil II ist dem ersten großen Teilgebiet der Statistik gewidmet: der beschreibenden Statistik. Nach einer kurzen Erläuterung der Ziele und Aufgaben der beschreibenden Statistik stelle ich Ihnen die Darstellung von statistischen Daten in Tabellen und Diagrammen vor. Dann folgt die Behandlung der wichtigsten Statistiken. Dabei handelt es sich um zentrale Lagemaße, um Streuungsmaße und Zusammenhangsmaße. Natürlich dürfen dabei auch bedeutsame statistische Kennzahlen nicht fehlen.

Teil III: Die schließende Statistik

Um das zweite große Teilgebiet der Statistik, die schließende Statistik, geht es in Teil III. Sie lernen hier Wahrscheinlichkeiten verstehen und zu bestimmen, Wahrscheinlichkeitsverteilungen zu erkennen, zu unterscheiden und zur Berechnung von Wahrscheinlichkeiten anzuwenden. Darauf aufbauend erfahren Sie, wie Sie statistische Parameter schätzen sowie Vertrauensintervalle berechnen und sinnvoll nutzen können. Selbstverständlich erfahren Sie auch, wie Sie Hypothesen an der Realität überprüfen und testen können. So lernen Sie gleichsam alles Wichtige, was Sie unbedingt für die »Königsklasse« der Statistik im Bereich der Wirtschafts- und Sozialwissenschaften wissen müssen.

Teil IV: Der Top-Ten-Teil

Im Top-Ten-Teil, der in keinem … für Dummies-Buch fehlen darf, finden Sie die zehn wichtigsten Formeln der Statistik noch einmal auf einen Blick. Außerdem stelle ich den Prozess von der Datengewinnung bis zur Analyse in zehn Meilensteinen dar.

Symbole, die in diesem Buch verwendet werden

Tipp Dieses Symbol kennzeichnet hilfreiche Hinweise und Tipps, die Ihnen die Arbeit mit den Formeln und der statistischen Analyse erleichtern sollen.

Definition Dieses Symbol kennzeichnet Passagen, in denen wichtige Konzepte und Begriffe dargestellt und genauer erklärt werden. Das gibt Ihnen ein sicheres Verständnis der wichtigsten statistischen Konzepte.

Warnung Fehler sind dazu da, dass man aus ihnen lernen kann. Es erspart Ihnen aber viel Arbeit und Mühe, wenn Sie bestimmte Fehler erst gar nicht machen. Damit Sie nicht in das eine oder andere Fettnäpfchen treten, habe ich für Sie an den entsprechenden Stellen diese Warnschilder aufgestellt.

Wie es weitergeht

Als Newcomer fangen Sie am besten einfach am Anfang an und lesen das Buch von vorn bis hinten durch. So werden Sie systematisch in die Statistik eingeführt.

Jedes Kapitel ist aber auch für sich genommen verständlich, also springen Sie einfach in das Thema hinein, das Sie gerade beschäftigt, ganz wie Sie mögen. Viel Erfolg und Spaß dabei!

Teil I

Ein paar statistische Grundlagen

image

Kapitel 1

Was Statistik ist und warum sie benötigt wird

IN DIESEM KAPITEL

  • Ursprünge der Statistik und ihre Bedeutung heute
  • Ziele und Aufgaben der Statistik
  • Aufbau und wesentliche Bestandteile der Statistik

Statistik wird schon so lange betrieben wie es Mathematik gibt. Ihre Wurzeln reichen bis in die Zeit der Entstehung der Schrift vor mehr als 5000 Jahren zurück. Erste Volkszählungen gab es bereits bei den alten Ägyptern vor mehr als 2000 Jahren. Heute ist die Statistik selbst aus unserem Privatleben nicht mehr wegzudenken und allgegenwärtig. Jedes Mal, wenn Sie eine Zeitung aufschlagen, werden Sie darin Tabellen, Diagramme und statistische Kennzahlen zu den verschiedensten gesellschaftlichen, wirtschaftlichen und technischen Bereichen finden. Kaum eine Nachrichtensendung wird ausgestrahlt, ohne dass darin statistische Informationen enthalten sind. Es gibt keinen gesellschaftlichen, kulturellen, naturwissenschaftlichen, volkswirtschaftlichen und auch keinen betrieblichen Bereich in Unternehmen, für den nicht Statistiken erstellt werden. Selbst in der Unterhaltung und der Freizeit ist Statistik nicht wegzudenken. Denken Sie nur an die vielen Statistiken, die Sie in jeder Sportnachrichtensendung präsentiert bekommen. Ganz offenbar benötigt man heute in allen Bereichen menschlichen Handelns statistische Kenntnisse, wenn man informiert sein möchte oder mitreden will. Warum ist das so?

Warum Statistik?

Eine Antwort auf diese Frage können Sie finden, wenn Sie sich anschauen, um was es bei der Statistik geht. Statistik leitet sich aus dem lateinischen Wort »status« ab, was so viel wie Zustand, Verfassung oder Stand der Dinge meint. Antike Herrscher wollten sich bereits zu vorchristlichen Zeiten ein Bild vom Zustand ihres Staates machen und Informationen über die Verhältnisse im Lande gewinnen. Weil der Staat sich schon damals aus vielen Teilen zusammensetzte (zum Beispiel Menschen, Tieren, Weideflächen etc.), ging es darum, eine Vorstellung über den Zustand dieser »Massen« eines Staates insgesamt zu gewinnen. Die Information über die Zahl der Sklaven, Krieger, Frauen, Kinder, Rinder, Pferde, Boote, Ackerflächen etc. war für die Staatslenker von strategischer Bedeutung für ihre Entscheidungen.

images Auch heute noch geht es bei der Statistik um das zahlenmäßige Erfassen, Klassifizieren, Auswerten, Analysieren und Präsentieren von Daten über Massen, Gesamtheiten oder Populationen.

Die Statistik benötigen Sie vor allem, um informierte und das heißt richtige oder bessere Entscheidungen für Probleme treffen zu können, die sich nicht auf Einzelfälle, sondern auf Gesamtheiten oder Massenerscheinungen beziehen oder von denen ganze Bevölkerungen beziehungsweise Populationen betroffen sind. Beispielsweise müssen Politiker über Gesetze entscheiden, die das Wohl von Millionen von Bürgern beeinflussen; denken Sie nur mal an die Steuergesetzgebung.

Einsatzgebiete der Statistik

Die Anwendung der Methoden und Instrumente der Statistik finden Sie nicht nur in der Politik, Sie finden sie in allen gesellschaftlichen Bereichen. In nahezu jeder wissenschaftlichen Fachdisziplin (selbst in einem literaturwissenschaftlichen Studium) werden Sie den statistischen Methoden und Instrumenten begegnen. Die folgende Liste zeigt Ihnen Beispiele für betriebliche Einsatzgebiete für die Statistik innerhalb von Unternehmen:

  • Marktforschung: Konsumentenstrukturen und Präferenzen
  • Produktplanung: Wirtschaftstrends, detaillierte Verkaufsbudgets
  • Finanzanalysen: Jahresberichte, Kosten- und Einnahmedaten
  • Vorhersagen: Absatzentwicklung, Beschäftigungsentwicklung, Produktivitätsentwicklung
  • Prozess- und Qualitätskontrollen
  • Arbeitnehmerstatistik: Absentismus (eine Statistik, die sich mit dem Fernbleiben von Arbeitnehmern vom Arbeitsplatz zum Beispiel aufgrund von Krankheiten beschäftigt), Personalfluktuation

Bereiche der Statistik

Innerhalb der Statistik unterscheidet man zwei große Aufgabengebiete:

  • die deskriptive Statistik,
  • die schließende Statistik.

Beide Bereiche der Statistik informieren Sie über:

  • Zustände, die eine Gesamtheit oder eine Stichprobe von statistischen Einheiten hinsichtlich bestimmter Merkmale mengenmäßig charakterisieren (zum Beispiel die Bevölkerung eines Landes bezüglich des Umfangs von Arbeitslosigkeit, Einkommen und Vermögen)
  • Ursachen, Faktoren oder Gründe, die zu einem bestimmten Zustand in der Gesamtheit geführt haben (zum Beispiel warum nur wenige Personen in der Bevölkerung ein vergleichsweise deutlich höheres Einkommen haben)
  • Prognosen, die sich auf die künftige Entwicklung, wie sich die Gesamtheit bezüglich der betrachteten Merkmale in Zukunft entwickeln wird, beziehen (zum Beispiel darüber, wie sich die Lücke zwischen den besser Verdienenden und der übrigen Bevölkerung verändern wird)
  • Techniken, um bestimmte Zustände oder Ziele zu erreichen (zum Beispiel, dass sich die Lücke zwischen Arm und Reich in der Bevölkerung durch bessere Bildung und Qualifikation in den unteren Schichten der Gesellschaft schließen lässt)
  • Schlussfolgerungen, das heißt mögliche Ansatzpunkte für weitere Hypothesen und Theorien, die aus den Daten gewonnen werden können

Die deskriptive und die schließende Statistik bilden die beiden wichtigsten Gebiete in der Statistik. Gemäß dieser Unterscheidung ist auch Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies entsprechend aufgebaut. Abbildung 1.1 fasst die statistischen Teilgebiete, wie sie auch in den Formeln und Kapiteln dieses Buches thematisiert werden, zusammen.

image

Abbildung 1.1: Übersicht über die Teilgebiete der Statistik

Die deskriptive oder beschreibende Statistik

Wie schon im Namen zum Ausdruck kommt, dient Ihnen die deskriptive Statistik, die manchmal auch beschreibende Statistik genannt wird, der genauen Beschreibung von statistischen Gesamtheiten.

images Die deskriptive Statistik dient dazu, anhand von Stichproben Fakten und Daten über Populationen, die auch Grundgesamtheiten genannt werden, zu sammeln, sie für die Analyse aufzubereiten, sie auszuwerten, zu analysieren und zu interpretieren sowie sie systematisch, geordnet und informativ darzustellen.

Die Beschreibung der Sie interessierenden Eigenschaften der Gesamtheit erfolgt dabei anhand von statistischen Tabellen, Diagrammen oder zusammenfassenden Zahlen (zum Beispiel welche Einkommensstruktur, welchen Altersaufbau und welchen Bildungsgrad die Bevölkerung Deutschlands am Anfang des Jahres 2013 hatte).

images Die Gesamtheit, die oft auch als Grundgesamtheit, Population oder statistische Masse bezeichnet wird, ist die Gesamtzahl oder die Menge aller Objekte oder Personen beziehungsweise der »statistischen Einheiten«, über die »statistische Daten« und Informationen gewonnen werden sollen. Die Eigenschaften, nach denen die statistischen Einheiten analysiert werden sollen, heißen statistische Merkmale oder Variablen.

Lassen Sie mich diese Begriffe an einem kleinen Beispiel erörtern. Stellen Sie sich vor, Sie wären zum Beispiel an der Verteilung des durchschnittlichen Einkommens von Männern und Frauen in einer bestimmten beruflichen Position interessiert. Die Grundgesamtheit besteht in diesem Fall einfach aus allen Erwerbstätigen in dieser beruflichen Position. Jeder einzelne dieser Erwerbstätigen ist dabei eine statistische Einheit. Es werden zwei statistische Merkmale an diesen Einheiten erhoben: das durchschnittliche Einkommen und das Geschlecht. Da unterschiedliche Personen ein unterschiedliches Einkommen haben werden, ist hier auch der Begriff »Variable« sinnvoll.

Nachdem Sie die Daten gesammelt haben, geht es im nächsten Schritt darum, sie möglichst gut darzustellen, um charakteristische Strukturen innerhalb der Daten erkennen zu können.

Die Möglichkeiten, Instrumente oder Formen der Beschreibung reichen von eindimensionalen Tabellen und Diagrammen über einfache statistische Kennzahlen bis hin zu komplexen mehrdimensionalen statistischen Analysetools.

Instrumente der Statistik

Zu den wichtigsten Instrumenten der deskriptiven Statistik zählen:

  • Datentabellen: Tabellen, in denen die Daten zu den betrachteten statistischen Merkmalen systematisch zusammengefasst präsentiert werden (mehr erfahren Sie darüber in Kapitel 3)
  • Diagramme: Daten der statistischen Merkmale in Form von Bildern anschaulich und informativ präsentieren (siehe auch Kapitel 3)
  • Zentrale Lagemaße: Statistiken, die in einer Zahl die Werte eines statistischen Merkmals beschreiben (zum Beispiel das arithmetische Mittel, das Ihnen das durchschnittliche Einkommen des Merkmals »Bevölkerungseinkommen« mitteilt; mehr hierzu in Kapitel 4)
  • Streuungsmaße: Statistiken, die in einer Zahl mitteilen, wie weit die einzelnen Werte eines Merkmals vom Durchschnitt entfernt liegen (wie stark zum Beispiel die einzelnen Einkommen in der Bevölkerung vom Durchschnittseinkommen entfernt sind; mehr hierzu in Kapitel 5)
  • Kennzahlen: Zahlen, die die Werte anderer statistischer Kennzahlen zusammenfassen (zum Beispiel der Preisindex für Lebenshaltungskosten, der die Information über die Preisentwicklung vieler verschiedener Güter in einer Zahl komprimiert; mehr hierzu in Kapitel 6)
  • Zusammenhangsmaße: statistische Maßzahlen, die auch als Koeffizienten bezeichnet werden, die die Stärke der Beziehung zwischen verschiedenen statistischen Merkmalen beschreiben (zum Beispiel inwiefern die Höhe des Einkommens von der Länge der Berufserfahrung abhängt; mehr hierzu in Kapitel 7)

Die zentralen Instrumente der deskriptiven Statistik, die Sie im Detail in Teil II kennenlernen, sind

  • Präsentation statistischer Informationen mithilfe von Diagrammen,
  • Zusammenfassung von Daten einzelner Merkmale beziehungsweise Variablen mithilfe zentraler Lagemaße,
  • Berechnung von Streuungsmaßen zur Beschreibung der Abweichung der einzelnen Werte von den zentralen Lagemaßen,
  • Ermittlung und Beschreibung der Beziehung zwischen einzelnen statistischen Merkmalen mithilfe von Zusammenhangsmaßen.

Datenmessung mit Niveau

Die so beschriebenen und analysierten Merkmale können auf verschiedene Weise gemessen werden (zu den Messniveaus erfahren Sie mehr in Kapitel 2):

  • nominal, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich nur unterscheiden
  • ordinal, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zudem in eine Rangordnung bringen
  • metrisch, das heißt, die Unterschiede in den möglichen Werten eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zusätzlich mithilfe genormter Messeinheiten quantifizieren beziehungsweise zahlenmäßig in ihrer Größenordnung ausdrücken

Die deskriptiven Statistiken und ihre Zuordnung zu den jeweiligen Messniveaus sehen Sie im Überblick in Tabelle 1.1. Außerdem können Sie der Tabelle entnehmen, in welchen Kapiteln die erwähnten Themen behandelt werden.

Statistiken

Skalenniveaus

Nominal

Ordinal

Metrisch

Maße der Tendenz beziehungs-weise Lagemaße

  • Modus

(siehe Kapitel 4)

  • Median

  • Quartile

  • Perzentile

(siehe Kapitel 4)

  • arithmetisches Mittel

  • gewichtetes Mittel

  • geometrisches Mittel

(siehe Kapitel 4)

Maße der Variabilität

nicht sinnvoll, da Zahlen nicht von Bedeutung sind und nur zur Unterscheidung der Kategorien der Merkmale dienen

  • Abstand

  • interquartiler Abstand

(siehe Kapitel 5)

  • mittlere Abweichung

  • Varianz

  • Standardabweichung

  • Variationskoeffizient

(siehe Kapitel 5)

Beziehungs-maße

  • Chi-Quadrat

  • Pearsons Kontingenz

(siehe Kapitel 7)

  • Spearmans Rangkorre-lation

(siehe Kapitel 7)

  • Bravais-Pearson-Korrelation

  • Kovarianz

    (siehe Kapitel 7)

  • Regressionskoeffizient

  • Determinationskoeffizient

(siehe Kapitel 8)

Tabelle 1.1: Der Zusammenhang zwischen Statistiken und Messniveaus

Die Statistiken der deskriptiven Statistik sind nur für die in der Untersuchung erfassten Untersuchungseinheiten aussagekräftig und für die in die Berechnung einbezogenen Daten, das heißt, Sie können die daraus resultierenden Ergebnisse auch nur auf die analysierten Fälle und Daten beziehen und nicht auf andere Fälle übertragen.

Auch wenn Ihnen eine Stichprobe von Daten aus einer umfassenderen Gesamtheit vorliegt, können Sie statistische Ergebnisse, die Sie anhand der Methoden, Instrumente und Statistiken der deskriptiven Statistik gewonnen haben, nur auf die Daten in dieser Stichprobe beziehen und nicht auf die Gesamtheit, aus der die Stichprobe kommt. Wenn Sie das tun wollen, müssen Sie über die deskriptive Statistik hinaus auf das Instrumentarium der schließenden Statistik zurückgreifen.

Die schließende Statistik oder Inferenzstatistik

Die schließende Statistik (auch Inferenzstatistik oder induktive Statistik genannt) ist neben der deskriptiven Statistik die zweite wesentliche Säule der Statistik. Sie benötigen sie zusätzlich immer dann, wenn Sie nicht alle für eine Analyse interessanten Fälle in Ihre Datenerhebung einbeziehen können. Ihnen steht somit nur ein Teil oder eine Stichprobe der Daten aus der Gesamtheit der Untersuchungseinheiten für die Analyse zur Verfügung. Sie möchten aber dennoch etwas über die Verhältnisse in der Gesamtheit aussagen.

Wählen Sie nur einen Teil der statistischen Einheiten aus der Grundgesamtheit für die statistischen Analysen aus, so handelt es sich um eine Teilerhebung beziehungsweise Stichprobe. Anhand der Ergebnisse der statistischen Analysen mit der Stichprobe wollen Sie auf die entsprechenden Werte in der betreffenden Grundgesamtheit schließen. Aus dieser Aufgabe ergibt sich auch der Name für die schließende Statistik, die auch oft als Inferenzstatistik bezeichnet wird, was aber nichts anderes bedeutet. Die Grundlage dafür, dass Sie aus den Ergebnissen einer Stichprobe einen repräsentativen Schluss auf die Verhältnisse in der Grundgesamtheit ziehen können, ist die Wahrscheinlichkeitsrechnung. Darauf bauen die statistischen Schätzverfahren und die Methoden zum Testen von Hypothesen auf.

images Eine Hypothese ist eine noch nicht anhand von Daten systematisch überprüfte und analysierte oder bestätigte Behauptung, Aussage oder Vermutung.

Instrumente der schließenden Statistik

Besonders wichtige Konzepte, Verfahren und Instrumente, die Sie in der schließenden Statistik antreffen, sind:

  • Zufallsexperiment: ein Experiment, dessen mögliche Ereignisse zufällig mit einer bestimmten Wahrscheinlichkeit auftreten und daher nicht eindeutig vorhergesagt werden können (mehr hierzu in Kapitel 10)
  • Zufallsvariablen: die bei dem Experiment betrachteten Merkmale, deren Werte zufällig auftreten (siehe Kapitel 10)
  • Wahrscheinlichkeitsverteilung: die den möglichen Werten der Zufallsvariablen zugeordneten Wahrscheinlichkeiten (mehr hierzu in Kapitel 11 und Kapitel 12)
  • Stichprobe: ein Teil einer statistischen Gesamtheit; anhand der Stichprobe gewinnen Sie statistische Informationen über diese Gesamtheit (siehe dazu Kapitel 13)
  • Schätzverfahren: ein Verfahren, mit dem Sie von den Daten beziehungsweise Ergebnissen aus einer Stichprobe auf die Verhältnisse in der statistischen Gesamtheit schließen (mehr hierzu in Kapitel 14)
  • Parameter- und Hypothesentest:Kapitel 15

Aufgaben der schließenden Statistik

Zwei Aufgabentypen der schließenden Statistik sind besonders wichtig:

  • Schätzung der Werte nicht bekannter Grundgesamtheitsparameter (wie das arithmetische Mittel einer Variablen in einer Population)

    Zum Beispiel können Sie die durchschnittlichen Einkommen der Männer und Frauen einer Stichprobe berechnen und mithilfe der Verfahren der schließenden Statistik auf die Durchschnittseinkommen von Männern und Frauen in der gesamten Population, aus der Sie die Stichprobe gezogen haben, schließen.

  • Hypothesentest über die Werte von Populationsparametern (zum Beispiel darüber, dass das arithmetische Mittel einen bestimmten Wert hat)

    Ausgehend von einer Hypothese über die Durchschnittseinkommen von Männern und Frauen in der gesamten Population erheben Sie eine Stichprobe aus der Gesamtpopulation und überprüfen anhand der Daten aus der Stichprobe und mithilfe der Verfahren der schließenden Statistik, ob die Hypothese zutrifft oder nicht. Wenn Sie in unserem Beispiel die Annahme haben, dass Frauen und Männer in gleichen beruflichen Positionen das gleiche Einkommen erzielen, können Sie diese Annahme auf diese Weise »empirisch«, das heißt erfahrungsgestützt, überprüfen.

images Um zuverlässig schließen zu können, benötigen Sie eine repräsentative Stichprobe von Männern und Frauen mit der betreffenden beruflichen Position sowie zuverlässige Angaben über deren Einkommen. Repräsentativ ist eine Stichprobe dann, wenn sie sozusagen ein Abbild der Grundgesamtheit ist. Eine wesentliche Bedingung dafür ist die zufällige Auswahl der Fälle in die Erhebung. Erst unter dieser Voraussetzung ist es möglich, anhand der Ergebnisse der Stichproben festzustellen, mit welcher Wahrscheinlichkeit die Hypothese der Wirklichkeit entspricht.

Gründe für Stichproben und schließende Statistik

Die Beschränkung auf eine Stichprobe und damit der Rückgriff auf die schließende Statistik bietet sich vor allem dann an, wenn Sie

  • zu hohe Kosten für die Datenerhebung vermeiden wollen,
  • den zeitlichen Aufwand für die Datenerhebung verringern wollen und/oder
  • aus sachlogischen, praktischen Gründen auf eine Total- oder Gesamterhebung zugunsten einer Stichprobe verzichten müssen.

Beispielhaft für den Fall des Verzichts aus sachlogischen Gründen auf eine Vollerhebung ist die Qualitätskontrolle im Bereich der Herstellung von Produkten, in dem Sie die Haltbarkeit testen wollen. Wenn Sie alle Produkte, die Sie herstellen, einem Haltbarkeitstest zuführen würden, hätten Sie am Ende keine Produkte mehr, die Sie Ihren Kunden anbieten könnten. Es ist also praktisch gar nicht möglich, alle Produkte auf ihre Haltbarkeit hin zu testen. Natürlich würde es auch viel mehr Zeit beanspruchen und Kosten verursachen, wenn Sie statt einer repräsentativen Stichprobe alle Produkte testen wollten.