cover.eps

Impressum

Bibliografische Information der Deutschen Nationalbibliothek

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d‐nb.de abrufbar.

1. Auflage 2017

© 2017 WILEY‐VCH Verlag GmbH & Co. KGaA, Weinheim

Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form.

Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.

Wiley, die Bezeichnung »Für Dummies«, das Dummies‐Mann‐Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.

Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.

Coverfoto: © iStock.com/Pogonici

Korrektur: Frauke Wilkens, München

E-Book: Beltz Bad Langensalza GmbH, Bad Langensalza

Print ISBN: 978‐3‐527‐71313‐4

ePub ISBN: 978‐3‐527‐80507‐5

mobi ISBN: 978‐3‐527‐80506‐8

Über den Autor

Thomas Krickhahn hat Wirtschafts‐ und Sozialwissenschaften studiert und an der philosophischen Fakultät der Martin‐Luther‐Universität in Halle‐Wittenberg promoviert (1995). Er hat eine mehrjährige Erfahrung im Bereich der empirischen Wirtschaftsforschung als Forschungsassistent und wissenschaftlicher Gutachter. Auch als Dozent ist er unter anderem in den Bereichen Statistik, Volkswirtschaftslehre, quantitative Methoden und Betriebswirtschaftslehre (an Weiterbildungseinrichtungen, Fachhochschulen und Universitäten) langjährig tätig. Er ist Autor mehrerer Publikationen im Bereich der wirtschafts‐ und sozialwissenschaftlichen Forschung und Lehre. Zurzeit ist er als wissenschaftlicher Projektleiter an der Hochschule Bonn‐Rhein‐Sieg und als Dozent für die Bonner Akademie (Gesellschaft für DV‐ und Management‐Training, Bildung und Beratung mbH) tätig.

Über die naturwissenschaftliche Begleitung

Thoralf Räsch studierte Mathematik und Informatik an der Humboldt‐Universität zu Berlin und promovierte an der Universität Potsdam im Bereich der Mathematischen Logik. Zurzeit ist er Akademischer Oberrat am Mathematischen Institut der Universität Bonn und unterrichtet dort seit mehr als zehn Jahren Mathematik in verschiedenen Bachelorstudiengängen der Mathematisch‐Naturwissenschaftlichen Fakultät. Außerdem engagiert er sich schon seit mehr als fünfzehn Jahren in verschiedenen Projekten für Schülerinnen und Schüler, in denen auf unterschiedlichem Niveau begeisternd in die Welt der Mathematik eingeführt wird.

Über den Fachkorrektor

Dominik Poß studierte Volkswirtschaftslehre an der Rheinischen Friedrich‐Wilhelms‐Universität Bonn. Bereits während seines Studiums legte er sein Augenmerk auf das Fachgebiet Statistik und begleitete als Tutor erfolgreich zahlreiche Studenten durch die Grundvorlesungen der Statistik.

Zurzeit ist er Doktorand an der Bonn Graduate School of Economics und beschäftigt sich am Institut für Finanzmarktökonomik und Statistik der Universität Bonn mit der Analyse von funktionalen Daten, hochdimensionalen Regressionsproblemen und der Variablenselektion.

Danksagung

Die Niederschrift von Büchern ist mit viel Zeit verbunden. Zeit, die der Autor nicht seinen Nächsten widmen kann. Mein Dank gilt daher zuallererst meiner lieben Frau, Susanne Krickhahn. Die Qualität des Werkes hängt nicht zuletzt auch an den Menschen, die bei der Erstellung unterstützend mitgewirkt haben. Meiner Lektorin, Frau Esther Neuendorf, und meinem Fachlektor, Herrn Dominik Poß, bin ich für die vielen wertvollen Hinweise und Korrekturen sehr dankbar. Besonders freue ich mich auch über die Unterstützung von Herrn Dr. Thoralf Räsch hinsichtlich der fachlichen Anpassung des Skripts auf den naturwissenschaftlichen Bereich.

Bonn, Herbst 2016

Thomas Krickhahn

Einführung

Die Statistik und statistische Formeln spielen gerade in den Naturwissenschaften, aber natürlich auch in den anderen Wissenschaften, ja darüber hinaus in nahezu allen privaten und beruflichen Lebensbereichen eine Rolle.

Auch wenn Sie sich dieses Buch zugelegt haben, um Ihren Statistikschein zu erwerben, werden Sie sicher auch in ganz anderen Situationen davon profitieren, glauben Sie’s mir!

Über dieses Buch

Statistik für Naturwissenschaftler für Dummies enthält die wichtigsten statistischen Instrumente und Formeln, die Sie im Bereich der Naturwissenschaften benötigen.

Es ist insbesondere für Schüler, Studierende und Lehrende aus dem Bereich der Naturwissenschaften konzipiert. Und da Statistik viel mit Formeln zu tun hat, wird in diesem Buch dem Verständnis und der Anwendungskompetenz der einzelnen statistischen Formeln besondere Bedeutung beigemessen. Zu jeder statistischen Formel finden Sie

  • eine Erläuterung des Zwecks, der Aufgabe und der Anwendungsbedingungen,

  • eine Beschreibung der einzelnen Symbole in der Formel,

  • eine Darstellung der einzelnen Arbeitsschritte zur Berechnung der Formel,

  • ein konkretes Anwendungsbeispiel mit vollständigem und erläutertem Lösungsweg sowie

  • eine Interpretation der jeweiligen Lösung beziehungsweise des Ergebnisses.

Sie sehen es schon, es ist das Anliegen von Statistik für Naturwissenschaftler für Dummies, Ihnen die Statistiken und ihre Formeln nicht nur sozusagen vor die Füße zu kippen, sondern Ihnen auch nötiges Hintergrund‐ und Zusammenhangswissen zu vermitteln. Insbesondere durch die detaillierte Beschreibung der einzelnen Arbeitsschritte, die Sie bei der Anwendung der Formeln durchlaufen müssen, und durch die Beispiele mit ihren vollständigen Lösungswegen und Ergebnisinterpretationen wird die Voraussetzung dafür geschaffen, dass Sie die Statistiken und Formeln garantiert auch in der privaten und beruflichen Praxis erfolgreich anwenden können.

Anspruch und Ziel ist dabei aber immer:

  • leichte Lesbarkeit,

  • Verständlichkeit der Anleitungen,

  • praktische Anwendbarkeit und

  • systematische und einheitliche Darstellungsweise.

Jedes Kapitel ist so aufgebaut, dass Sie es unabhängig von den anderen lesen und bearbeiten können. Allerdings sind die Inhalte und Themen auch so aneinandergereiht, dass Sie damit am besten eine systematische Einführung und einen optimalen Einstieg in die statistischen Grundlagen erhalten.

Natürlich ist es bei dem Umfang dieses Buches nicht möglich (und das werden Sie sicherlich auch nicht erwartet haben), jedes Detail in der Statistik zu behandeln. Zum Beispiel habe ich die Zeitreihenanalyse komplett ausgelassen. Auch für eine Behandlung der kompliziertesten Statistiken und Formeln ist hier leider nicht der Platz. Dazu sind schließlich die vielen anderen dicken Statistikwälzer da.

Törichte Annahmen über den Leser

Lassen Sie mich ein paar Vermutungen über Sie als Leser meines Buches anstellen:

Vielleicht bereiten Sie sich gerade auf eine Statistikprüfung in der Schule, in der Ausbildung oder in der Uni für das Fach Mathematik, Physik, Biologie, Chemie oder verwandte andere Naturwissenschaften vor. Es kann auch sein, dass Sie statistische Informationen für Entscheidungen in Ihrer beruflichen Praxis benötigen, oder Sie möchten einfach endlich mal die Formeln hinter den Statistiken, die Ihnen tagtäglich in Zeitungen, im Fernsehen und im Internet begegnen, kennenlernen und verstehen.

Die Aussage »Statistiken und statistische Formeln sind wirklich nur für Mathegenies oder in Zahlen verliebte Sonderlinge interessant« wäre eine durchaus törichte Annahme, wenn man sie auf den Leser von Statistik für Naturwissenschaftler für Dummies beziehen würde.

Wenn Sie ein wenig Kenntnisse in der grundlegenden Schulmathematik mitbringen und ansonsten gerade begonnen haben, sich mit Statistik in Ihrem Fach, an der Hochschule oder in Ihrer beruflichen Praxis zu beschäftigen, dann ist Statistik für Naturwissenschaftler für Dummies genau das richtige Buch für Sie. Aber auch wenn Sie bereits als Statistikprofi in der Lehre und Ausbildung auf dem Gebiet der Naturwissenschaften tätig sind, können Sie dieses Buch zur Einführung sinnvoll einsetzen. Sie sehen, selbst für richtige Profis hat es etwas anzubieten.

Wie dieses Buch aufgebaut ist

Wie die Statistik selbst besteht auch Statistik für Naturwissenschaftler für Dummies – nach einem einführenden Teil – aus zwei großen Hauptteilen. In diesen Teilen spiegeln sich die beiden wesentlichen Gebiete oder auch das »Ying« und »Yang« der Statistik wieder: die beschreibende und die schließende Statistik. Und natürlich finden Sie in diesem Buch wie in allen Büchern der … für Dummies‐Reihe auch einen Top‐Ten‐Teil.

Teil I: Ein paar statistische Grundlagen

Damit Sie nicht gleich ins eiskalte Wasser der statistischen Formelwelt gestoßen werden, erhalten Sie im ersten Teil erst einmal einen allgemeinen systematischen Einstieg in das Fachgebiet der Statistik. Hier werden der Zweck und die wesentlichen Aufgaben sowie der grundlegende Aufbau der Statistik vorgestellt. Damit Sie gleich kompetent informiert sind, erfahren Sie hier außerdem mehr über die Herkunft und Messung der Daten, mit denen Sie dann später Statistiken berechnen und die Ergebnisse interpretieren können.

Teil II: Die beschreibende Statistik

Teil II ist dem ersten großen Teilgebiet der Statistik gewidmet: der beschreibenden Statistik. Nach einer kurzen Erläuterung der Ziele und Aufgaben der beschreibenden Statistik stelle ich Ihnen die Darstellung von statistischen Daten in Tabellen und Diagrammen vor. Dann folgt die Behandlung der wichtigsten Statistiken. Dabei handelt es sich um zentrale Lagemaße, um Streuungsmaße und Zusammenhangsmaße. Natürlich dürfen dabei auch bedeutsame statistische Kennzahlen nicht fehlen.

Teil III: Die schließende Statistik

Um das zweite große Teilgebiet der Statistik, die schließende Statistik, geht es in Teil III. Sie lernen hier Wahrscheinlichkeiten verstehen und zu bestimmen, Wahrscheinlichkeitsverteilungen zu erkennen, zu unterscheiden und zur Berechnung von Wahrscheinlichkeiten anzuwenden. Darauf aufbauend erfahren Sie, wie Sie statistische Parameter schätzen sowie Vertrauensintervalle berechnen und sinnvoll nutzen können. Selbstverständlich erfahren Sie auch, wie Sie Hypothesen an der Realität überprüfen und testen können. So lernen Sie gleichsam alles Wichtige, was Sie unbedingt für die »Königsklasse« der Statistik im Bereich der Wirtschafts‐ und Sozialwissenschaften wissen müssen.

Teil IV: Der Top‐Ten‐Teil

Im Top‐Ten‐Teil, der in keinem … für Dummies‐Buch fehlen darf, finden Sie die zehn wichtigsten Formeln der Statistik noch einmal auf einen Blick. Außerdem stelle ich den Prozess von der Datengewinnung bis zur Analyse in zehn Meilensteinen dar.

Symbole, die in diesem Buch verwendet werden

  • Dieses Symbol kennzeichnet hilfreiche Hinweise und Tipps, die Ihnen die Arbeit mit den Formeln und der statistischen Analyse erleichtern sollen.

  • Dieses Symbol kennzeichnet Passagen, in denen wichtige Konzepte und Begriffe dargestellt und genauer erklärt werden. Das gibt Ihnen ein sicheres Verständnis der wichtigsten statistischen Konzepte.

  • Fehler sind dazu da, dass man aus ihnen lernen kann. Es erspart Ihnen aber viel Arbeit und Mühe, wenn Sie bestimmte Fehler erst gar nicht machen. Damit Sie nicht in das eine oder andere Fettnäpfchen treten, habe ich für Sie an den entsprechenden Stellen diese Warnschilder aufgestellt.

Wie es weitergeht

Als Newcomer fangen Sie am besten einfach am Anfang an und lesen das Buch von vorn bis hinten durch. So werden Sie systematisch in die Statistik eingeführt.

Jedes Kapitel ist aber auch für sich genommen verständlich, also springen Sie einfach in das Thema hinein, das Sie gerade beschäftigt, ganz wie Sie mögen. Viel Erfolg und Spaß dabei!

Teil I

Ein paar statistische Grundlagen

figure

In diesem Teil …

Hier gebe ich Ihnen einen kleinen Überblick über die wesentlichen Aufgaben und den Zweck der Statistik und deren Aufbau und Systematik.

Ich erkläre, wo Sie die Daten und Zahlen herbekommen, auf die die statistischen Formeln angewendet werden.

Wenn Sie diese Zusammenhänge kennen, können Sie entscheiden, welche Statistik Sie am besten für welches statistische Problem nutzen.

Kapitel 1

Was Statistik ist und warum sie benötigt wird

In diesem Kapitel

  • Ursprünge der Statistik und ihre Bedeutung heute

  • Ziele und Aufgaben der Statistik

  • Aufbau und wesentliche Bestandteile
    der Statistik

Statistik wird schon so lange betrieben wie es Mathematik gibt. Ihre Wurzeln reichen bis in die Zeit der Entstehung der Schrift vor mehr als 5000 Jahren zurück. Erste Volkszählungen gab es bereits bei den alten Ägyptern vor mehr als 2000 Jahren. Heute ist die Statistik selbst aus unserem Privatleben nicht mehr wegzudenken und allgegenwärtig. Jedes Mal, wenn Sie eine Zeitung aufschlagen, werden Sie darin Tabellen, Diagramme und statistische Kennzahlen zu den verschiedensten gesellschaftlichen, wirtschaftlichen und technischen Bereichen finden. Kaum eine Nachrichtensendung wird ausgestrahlt, ohne dass darin statistische Informationen enthalten sind. Es gibt keinen gesellschaftlichen, kulturellen, naturwissenschaftlichen, volkswirtschaftlichen und auch keinen betrieblichen Bereich in Unternehmen, für den nicht Statistiken erstellt werden. Selbst in der Unterhaltung und der Freizeit ist Statistik nicht wegzudenken. Denken Sie nur an die vielen Statistiken, die Sie in jeder Sportnachrichtensendung präsentiert bekommen. Ganz offenbar benötigt man heute in allen Bereichen menschlichen Handelns statistische Kenntnisse, wenn man informiert sein möchte oder mitreden will. Warum ist das so?

Warum Statistik?

Eine Antwort auf diese Frage können Sie finden, wenn Sie sich anschauen, um was es bei der Statistik geht. Statistik leitet sich aus dem lateinischen Wort »status« ab, was so viel wie Zustand, Verfassung oder Stand der Dinge meint. Antike Herrscher wollten sich bereits zu vorchristlichen Zeiten ein Bild vom Zustand ihres Staates machen und Informationen über die Verhältnisse im Lande gewinnen. Weil der Staat sich schon damals aus vielen Teilen zusammensetzte (zum Beispiel Menschen, Tieren, Weideflächen etc.), ging es darum, eine Vorstellung über den Zustand dieser »Massen« eines Staates insgesamt zu gewinnen. Die Information über die Zahl der Sklaven, Krieger, Frauen, Kinder, Rinder, Boote, Ackerflächen etc. war für die Staatslenker von strategischer Bedeutung für ihre Entscheidungen.

  • Auch heute noch geht es bei der Statistik um das zahlenmäßige Erfassen, Klassifizieren, Auswerten, Analysieren und Präsentieren von Daten über Massen, Gesamtheiten oder Populationen.

Die Statistik benötigen Sie vor allem, um informierte und das heißt richtige oder bessere Entscheidungen für Probleme treffen zu können, die sich nicht auf Einzelfälle, sondern auf Gesamtheiten oder Massenerscheinungen beziehen oder von denen ganze Bevölkerungen beziehungsweise Populationen betroffen sind. Beispielsweise müssen Politiker über Gesetze entscheiden, die das Wohl von Millionen von Bürgern beeinflussen; denken Sie nur mal an die Steuergesetzgebung.

Einsatzgebiete der Statistik

Die Anwendung der Methoden und Instrumente der Statistik finden Sie nicht nur in der Politik, Sie finden sie in allen gesellschaftlichen Bereichen. In nahezu jeder wissenschaftlichen Fachdisziplin (selbst in einem literaturwissenschaftlichen Studium) werden Sie den statistischen Methoden und Instrumenten begegnen. Die folgende Liste zeigt exemplarisch, welche grundlegenden Aufgaben der Statistik in den Naturwissenschaften Anwendung finden:

  • zur Überprüfung von Hypothesen naturwissenschaftlicher Gesetze, zum Beispiel ob die These stimmt, dass die Schwerkraft das Licht beugen kann

  • zur Schätzung von bestimmten naturwissenschaftlichen Größen aus einer Stichprobe für die entsprechende Grundgesamtheit, zum Beispiel den Anteil der roten Blutkörper bei gesunden Menschen anhand einer Stichprobe

  • zur Berechnung von naturwissenschaftlichen Zusammenhängen zum Beispiel zwischen dem CO2‐Ausstoß und dem Klimawandel beziehungsweise der Entwicklung der durchschnittlichen Temperatur auf der Erde

  • zur mengenmäßigen Beschreibung von verschiedenen Pflanzenarten in einem Naturhabitat und so weiter.

Bereiche der Statistik

Innerhalb der Statistik unterscheidet man zwei große Aufgabengebiete:

  • die deskriptive (oder auch beschreibende) Statistik und

  • die schließende Statistik.

Beide Bereiche der Statistik informieren Sie über:

  • Zustände, die eine Gesamtheit oder eine Stichprobe von statistischen Einheiten hinsichtlich bestimmter Merkmale mengenmäßig charakterisieren (zum Beispiel die Bevölkerung eines Landes bezüglich des Umfangs von Arbeitslosigkeit, Einkommen und Vermögen)

  • Ursachen, Faktoren oder Gründe, die zu einem bestimmten Zustand in der Gesamtheit geführt haben (zum Beispiel warum nur wenige Personen in der Bevölkerung ein vergleichsweise deutlich höheres Einkommen haben)

  • Prognosen, die sich auf die künftige Entwicklung, wie sich die Gesamtheit bezüglich der betrachteten Merkmale in Zukunft entwickeln wird, beziehen (zum Beispiel darüber, wie sich die Lücke zwischen den besser Verdienenden und der übrigen Bevölkerung verändern wird)

  • Techniken, um bestimmte Zustände oder Ziele zu erreichen (zum Beispiel, dass sich die Lücke zwischen Arm und Reich in der Bevölkerung durch bessere Bildung und Qualifikation in den unteren Schichten der Gesellschaft schließen lässt)

  • Schlussfolgerungen, das heißt mögliche Ansatzpunkte für weitere Hypothesen und Theorien, die aus den Daten gewonnen werden können

Die deskriptive und die schließende Statistik bilden die beiden wichtigsten Gebiete in der Statistik. Gemäß dieser Unterscheidung ist auch Statistik für Naturwissenschaftler für Dummies entsprechend aufgebaut. Abbildung 1.1 fasst die statistischen Teilgebiete, wie sie auch in den Formeln und Kapiteln dieses Buches thematisiert werden, zusammen.

figure

Abbildung 1.1: Übersicht über die Teilgebiete der Statistik

Die deskriptive oder beschreibende Statistik

Wie schon im Namen zum Ausdruck kommt, dient Ihnen die deskriptive Statistik, die manchmal auch beschreibende Statistik genannt wird, der genauen Beschreibung von statistischen Gesamtheiten.

  • Die deskriptive Statistik dient dazu, anhand von Stichproben Fakten und Daten über Populationen, die auch Grundgesamtheiten genannt werden, zu sammeln, sie für die Analyse aufzubereiten, sie auszuwerten, zu analysieren und zu interpretieren sowie sie systematisch, geordnet und informativ darzustellen.

Die Beschreibung der Sie interessierenden Eigenschaften der Gesamtheit erfolgt dabei anhand von statistischen Tabellen, Diagrammen oder zusammenfassenden Zahlen (zum Beispiel der Wachstumserfolg verschiedener Saatgüter, welche Ernteentwicklung und welchen Düngemitteleinsatz Sie in den Ländereien des Rhein‐Sieg‐Kreises am Anfang des Jahres 2016 hatten).

  • Die Gesamtheit, die oft auch als Grundgesamtheit, Population oder statistische Masse bezeichnet wird, ist die Gesamtzahl oder die Menge aller Objekte oder Personen beziehungsweise der »statistischen Einheiten«, über die »statistische Daten« und Informationen gewonnen werden sollen. Die Eigenschaften, nach denen die statistischen Einheiten analysiert werden sollen, heißen statistische Merkmale oder Variablen.

Lassen Sie mich diese Begriffe an einem kleinen Beispiel erörtern. Stellen Sie sich vor, Sie wären zum Beispiel an der Verteilung des durchschnittlichen Einkommens von Männern und Frauen in einer bestimmten beruflichen Position interessiert. Die Grundgesamtheit besteht in diesem Fall einfach aus allen Erwerbstätigen in dieser beruflichen Position. Jeder einzelne dieser Erwerbstätigen ist dabei eine statistische Einheit. Es werden zwei statistische Merkmale an diesen Einheiten erhoben: das durchschnittliche Einkommen und das Geschlecht. Da unterschiedliche Personen ein unterschiedliches Einkommen haben werden, ist hier auch der Begriff »Variable« sinnvoll. Es muss aber auch nicht immer um das liebe Geld gehen – Sie können auch an der Verteilung der Ernteerfolge der Zuckerrüben auf den Feldern in NRW interessiert sein. Die Grundgesamtheit besteht dann einfach aus den Ländereien selbst, die jeweils die statistischen Einheiten bilden. Als statistische Merkmale können Sie pro Länderei die Größe und die Ertragsmenge sammeln.

Nachdem Sie die Daten gesammelt haben, geht es im nächsten Schritt darum, sie möglichst gut darzustellen, um charakteristische Strukturen innerhalb der Daten erkennen zu können.

Die Möglichkeiten, Instrumente oder Formen der Beschreibung reichen von eindimensionalen Tabellen und Diagrammen über einfache statistische Kennzahlen bis hin zu komplexen mehrdimensionalen statistischen Analysetools.

Instrumente der Statistik

Zu den wichtigsten Instrumenten der deskriptiven Statistik zählen:

  • Datentabellen: Tabellen, in denen die Daten zu den betrachteten statistischen Merkmalen systematisch zusammengefasst präsentiert werden (mehr erfahren Sie darüber in Kapitel 3)

  • Diagramme: Daten der statistischen Merkmale in Form von Bildern anschaulich und informativ präsentieren (siehe auch Kapitel 3)

  • Zentrale Lagemaße: Statistiken, die in einer Zahl die Werte eines statistischen Merkmals beschreiben (zum Beispiel das arithmetische Mittel, das Ihnen die durchschnittliche Körpergröße mitteilt; mehr hierzu in Kapitel 4)

  • Streuungsmaße: Statistiken, die in einer Zahl mitteilen, wie weit die einzelnen Werte eines Merkmals vom Durchschnitt entfernt liegen (wie stark zum Beispiel die Wachstumsentwicklung in unterschiedlichen Beeten verteilt ist; mehr hierzu in Kapitel 5)

  • Kennzahlen: Zahlen, die die Werte anderer statistischer Kennzahlen zusammenfassen (zum Beispiel der Preisindex für Lebenshaltungskosten, der die Information über die Preisentwicklung vieler verschiedener Güter in einer Zahl komprimiert; mehr hierzu in Kapitel 6)

  • Zusammenhangsmaße: statistische Maßzahlen, die auch als Koeffizienten bezeichnet werden, die die Stärke der Beziehung zwischen verschiedenen statistischen Merkmalen beschreiben (zum Beispiel inwiefern die Blutgruppe vom Geschlecht abhängt; mehr hierzu in Kapitel 7)

Die zentralen Instrumente der deskriptiven Statistik, die Sie im Detail in Teil II kennenlernen, sind

  • Präsentation statistischer Informationen mithilfe von Diagrammen,

  • Zusammenfassung von Daten einzelner Merkmale beziehungsweise Variablen mithilfe zentraler Lagemaße,

  • Berechnung von Streuungsmaßen zur Beschreibung der Abweichung der einzelnen Werte von den zentralen Lagemaßen,

  • Ermittlung und Beschreibung der Beziehung zwischen einzelnen statistischen Merkmalen mithilfe von Zusammenhangsmaßen.

Datenmessung mit Niveau

Die so beschriebenen und analysierten Merkmale können auf verschiedene Weise gemessen werden (zu den Messniveaus erfahren Sie mehr in Kapitel 2):

  • nominal, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich nur unterscheiden

  • ordinal, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zudem in eine Rangordnung bringen

  • metrisch, das heißt, die Unterschiede in den möglichen Werten eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zusätzlich mithilfe genormter Messeinheiten quantifizieren beziehungsweise zahlenmäßig in ihrer Größenordnung ausdrücken

Die deskriptiven Statistiken und ihre Zuordnung zu den jeweiligen Messniveaus sehen Sie im Überblick in Tabelle 1.1. Außerdem können Sie der Tabelle entnehmen, in welchen Kapiteln die erwähnten Themen behandelt werden.

Statistiken

Skalenniveaus

Nominal

Ordinal

Metrisch

Maße der Tendenz beziehungsweise Lagemaße

  • Modus

(siehe Kapitel 4)

  • Median

  • Quartile

  • Perzentile

(siehe Kapitel 4)

  • arithmetisches Mittel

  • gewichtetes Mittel

  • geometrisches Mittel

(siehe Kapitel 4)

Maße der Variabilität

nicht sinnvoll, da Zahlen nicht von Bedeutung sind und nur zur Unterscheidung der Kategorien der Merkmale dienen

  • Abstand

  • interquartiler Abstand

(siehe Kapitel 5)

  • mittlere Abweichung

  • Varianz

  • Standardabweichung

  • Variationskoeffizient

(siehe Kapitel 5)

Beziehungsmaße

  • Chi‐Quadrat

  • Pearsons Kontingenz

(siehe Kapitel 7)

  • Spearmans Rangkorrelation

(siehe Kapitel 7)

  • Bravais‐Pearson‐Korrelation

  • Kovarianz

(siehe Kapitel 7)

  • Regressionskoeffizient

  • Determinationskoeffizient

(siehe Kapitel 8)

Tabelle 1.1: Der Zusammenhang zwischen Statistiken und Messniveaus

Die Statistiken der deskriptiven Statistik sind nur für die in der Untersuchung erfassten Untersuchungseinheiten aussagekräftig und für die in die Berechnung einbezogenen Daten, das heißt, Sie können die daraus resultierenden Ergebnisse auch nur auf die analysierten Fälle und Daten beziehen und nicht auf andere Fälle übertragen.

Auch wenn Ihnen eine Stichprobe von Daten aus einer umfassenderen Gesamtheit vorliegt, können Sie statistische Ergebnisse, die Sie anhand der Methoden, Instrumente und Statistiken der deskriptiven Statistik gewonnen haben, nur auf die Daten in dieser Stichprobe beziehen und nicht auf die Gesamtheit, aus der die Stichprobe kommt. Wenn Sie das tun wollen, müssen Sie über die deskriptive Statistik hinaus auf das Instrumentarium der schließenden Statistik zurückgreifen.

Die schließende Statistik oder Inferenzstatistik

Die schließende Statistik (auch Inferenzstatistik oder induktive Statistik genannt) ist neben der deskriptiven Statistik die zweite wesentliche Säule der Statistik. Sie benötigen sie zusätzlich immer dann, wenn Sie nicht alle für eine Analyse interessanten Fälle in Ihre Datenerhebung einbeziehen können. Ihnen steht somit nur ein Teil oder eine Stichprobe der Daten aus der Gesamtheit der Untersuchungseinheiten für die Analyse zur Verfügung. Sie möchten aber dennoch etwas über die Verhältnisse in der Gesamtheit aussagen.

Wählen Sie nur einen Teil der statistischen Einheiten aus der Grundgesamtheit für die statistischen Analysen aus, so handelt es sich um eine Teilerhebung beziehungsweise Stichprobe. Anhand der Ergebnisse der statistischen Analysen mit der Stichprobe wollen Sie auf die entsprechenden Werte in der betreffenden Grundgesamtheit schließen. Aus dieser Aufgabe ergibt sich auch der Name für die schließende Statistik, die auch oft als Inferenzstatistik bezeichnet wird, was aber nichts anderes bedeutet. Die Grundlage dafür, dass Sie aus den Ergebnissen einer Stichprobe einen repräsentativen Schluss auf die Verhältnisse in der Grundgesamtheit ziehen können, ist die Wahrscheinlichkeitsrechnung. Darauf bauen die statistischen Schätzverfahren und die Methoden zum Testen von Hypothesen auf.

  • Eine Hypothese ist eine noch nicht anhand von Daten systematisch überprüfte und analysierte oder bestätigte Behauptung, Aussage oder Vermutung.

Instrumente der schließenden Statistik

Besonders wichtige Konzepte, Verfahren und Instrumente, die Sie in der schließenden Statistik antreffen, sind:

  • Zufallsexperiment: ein Experiment, dessen mögliche Ereignisse zufällig mit einer bestimmten Wahrscheinlichkeit auftreten und daher nicht eindeutig vorhergesagt werden können (mehr hierzu in Kapitel 10)

  • Zufallsvariablen: die bei dem Experiment betrachteten Merkmale, deren Werte zufällig auftreten (siehe Kapitel 10)

  • Wahrscheinlichkeitsverteilung: die den möglichen Werten der Zufallsvariablen zugeordneten Wahrscheinlichkeiten (mehr hierzu in Kapitel 11 und Kapitel 12)

  • Stichprobe: ein Teil einer statistischen Gesamtheit; anhand der Stichprobe gewinnen Sie statistische Informationen über diese Gesamtheit (siehe dazu Kapitel 13)

  • Schätzverfahren: ein Verfahren, mit dem Sie von den Daten beziehungsweise Ergebnissen aus einer Stichprobe auf die Verhältnisse in der statistischen Gesamtheit schließen (mehr hierzu in Kapitel 14)

  • Parameter‐ und Hypothesentest: ein Test, mit dem Sie anhand der Ergebnisse aus einer Stichprobe überprüfen können, ob bestimmte Annahmen oder Hypothesen, die Sie über die Verhältnisse in der Grundgesamtheit haben, zutreffen (siehe Kapitel 15)

Aufgaben der schließenden Statistik

Zwei Aufgabentypen der schließenden Statistik sind besonders wichtig:

  • Schätzung der Werte nicht bekannter Grundgesamtheitsparameter (wie das arithmetische Mittel einer Variablen in einer Population)

    Zum Beispiel können Sie die durchschnittlichen Zuckerrübenernteerträge auf den Feldern im Herbst berechnen und mithilfe der Verfahren der schließenden Statistik auf die Durchschnittserträge bei Zuckerrübenernten im gesamten Gebiet, aus dem Sie die Stichprobe gezogen haben, schließen.

  • Hypothesentest über die Werte von Populationsparametern (zum Beispiel darüber, dass das arithmetische Mittel einen bestimmten Wert hat)

    Ausgehend von einer Hypothese über die Durchschnittserträge der Ländereien in Bezug auf die Zuckerrübenernte im Herbst erheben Sie eine Stichprobe aus der Gesamtpopulation (also zum Beispiel aller Ländereien in NRW) und überprüfen anhand der Daten aus der Stichprobe und mithilfe der Verfahren der schließenden Statistik, ob die Hypothese zutrifft oder nicht. Wenn Sie in unserem Beispiel die Annahme haben, dass der Ernteerfolg unabhängig von der geografischen Lage der Felder ist, können Sie diese Annahme auf diese Weise »empirisch«, das heißt erfahrungsgestützt, überprüfen.

  • Um zuverlässig schließen zu können, benötigen Sie eine repräsentative Stichprobe von Ländereien in NRW mit zuverlässigen Angaben über deren Ernteerträge. Repräsentativ ist eine Stichprobe dann, wenn sie sozusagen ein Abbild der Grundgesamtheit ist. Eine wesentliche Bedingung dafür ist die zufällige Auswahl der Fälle in die Erhebung. Erst unter dieser Voraussetzung ist es möglich, anhand der Ergebnisse der Stichproben festzustellen, mit welcher Wahrscheinlichkeit die Hypothese der Wirklichkeit entspricht.

Gründe für Stichproben und schließende Statistik

Die Beschränkung auf eine Stichprobe und damit der Rückgriff auf die schließende Statistik bietet sich vor allem dann an, wenn Sie

  • zu hohe Kosten für die Datenerhebung vermeiden wollen,

  • den zeitlichen Aufwand für die Datenerhebung verringern wollen und/oder

  • aus sachlogischen, praktischen Gründen auf eine Total‐ oder Gesamterhebung zugunsten einer Stichprobe verzichten müssen.

Beispielhaft für den Fall des Verzichts aus sachlogischen Gründen auf eine Vollerhebung sind Thesen über die Gesamtheit aller Menschen auf unserer Erde, sowohl bei Entwicklungsvoraussagen als auch für die Krankheitsbekämpfung. Es ist praktisch gar nicht machbar, alle Menschen zu befragen oder zu testen. Dank der schließenden Statistik bei einer gut gewählten Stichprobe ist dies glücklicherweise nicht nötig, um dennoch sehr zuverlässige Aussagen treffen zu können.