Zusammenfassung Statistik (c) 2001 Fabian M. Suchanek http://suchanek.name/texts/summaries/statistik.txt Dieses ist die Zusammenfassung des Kurses "Statistik 1" von R. Suck an der Universitaet Osnabrueck im WS 2001. Sie basiert ausschliesslich auf dem ausfuehrlichen Skript der Vorlesung. Die Seitenzahlen in diesem Text beziehen sich auf das Skript, Tabellen- Verweise auf den Kopienstapel. Fuer Korrekturanmerkungen bin ich dankbar. Durch das Weiterlesen akzeptiert der Leser, dass der Autor keinerlei Verantwortung fuer die Richtigkeit oder Vollstaendigkeit dieser Zusammenfassung uebernimmt. Wenn jemand einen Fehler gefunden hat, so waere ich fuer eine Mail dankbar. Nur so habe auch ich etwas von der Veroeffentlichung dieser Zusammenfassung. Meine E-Mail-Adresse ist f.m.suchanek@zweb.de, wobei das 'z' aus der Adresse geloescht werden muss. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Schreibweisen ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Bool'sche Operatoren: Operationen auf Aussagen (Wahrheitswerten) a & b es gelten a und b a | b es gelten a oder b oder beide a >< b es gilt entweder a oder b a => b aus a folgt b ~ a a gilt nicht Einfache Relationen: a = b a ist gleich b a != b a ist ungleich b a < b a ist kleiner als b a > b a ist groesser als b a <= b a ist kleiner oder gleich b a >= b a ist groesser oder gleich b Indizierung: a1 Erster Wert der Reihe a ai i-ter Wert der Reihe a a[i] i-ter Wert der Reihe a, andere Schreibweise aN letzter Wert der Reihe a a1,...aN alle Werte der Reihe a Numerische Operatoren: a * b Produkt von a und b a / b Quotient aus a und b a + b Summe aus a und b a - b Differenz aus a und b a ^ b a erhoben in die b-te Potenz SQRT(a) Wurzel aus a SUM(ai) Summe aller a[i] mit i=1...N ABS(a) Absolutwert (Betrag) von a INTEGRAL(a,b,c) Integral von a bis b von c Konstanten: e 2.7182818 Eulersche Zahl pi 3.141592653589793238462 Kreiskonstante 00 Unendlich ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Mathematische Grundlagen (Anhang A, S. 112) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Menge: Zusammenfassung von Objekten M = {O1, O2, ...} Menge bestehend aus O1, O2, ... M = {x;F(x)} Menge aus allen x fuer die F(x) gilt Element: Jedes in der Menge vorhandene Objekt heisst Element der Menge O E M O ist Element von M Die Reihenfolge der Elemente spielt keine Rolle, ebenso Mehrfachnennungen. Elemente koennen selbst wieder Mengen sein. Im Folgenden werden Mengen mit Grossbuchstaben und Elemente von Mengen mit Kleinbuchstaben bezeichnet. Maechtigkeit einer Menge: Anzahl der enthaltenen Elemente. | M | = N Die Anzahl der El. einer Menge wird mit N bezeichnet Leere Menge: Menge ohne Elemente. Der Bezeichner "0" wird dazu hier ueberladen und steht auch fuer die leere Menge. | 0 | = 0 Die Maechtigkeit der leeren Menge ist 0 Teilmenge: Die Menge A ist Teilmenge von der Menge B, wenn jedes Element von A auch in B ist. A < B A ist Teilmenge von B Obermenge: Die Obermenge X einer Menge A ist diejenige intuitive Menge von der A eine Untermenge ist. Beispiel: A={Ford, Opel}, X=Menge aller Automarken, A < X Potenzmenge: Die Potenzmenge 2^A einer Menge A ist die Menge aller Teilmengen von A. Hat A N Elemente, so ist | 2^A | = 2^|A| Die Maechtigkeit der Potenzmenge ist 2^N Mengenoperationen: Durchschnitt: A /\ B, alle Elemente, die in A _und_ B sind Vereinigung: A \/ B, alle Elemente von A und B zusammen Differenz: A - B, alle Elemente von A ohne die von B Komplement: -A, alle El. der Obermenge X von A, die nicht in A sind Gesetze der Mengenoperationen: Stehe * fuer das \/ oder das /\, sei + die jeweils andere Operation A * B = B * A (Kommutativitaet) (A*B)*C = A*(B*C) (Assoziativitaet) A*(B+C) = (A*B)+(A*C) (Distributivgesetz) A /\ -A = 0 Kein Element ist zugleich in A und -A A \/ -A = X A und -A zusammen umfassen alle Elemente von X A * B = -(-A + -B) De Morgan'sche Gesetze Tupel: Zusammenfassung von Objekten, wobei Reihenfolge und Anzahl der Vorkommnisse eine Rolle spielen. (a, b, c)!=(a, c, b) Das Tupel a,b,c ist ungleich dem Tupel a,c,b N-Tupel: Ein Tupel mit N Objekten. Paar: Ein 2-Tupel. Tripel: Ein 3-Tupel. Kartesisches Produkt: Das kartesische Produkt der Mengen A1,A2,...An ist die Menge aller n-Tupel (a1,a2,...,an) mit a1 E A1, a2 E A2 ... Beispiel fuer ein kartesisches Produkt mit 2 Mengen: {1,2,3} x {x,y} = {(1,x),(2,x),(3,x),(1,y),(2,y),(3,y)} Mengenpotenzierung: Bildung des kartesischen Produktes einer Menge A mit sich selbst. A^n = A x A ... x A Die Elemente von A^n sind demnach n-Tupel, A^n heisst n-dimensionaler Vektorraum, jedes n-Tupel heisst Vektor. Relation: Eine Relation (Beziehung) R zwischen Mengen A1,A2,...An ist eine Teilmenge des kartesischen Produktes A1 x A2 x ... An. R < A1 x A2 x ... An Schreibweisen fuer "a1,a2,...an stehen in der Beziehung R": R(a1,a2,...an) (a1,a2,...an) E R Binaere Relation: Relation zwischen zwei Mengen. Eigenschaften von Relationen: Eine binaere Relation R < A x A hat folgende Eigenschaften: * reflexiv, wenn gilt R(a,a) * symmetrisch, wenn gilt R(a,b) => R(b,a) * antisymmetrisch, wenn gilt R(a,b) & R(b,a) => a=b * asymmetrisch, wenn gilt R(b,a) => ~R(a,b) * vollstaendig, wenn gilt R(a,b) | R(b,a) * transitiv, wenn gilt R(a,b) & R(b,c) => R(a,c) * strikt, wenn gilt ~R(a,a) fuer alle a,b,c E A. Spezielle Relationen: Eine binaere Relation R < A x A heisst * Aequivalenzrelation, wenn R reflexiv,symmetrisch und transitiv ist Beispiel: Gleichheit, "=" * partielle Ordung, wenn R reflexiv, antisymmetrisch und transitiv ist Beispiel: Kleinergleichheit, "<=" * Quasiordnung, wenn R reflexiv und transitiv ist * schwache Ordung, wenn R vollstaending und transitiv ist * einfache Ordnung, wenn R eine vollstaendige partielle Ordnung ist Beispiel: Kleinergleichheit, fuer alle Elemente von A definiert * lineare Ordnung, wenn R asymmetrisch, transitiv und vollstaendig ist Beispiel: Kleinerrelation "<", fuer alle Elemente von A definiert Relationales System, Relativ: Eine Struktur der Form (A;R1,R2,...Rn), wobei A eine Menge ist und R1,...Rn Relationen auf dieser Menge. Funktion, Abbildung: Eine Relation zwischen zwei Mengen A (Definitionsmenge, Urbildmenge) und B (Wertemenge, Bildmenge), bei der fuer jedes a E A nur ein einziges b E B existiert, sodass R(a,b) erfuellt ist. f(a)=b, f:a->b Die Funktion f bildet a auf b ab f:A->B Die Funktion bildet El. aus A auf El. aus B ab Eigenschaften von Funktionen: Eine Funktion f:A->B heisst * injektiv, wenn f(x)=f(y) => x=y * surjektiv, wenn f(A)=B, jedes Element von B kann Ergebnis von f sein * bijektiv, wenn f surjektiv und injektiv ist * monoton wachsend, wenn x f(x)<=f(y) (analog monoton fallend) * streng monoton wachsend, wenn x f(x)0, entspricht einer Streckung/Stauchung mit Verschiebung * Aehnlichkeitsabbildung, wenn f(x)=ax mit a>0 E A, entspricht einer Streckung/Stauchung ohne Verschiebung fuer alle x,y E A Abbildungen von relationalen Systemen: Eine Abbildung f:(A;R1,R2,...Rn)->(B;S1,S2,...Sn) heisst * Homomorphismus, wenn R(x,y) => S(f(x),f(y)) fuer alle x,y E A * Endomorphismus, wenn f Homomorphismus und (A;R1,...Rn)=(B;S1,...Sn) * Isomorphismus, wenn f ein bijektiver Homomorphismus ist * Automorphismus, wenn f ein bijektiver Endomorphismus ist ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Einfuehrung in die Statistik (Teil 1, S. 4) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Statistik: Wissenschaft von der Erhebung, Klassifikation und Verwendung von Daten. Deskriptive Statistik: Mitunter verlustbehaftete Beschreibung von Daten mit dem Ziel einer uebersichtlichen Darstellung. Inferenzstatistik, Pruefstatistik: Ueberpruefung von aus der Theorie gewonnenen Vorhersagen an den beobachteten Daten. Messen: Das Zuordnen von Auspraegungen von Eigenschaften zu Zahlen oder Kategorien. Empirisches Relativ: Menge der interessierenden Eigenschaften der Dinge mit ihren beobachtbaren empirischen Relationen. Numerisches Relativ: Relativ (Struktur aus Basismenge und darauf definierten Relationen), bei dem die Basismenge eine Untermenge der reellen Zahlen ist. Repraesentationsproblem: Die Aufgabe, eine homomorphe Abbildung vom empirischen Relativ in ein numerisches Relativ zu finden, sprich: Eigenschaften auf Zahlen abzubilden, sodass die Beziehungen zwischen den Eigenschaften sich in den Beziehungen zwischen den Zahlen widerspiegeln. Skala: Diejenige Abbildung, die das Repraesentationsproblem loest, sprich: Ein strukturerhaltendes Mapping von Eigenschaften auf Zahlen. Transformation: Umwandlung der Basismenge eines numerischen Relativs in eine andere. zulaessige Transformation: Eine Transformation, die die Relationen auf der Basismenge weiter gueltig sein laesst. Eindeutigkeitsproblem: Die Aufgabe, die zulaessigen Transformationen zu bestimmen. Skalentyp, Skalenniveau: Eine Menge von Skalen, die dieselben zulaessigen Transformationen haben. Skalentypen: Qualitative Skalentypen: * Nominalskala: Charakteristik: Nicht-numerisch zulaessige Abildungen: Injektive Abbildungen Operationen: =, != Beispiele: Haarfarbe Quantitative Skalentypen: * Ordinalskala: Charakteristik: Eine Ordnung zulaessige Abildungen: streng monoton wachsende Abbildungen Operationen: =, !=, <, > Zentrale Tendenz: Median (s.u.) Dispersion: Mittlerer Quartilabstand (s.u.) Beispiele: Windstaerkeskala * Intervallskala: Charakteristik: Eine Ordnung,bei der Differenzen vergleichbar sind zulaessige Abildungen: positiv affine Abbildungen, d.h. Streckung/Stauchung plus Verschiebung Operationen: =, !=, <, >, +, - Zentrale Tendenz: Mittelwert (s.u.) Dispersion: Standardabweichung (s.u.) Beispiele: Temperatur in Grad Celsius, alle psychometrischen Daten * Verhaeltnisskala: Charakteristik: Verhaeltnisse sind vergleichbar, es existiert ein natuerlicher Null-Punkt zulaessige Abildungen: Aehnlichkeitabbildungen, d.h. Streckung oder Stauchung Operationen: =, !=, <, >, +, -, *, / Zentrale Tendenz: Mittelwert (s.u.) Dispersion: Standardabweichung (s.u.) Beispiele: Laenge, Masse Jeder strengere Skalentyp (weiter unten) schliesst die schwaecheren (weiter oben) ein. Erfuellen Daten ein XXX-Skalenniveau, so heissen sie XXX-Daten. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Datenbeschreibung (Teil 2.1-2.2, S. 8) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Rohdaten: Erhobene, unverarbeitete Messwerte, im Folgenden mit x1,x2,...xN bezeichnet. Gesamtumfang: Anzahl N der Messwerte. Urliste: Ungeordnete Liste der Rohdaten. Klassenbildung: Zusammenfassen von aehnlichen Messwerten zu einer Gruppe. Dichotomie: Variable mit nur 2 Auspraegungen (Werten). Dichotomisierung: Vereinfachung der Daten auf 2 Messwerte, Mapping vom Originaldatentyp nach boolean. Haeufigkeit eines Messwertes: Anzahl des Vorkommens dieses Messwertes. Haeufigkeitsverteilung: Auflistung aller verschiedenen Messwerte mit ihrer Haeufigkeit. kumulierte Haeufigkeitsverteilung, Summenhaeufigkeitsverteilung: Auflistung aller verschiedenen Messwerte, wobei bei jedem die Summe seiner Haeufigkeit und aller vorhergehenden Haeufigkeiten vermerkt wird. Relative Haeufigkeit eines Messwertes: Haeufigkeit dieses Messwertes dividiert durch den Gesamtumfang N. Prozentwert eines Messwertes: Relative Haeufigkeit dieses Messwertes multipliziert mit 100. Relative Haeufigkeitsverteilung: Haeufigkeitsverteilung mit Angabe der relativen Haeufigkeit. Relative Summenhaeufigkeitsverteilung: Summenhaeufigkeitsverteilung mit Angabe der Summen der relativen Haeufigkeiten. Messwerte-Haeufigkeits-Diagramm: Graphische Darstellung von Messdaten in einem Koordinaten-Kreuz, bei der jeder Messwert auf der x-Achse aufgetragen wird und die y-Achse die Haeufigkeit angibt. Entsprechend koennen auch Summenhaeufigkeiten dargestellt werden. Histogramm: Messwerte-Haeufigkeits-Diagramm, bei dem die Haeufigkeiten durch Saeulen gekennzeichnet werden. Polygonzug: Messwerte-Haeufigkeits-Diagramm, bei dem die einzelnen Messwert/Haeufigkeits-Punkte durch Striche verbunden werden. Nicht sinnvoll bei qualitativen Daten: Die Striche koennten als Haeufigkeiten gar nicht vorhandener Zwischenwerte missverstanden werden. Streifendiagramm: Graphische Darstellung von Messwerten in einem laenglichen Rechteck. Das Rechteck wird in Stuecke eingeteilt, wobei jedem verschiedenen Messwert ein solches Stueck zugeordnet wird. Die Laenge des Stueckes entspricht der Haeufigkeit des Messwertes. Kreisdiagramm: Graphische Darstellung von Messwerten in einem Kreis. Der Kreis wird in Sektoren eingeteilt, wobei jedem verschiedenen Messwert ein Sektor zugeordnet wird. Die Groesse des Sektors entspricht der Haeufigkeit des Messwertes. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Kennwerte von Datenkollektiven (Teil 2.3, S. 12) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Mass der zentralen Tendenz: Derjenige Wert, der die gesamten Rohdaten am besten beschreibt. Arithmetisches Mittel, Mittelwert: Summe aller Messwerte geteilt durch ihre Anzahl N. Addiert man zu allen Messwerten dieselbe Zahl, so erhoeht sich auch der Mittelwert um diese Zahl. Multipliziert man alle Messwerte mit einer Zahl, so vervielfacht sich auch der Mittelwert um diese Zahl. Die Summe aller Abweichungen der Messwerte vom Mittelwert ist null. Die Summe aller quadrierten Abweichungen ist kleiner als die Summer der quadrierten Abweichungen von jeder beliebigen anderen Zahl. Der Mittelwert nach Klassenbildung weicht um hoechstens eine halbe Klassenbreite vom normalen Mittelwert ab. Bei einer symmetrischen Verteilung ist der Mittelwert Symmetriepunkt. Der Mittelwert von x1,x2,...xN wird mit "x quer", einem x mit einem Strich drueber, bezeichnet. (Ab Intervalldaten) Rangreihe: Auflistung aller Messwerte der Groesse nach. (Ab Ordinaldaten) Median: Derjenige Messwert in der Mitte der Rangreihe. Ist der Gesamtumfang N der Messwerte gerade, so wird ein beliebiger Wert zwischen den beiden mittleren Messwerten genommen. Der Median ist weniger anfaellig fuer Ausreisser als der Mittelwert, wohingegen der Mittelwert aussagekraeftiger ist. Der Median wird auch mit "x quer" bezeichnet. (Ab Ordinaldaten) Modalwert: Derjenige Messwert, der am haeufigsten vorkommt. (Ab Nominaldaten). Dispersionsmass: Mass fuer die Streuung der Messwerte um den Mittelwert. Varianz: Summe der quadrierten Abweichungen vom Mittelwert, dividiert durch N-1. Sie wird mit s^2 bezeichnet. Kann berechnet werden als: ( SUM(xi^2) - SUM(xi)^2/N ) / (N-1) (Ab Intervalldaten) Standardabweichung: Wurzel aus der Varianz, also s. (Ab Intervalldaten) Perzentil: Das p-te Perzentil Cp ist derjenige Messwert, fuer den p Prozent aller Werte kleiner sind. Cp = Wert in der Rangreihe an Position p*(N+1)/100 C50 ist der Median. (Ab Ordinaldaten) Mittlerer Quartilabstand: Streuungsmass, gemittelte Abstaende von C75 und C25 zum Median C50: Q=(C75-C25)/2. Weniger anfaellig fuer Ausreisser als die Varianz, jedoch weniger aussagekraeftig. (Ab Ordinaldaten) Range, Spannweite, Variationsbreite: Differenz des groessten und kleinsten Messwertes. (Ab Ordinaldaten) Positiv affine Transformationen: Umrechnungen von Messwerten in der Form f(x)=mx+c, m>0. Da es sich um eine zulaessige Transformation handelt, bleiben alle Relationen bestehen. Es gilt: NeuerMittelwert = m * AlterMittelwert + c, NeueStandardabweichung= m * AlteStandardabweichung. (Ab Intervalldaten) z-Transformation: Transformation nach z(x)=(x-Mittelwert)/s. Die so erhaltenen Werte werden mit z1,z2,...zN bezeichnet. Nachher ist der Mittelwert 0 und die Standardabweichung 1, die Daten sind normiert. (Ab Intervalldaten) IQ-Transformation: Transformation nach q(x)=100+15*z(x). Die so erhaltenen Werte werden mit q1,q2,...qN bezeichnet. Nachher ist der Mittelwert 100 und die Standardabweichung 15. (Ab Intervalldaten) T-Transformation: Transformation nach t(x)=50+10*z(x). Nachher ist der Mittelwert 50 und die Standardabweichung 10. (Ab Intervalldaten) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Zusammenhangsmasse (Teil 2.4, S. 21) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Stochastischer Zusammenhang: Korrelation zwischen zwei Merkmalen (bzw. Variablen), die sich nicht durch eine exakte Gleichung erfassen laesst. Im Folgenden werden die Merkmalstraeger durchnummeriert von 1 bis N, die erste Merkmalsauspraegung heisst X und hat die Werte x1,x2,...xN und die zweite heisst Y und hat die Werte y1,y2,...yN. Streuungsdiagramm: Graphische Darstellung von zwei Merkmalen, bei der in einem Koordinatenkreuz die Punkte (xi,yi) eingezeichnet werden. Kovarianz: Ausmass der Gemeinsamkeit von X und Y. sxy = (SUM (xi-xMittelwert)*(yi-yMittelwert) ) / (N-1) Werden X und Y gemeinsam gross oder klein, ist die Gemeinsamkeit sxy gross. Die Kovarianz haengt noch von den Varianzen ab, d.h. wenn man die Daten zulaessig transformiert, aendert ich die Kovarianz. (Ab Intervalldaten) Korrelationskoeffizient, Produkt-Moment-Korrelationskoeffizient: Normierte (d.h. z-transformierte und damit varianzen-unabhaengige) Kovarianz. (S. 23, Satz 2.12-2.14) r = SUM( (xi-xMittelwert)*(yi-yMittelwert) ) / SUM( (xi-xMittelwert)^2 ) / SUM( (yi-yMittelwert)^2 ) r = sxy / xStandardabweichung / yStandardabweichung r = ( SUM( xi*yi ) - SUM(xi)*SUM(yi)/N ) / SQRT( ( SUM(xi^2) - SUM(xi)^2/N ) * ( SUM(yi^2) - SUM(yi)^2/N ) ) r liegt immer zwischen 1 (hoher positiver Zusammenhang) und -1 (hoher negativer Zusammenhang). Ist r=0, so haengen die Merkmale nicht zusammen. Die Interpretation von r ist erst bei Linearitaet und Homoskedastizitaet moeglich (s.u.). Der Produkt-Korrelationskoeffizient bleibt unveraendert, wenn die Daten transformiert werden. (Ab Intervalldaten) Rangplatz eines Messwertes: Position i des Messwertes xi innerhalb der Rangreihe. Sind die Messwerte x[i],...x[i+n] gleich, so wird ihnen allen die gemittelte Position i+n/2 als Rangplatz zugeteilt. Dieser Umstand heisst Rangbindung oder Tie. (Ab Ordinaldaten) Rangkorrelation: Korrelation fuer Ordinaldaten. Rangkorrelation nach Spearman: rs = 1 - 6*SUM( (Rangplatz(xi)-Rangplatz(yi))^2 ) / N / (N^2-1) Am besten zunaechst eine Tabelle aller xi mit ihrem Rangplatz, aller yi mit ihrem Rangplatz und der Rangplatzdifferenz aufstellen. (Ab Ordinaldaten) konkordant: Ein Paar (i,j) aus Messwertpositionen heisst konkordant, wenn die zu i und j gehoerenden Messwerte bei dem einen und bei dem anderen Merkmal untereinander in derselben Relation stehen: xixj und yi>yj. Die Anzahl der konkordanten Paare wird mit K bezeichnet. (Ab Ordinaldaten) diskordant: Ein Paar (i,j) aus Messwertpositionen heisst diskordant, wenn es nicht konkordant ist. Die Anzahl der diskordanten Paare wird mit D bezeichnet. (Ab Ordinaldaten) Rangkorrelation nach Kendall, Kendall's Tau: rTau = 2*(K-D) / N / (N-1) rTau = (K-D) / (K+D) (Ab Ordinaldaten) Kategorienpaar: Element der Menge X x Y, d.h. ein Paar der Form (xi,yj). Vierfeldertafel: Tabelle fuer einen Ueberblick ueber zwei Merkmale in Nominalskalenniveau. y1 y2 Randsumme x1 a b a+b x2 c d c+d Randsumme a+c b+d a+b+c+d Dabei ist z.B. a die Haeufigkeit des Kategorienpaars (x1,y1). (Ab Nominaldaten) Phi-Koeffizient: Korrelation fuer Nominaldaten. rPhi = ABS(a*d-b*c) / SQRT( (a+b)*(c+d)*(a+c)*(b+d) ) rPhi liegt zwischen 0 und 1,hat aber nicht immer 1 als maximalen Wert. Wenn Nominaldaten in numerische Daten uebersetzt werden (durch eine zulaessige Transformation), so entspricht der Phi-Koeffizient dem Produkt-Moment-Korrelationskoeffizienten. (Ab Nominaldaten) Kontingenz-Tafel: Allgemeine Vierfeldertafel. Die Haeufigkeit des Paares (xi,yj) wird mit Nij bezeichnet, die rechte Randsumme der Zeile i ist Zi, die untere Randsumme der Spalte j ist Sj. N ist die Gesamtzahl der Paare, N=SUM(Zi)=SUM(Si). (Ab Nominaldaten) chi^2-Wert: Kennwert einer Kontingenztafel. chi^2 = N*SUM( SUM( ( Nij - Zi*Sj/N ) ^ 2 / Zi / Sj ) ) Zi*Sj/N ist hier die Haeufigkeit von (xi,yi), wenn X und Y unabhaengig waeren. (S.27, Satz 2.18) (Ab Nominaldaten) Kontingenzkoeffizient: Kennwert einer Kontingenztafel. C = SQRT(chi^2 / (chi^2+N) ) C liegt zwischen 0 und 1, hat aber nicht immer 1 als maximalen Wert. Bei quadratischen Tafeln hat C maximal den Wert Cmax = SQRT( (Spaltenzahl-1)/Spaltenzahl ) (Ab Nominaldaten) Korrelation und Kausalitaet: Korrelation sagt nichts ueber Kausalitaet. Es koennte sowohl X Y beeinflussen als auch andersherum oder aber beide koennten von einer dritten Variablen beeinflusst werden. Beispiele fuer Korrelationen: positive Korrelation: Geleistete Arbeit und Verdienst beim Akkordarbeiter negative Korelation: Ausgaben und Guthaben auf einem Konto nicht linearer Zusammenhang: Erregung und Leistung, zu wenig und zuviel Erregung fuehren zu wenig Leistung ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Regression (Teil 2.5, S. 31) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Regression: Vereinfachung eines quasi-linearen Zusammenhanges zu einem linearen Zusammenhang. Regressionsgerade: Diejenige Gerade f(x)=ax+b, die in einem X-Y-Koordinatensystem die Punktwolke aus den (xi,yi) am besten beschreibt. Statt f(x) schreibt man auch "y Dach". Die Steigung der Regressionsgeraden heisst Regressionskoeffizient. Er haengt eng mit dem Korrelationskoeffizienten zusammen und hat dasselbe Vorzeichen. Methode der kleinsten Quadrate: Methode zum Auffinden der Regressionsgeraden. Dazu wird der Abstand eines jeden realen Punktes (xi,yi) von seinem durch die Regressionsgerade vorhergesagten Punkt (xi,f(xi)) bestimmt. Die Guete einer Geraden misst sich als Summe der quadrierten Abstaende, F(a,b)=SUM( (yi-f(xi))^2 ). Minimiert man F(a,b) so erhaelt man die Regressionsgerade. Es gibt zwei Moeglichkeiten, eine Regressionsgerade zu bestimmen: 1. Vorhersage von X auf Y, Minimierung der Y-Abstaende: y(x) = ayx * x + byx mit ayx = r*sy/sx byx = yMittelwert - ayx * xMittelwert 2. Vorhersage von Y auf X, Minimierung der X-Abstaende: x(y) = axy * y + bxy mit axy = r*sx/sy bxy = xMittelwert - axy * yMittelwert Dabei ist r der Produktmomentkorelationskoeffizient und sx und sy die Standardabweichungen der X- und Y-Werte. (S.34, Satz 2.21-2.26) Bedingte Verteilung: In einer stochastischen Verteilung koennen fuer einen X-Wert unterschiedliche Y-Werte gemessen werden (Ungenauigkeiten). Die Verteilung der gemessenen Y-Werte heisst "bedingte Verteilung". Linearitaet: Eine Verteilung erfuellt Linearitaet, wenn die Mittelwerte der bedingten Verteilungen auf einer Geraden liegen, wenn also die Mittelwerte der Ungenauigkeiten linear von X abhaengen. Homoskedastizitaet: Eine Verteilung erfuellt Homoskedastizitaet, wenn die bedingten Verteilungen alle ungefaehr dieselbe Varianz haben, wenn also die Groesse Ungenauigkeit nicht von der Groesse des X-Wertes abhaengt. Standardschaetzfaehler: Gilt Homoskedastizitaet, so heisst die konstante Standardabweichung Standardschaetzfaehler: syx = sy * SQRT(1-r^2) (Stdabweichung der Y-Werte) sxy = sx * SQRT(1-r^2) (Stdabweichung der X-Werte) r ist der Korrelationskoeffizient und sx,sy sind die Standardabweichungen. Der Standardschaetzfehler gibt die Standardabweichung des vorhergesagten Y-Wertes vom tatsaechlichen Y-Wert an, da der Mittelwert der bedingten Y-Verteilung der vorhergesagte Y-Wert ist. Regressionseffekt, Tendenz zur Mitte: Die vorhergesagten Y-Werte von sehr extremen X-Werten sind immer weniger extrem. Oder: Wenn der X-Wert um k X-Standardabweichungen neben dem X-Mittelwert liegt, so wird der Y-Wert weniger als k Y-Standardabweichungen neben dem Y- Mittelwert liegen. Oder: Der Betrag des z-transformierten Y-Wertes ist kleiner als der Betrag des z-transformierten X-Wertes. z-Transformation eines Zusammenhangs: Werden sowohl X als auch Y z-transformiert, so haben beide Vaiablen den Mittelwert 0 und die Standardabweichung 1. Damit verlaeuft die Regressionsgerade durch den Ursprung und hat die Steigung r. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Wahrscheinlichkeitsraum (Teil 3.1-3.2, S. 39) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Zufallsvorgang: Nicht determiniert vorhersagbarer Prozess. perspektivischer Zufall: Durch die Unwissenheit des Beobachters undeterminiert erscheinender Prozess. prinzipieller Zufall: Grundsaetzlich undeterminierter Prozess. Elementarereignis: Ein moeglicher Ausgang eines Zufallsvorganges, mit w (klein Omega) bezeichnet. Zufalls-Ergebnis: Menge aller Elementarereignisse, mit Omega bezeichnet. w E O Jedes Elementarereignis gehoert zum Ergebnis Zufalls-Ereignis: Teilmenge von Omega, d.h. Menge von ausgewaehlten Elementarereignissen. Die Menge aller Ereignisse wird mit A bezeichnet: A < 2^Omega Unmoegliches Ereignis: Ein Ereignis ohne Elemente, 0. Sicheres Ereignis: Das Ereignis Omega. Sigma-Algebra: Eine nicht-leere Menge A < 2^Omega, wobei gilt: 1. B E A => ~B E A Ist die Menge B in A, so auch seine Komplementmenge 2. A1,A2,...AN E A => (A1 \/ ... AN ) E A Sind die Mengen A1,A2,...AN in A, so ist auch die Vereiningung in A Allgemein ist erfuellt: * A1,A2 E A => (A1\/A2) E A * A1,A2 E A => (A1/\A2) E A * B E A => -B E A * 0 E A * Omega E A Disjunkte Ereignisse: Zwei Ereignisse (Mengen von Elementarereignissen) heissen disjunkt, wenn sie kein Element gemeinsam haben, d.h. wenn sie nicht gemeinsam eintreten koennen. Wahrscheinlichkeitsraum: Ein Tripel aus * Omega (Zufallsergebnis) * einer Sigma-Algebra A (Menge von Teilmengen von Omega) * einer Wahrscheinlichkeitsfunktion P:A->ReelleZahlen mit * P(B)>=0 fuer alle B E A Die Wahrscheinlichkeit eines Ereignisses ist groessergleich null * P(Omega)=1 Die Wahrscheinlichkeit des sicheren Ereignisses ist Omega * P(A1 \/ A2 \/ ... AN) = P(A1)+P(A2)+...P(AN), wenn Ai != Aj Additivitaet: Wenn Ereignisse unabhaengig sind, so errechnet sich ihre Wahrscheinlichkeit als Summe der Einzelwahrscheinlichkeiten Allgemein ist P eine Funktion, die einem Ereignis (also einer Menge von Elementarereignissen) eine Wahrscheinlichkeit zwischen 0% und 100% zuordnet. Fuer eine Menge von Elementarereignissen w1,w2,...wN berechnet P die Wahrscheinlichkeit, dass w1 oder w2 oder... wN eintritt. Eigenschaften von P: * 0 <= P(A) <= 1 * P(0) = 0 * P(Omega) = 1 * P(-A) = 1-P(A) * P(A1 \/ A2) = P(A1) + P(A2) wenn A1 und A2 disjunkt sind * P(A1 \/ A2) = P(A1) + P(A2) - P(A1/\A2) Laplace-Experiment: Zufallsvorgang, bei dem jedes Elementarereignis gleichwahrscheinlich ist. Omega = {w1, w2, ... wN } A = 2^Omega Jede Kombination von Elementarereignissen ist ein Ereignis P( {w[i]} ) = 1 / N Jedes Elementarereignis ist gleich wahrscheinlich P( {w[i],w[i+1],... w[i+n]} ) = n / N Die Wahrscheinlichkeit eines Ereignisses ist die Anzahl seiner Elementarereignisse dividiert durch die Gesamtzahl der moeglichen Elementarereignisse Ein Laplace-Experiment fuehrt zu einer diskreten Gleichverteilung (s.u.). Wahrscheinlichkeit von A unter der Bedingung B, Bedingte Wahrscheinlichkeit: Die Wahrscheinlicheit, dass A eintritt unter der Vorraussetzung, dass B eingetreten ist, heisst "bedingte Wahrscheinlichkeit" P(A|B) = P(A /\ B) / P(B) P(A|B) = P(B|A) * P(A) / P(B) (Satz von Bayes) P(A|B) = P(B|A) * P(A) / ( P(B|A)*P(A) + P(B|-A)*P(-A) ) Die Wahrscheinlichkeit von A unter der Bedingung B ist die Wahrscheinlichkeit dass A und B gemeinsam eintreten, dividiert durch die (d.h. relativiert an der) Wahrscheinlichkeit von B. Wahrscheinlichkeit von (A und B): Die Wahrscheinlichkeit, dass sowohl Ereignis A als auch Ereignis B eintritt, ist P(A /\ B) = P(B|A) * P(A) Wahrscheinlichkeit, dass ein Ereignis weniger als k-mal auftritt: Summe der Wahrscheinlichkeiten fuer 1-maliges Auftreten, 2-maliges Auftreten,... (k-1)-maliges Auftreten. Wahrscheinlichkeit, dass ein Ereignis beim k-ten Mal auftritt: Die Wahrscheinlichkeit, dass es (k-1)-mal nicht eintritt und einmal eintritt: P(A tritt beim k-ten Mal ein) = P(~A)^(k-1) * P(A) Unabhaengigkeit von Ereignissen: Zwei Ereignisse A und B sind unabhaengig, wenn aus dem Eintreffen von B nichts ueber das Eintreffen von A gefolgert werden kann, d.h. wenn P(A|B) = P(A) oder anders: P(A/\B)/P(B) = P(A) oder anders: P(A/\B) = P(A)*P(B) (s. S. 130) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Zufallsvariablen (Teil 3.3-3.4, S. 47) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Zufallvariable: Abbildung von Omega in die reellen Zahlen. X: Omega -> ReelleZahlen Die Zufallsvariablen-Funktion bekommt ein Elementarereignis w, greift ein bestimmtes Merkmal von w heraus und bildet es auf die reellen Zahlen ab. Die Zufallsvariable dient also dem numerisch-Machen von Elementarereignissen, sie misst die Auspraegung des Merkmals X bei dem Elementarereignis w. diskrete Zufallsvariable: Zufallsvariable mit abzaehlbar vielen Werten. stetige Zufallsvariable: Ein bestimter Typ nicht diskreter Zufallsvariablen. Gemittelte Zufallsvariable: Zufallsvariable, die mit "X quer" bezeichnet wird und sich aus einer Menge von Zufallsvariablen X1,X2,...XN berechnet zu XMittel = SUM(Xi) / N Die gemittelte Zufallsvariable kann z.B. mehrere Versuche des gleichen Typs zusammenfassen. Wahrscheinlichkeit bei Zufallsvariablen: Diejenige Wahrscheinlichkeit, mit der X einen bestimmten Wert x annimmt: P(X(w) = x) bei zufaelligem w = P( {w E Omega; X(w)=x} ) Schreibweise: P( X = x ) Wahrscheinlichkeitsfunktion/Dichte einer Zufallsvariablen: fX(x) = P( X = x ) fX bildet jede moegliche numerische Auspraegung des Merkmals X auf seine Wahrscheinlichkeit ab. Streng genommen ist gilt obige Formel nur fuer diskrete Zufallsvariablen, fuer stetige benutzt man die "Dichte". Die Summe aller fX(x) muss 1 sein. Verteilungsfunktion einer Zufallsvariablen: FX(x) = P( X <= x ) FX bildet jede moegliche Auspraegung des Merkmals X auf dessen "aufsummierte" Wahrscheinlichkeit ab. Unter Vernachlaessigung aller mathematischen Randbedingungen ist FX die Stammfunktion von fX. FX gibt also die Flaeche unter dem Graphen von fX an und muss fuer x->unendlich 1 sein. Gemeinsame Wahrscheinlichkeitsfunktion von Zufallsvariablen: Fuer 2 diskrete Zufallsvariablen X und Y mit den moeglichen Werten x1,x2,...xN und y1,y2,...yN ist f(x,y)=P({X=xi} /\ {Y=yj}) bei x=xi und y=yi (sonst 0) die Wahrscheinlichkeitsfunktion von (X,Y). Sie berechnet von 2 Werten die Wahrscheinlichkeit, dass X den einen Wert annimmt und gleichzeitig Y den anderen Wert annimmt. Gemeinsame Verteilungsfunktion von Zufallsvariablen X und Y: F(x,y) = P({X<=x} /\ {Y<=y}) FX(x) und FY(y) heissen Randverteilungen von F(x,y). Unabhaengigkeit von Zufallsvariablen: X und Y heissen unabhaengig, wenn gilt F(x,y) = FX(x) * FY(y). Fuer diskrete Zufallsvariablen gilt dann auch f(x,y) = fX(x) * fY(y). Erwartungswert einer Zufallsvariablen: Mit den Einzelwahrscheinlichkeiten gewichtete Summe der Messwerte. E(X) = SUM(xi*P(X=xi)) = SUM( xi * fX(xi) ) = my Der Erwartungswert ist mit dem Mittelwert verwand und wird auch mit dem griechischen my bezeichnet. Varianz einer Zufallsvariablen: Var(X) = SUM( (xi-E(X))^2 ) * P(X=xi) Var(X) = E( (X-E(X))^2 ) = E(X^2) - E(X)^2 = sigma^2 Die Varianz ist mit der Varianz von Daten verwand und wird auch mit dem griechischen sigma^2 bezeichnet. Lageparameter: Varianz und Erwartungswert heissen auch "Lageparameter". Standardabweichung einer Zufallsvariable X: StdAbw(X) = SQRT(Var(X)) = sigma Die Standardabweichung entspricht der Standardabweichung bei Daten und wird auch mit dem griechischen sigma bezeichnet. Rechenregeln fuer Erwartungswert und Varianz bei Zufallsvariablen: E(c*X) = c*E(X) fuer alle reellen Zahlen c E(X+Y) = E(X) + E(Y) Var(c*X) = c^2 * Var(X) fuer alle reellen Zahlen c Var(X+Y) = Var(X) + Var(Y) wenn X und Y unabhaengig sind Var(X+Y) = Var(X) + Var(Y) + 2*Cov(X,Y) (s.u.) Tschebyscheff'sche Ungleichung: Abschaetzung fuer die Abweichung einer Zufallsvariablen X von ihrem Erwartungswert my in Bezug auf ihre Standardabweichng sigma: P( ABS(X-my)>=k*sigma ) <= k^-2 Die Wahrscheinlichkeit, dass X um mehr als k Standardabweichungen vom Mittelwert verschieden ist, ist kleiner als 1/k^2. Erwartungswert der gemittelten Zufallsvariable: Sind N Zufallsvariablen X1,X2,...XN unabhaengig, so ist der Erwartungswert ihres Mittels E(XMittel) = SUM( E(Xi) ) / N Ist der Erwartungswert bei allen Xi gleich, so gilt E(XMittel) = E(X1) = E(X2) = ... E(XN) Der Erwartungswert des Stichprobenmittelwertes ist gleich dem Erwartungswert des Merkmals der Population. Varianz der gemittelten Zufallsvariable: Sind N Zufallsvariablen X1,X2,...XN unabhaengig, so ist die Varianz ihres Mittels Var(XMittel) = SUM( Var(Xi) ) / N^2 Ist die Varianz bei allen Xi gleich, so gilt Var(XMittel) = Var(X1) / N bzw. fuer die Standardabweichung: StdAbw(XMittel) = StdAbw(X1) / SQRT(N) Kovarianz von Zufallsvariablen: Mass fuer den Zusammenhang zweier Zufallsvariablen X und Y: Cov(X,Y) = E( (X-E(X)) * (Y-E(Y) ) Cov(X,Y) = E( X*Y ) - E(X)*E(Y) Die Kovarianz von ein und derselben Zufallsvariable ist Cov(X,X) = E(X^2) - E(X)^2 = Var(X) Die Kovarianz haengt in ihrer Groesse noch von den Varianzen der einzelnen Zufallsvariablen ab. Korrelationskoeffizient von Zufallsvariablen: Normierte Kovarianz zweier Zufallsvariablen X und Y: rhoXY = Cov(X,Y) / SQRT( Var(X) * Var(Y) ) rhoXY liegt innerhalb von [-1,+1]. Unkorrelierte Zufallsvariablen: X und Y sind unkorreliert, wenn rhoXY = 0 ist. Unabhaengigkeit fuehrt zu Unkorreliertheit, aber Unkorreliertheit fuehrt nicht zwangslaeufig zu Unabhaengigkeit. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Kombinatorik (Teil 3.5, S. 57) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Frank Ollermann meint, Kombinatorik kaeme vermutlich nicht in der Klausur dran. Kombinatorik: Bestimmung der Maechtigkeit endlicher Mengen. Fundamentalprinzip der Kombinatorik: Hat man N Mengen A1,A2,...AN, so gibt es |A1|*|A2|*...|AN| Moeglichkeiten, ein N-Tupel (a1,a2,...aN) zusammenzustellen, sodass jedes a[i] aus A[i] ist. Fakultaet: Funktion, die eine natuerliche Zahl auf das Produkt aus der sich selbst und der Fakultaet ihres Vorgaengers abbildet. Man schreibt statt "fakultaet(n)" auch "n!". n! = n*(n-1)! und 0! = 1 n! = 1*2*...n Binomialkoeffizient: Funktion, die zwei natuerliche Zahlen n und k auf die Anzahl aller k-elementigen Teilmengen einer n-elementigen Menge abbildet. Man schreibt statt binkoeff(n,k) auch "n ueber k". binkoeff(n,k) = (n-0)*(n-1)*(n-2)*...(n-(k-1)) / k! binkoeff(n,k) = n! / k! / (n-k)! binkoeff(n,k) = binkoeff(n,n-k) Beispiel: binkoeff(4,2) = 6, denn moegliche 2-elementige Teilmengen der Menge {1,2,3,4} sind {1,2}, {1,3}, {1,4}, {2,3}, {2,4}, {3,4} Urnenmodell: Viele Aufgaben der Kombinatorik lassen sich an dem Urnenmodell veranschaulichen: Eine Urne enthaelt n durchnummerierte Kugeln und k Kugeln werden aus ihr gezogen. Man unterscheidet Prozesse * "mit Zuruecklegen/Wiederholung" (d.h. eine gezogene Kugel wird notiert und dann zurueck in die Urne gelegt) * "ohne Zuruecklegen/Wiederholung" (d.h. eine einmal gezogene Kugel nimmt nicht mehr teil, wenn die restlichen gezogen werden) * "mit Reihenfolge" (d.h. zwei Ergebnisse mit denselben k Kugeln, aber in unterschiedlicher Reihenfolge, gelten als verschieden) * "ohne Reihenfolge" (d.h. die zwei Ergebnisse mit denselben Kugeln gelten als gleich) Grundaufgaben der Kombinatorik: * "mit Zuruecklegen, mit Reihenfolge": n^k Beispiel: Eine Okarina mit 8 Loechern, die entweder offen oder geschlossen sein koennen. Es wird also aus einer Urne mt 2 Kugeln ("offen", "geschlossen", n=2) fuer jedes Loch einmal gezogen (k=8), wobei die Reihenfolge eine Rolle spielt und die Kugeln zurueckgelegt werden. * "ohne Zuruecklegen, mit Reihenfolge": (n-0)*(n-1)*...(n-(k-1)) = n! / (n-k)! Beispiel: Eine 5-koepfige WG bezieht ein Haus mit 7 Zimmern. Zur Ermittlung der Anzahl der moeglichen Zimmerverteilungen wird aus einer Urne mit 7 Kugeln (fuer jedes Zimmer) 5-mal gezogen, wobei die Reihenfolge eine Rolle spielt und die Kugeln nicht zurueckgelegt werden. * "mit Zuruecklegen, ohne Reihenfolge": binkoeff(n+k-1,k) = binkoeff(n+k-1,n-1) Beispiel: Es wird 3-mal gewuerfelt, die groesste Zahl wird mit 100, die mittlere mit 10 und die kleinste mit 1 multipliziert und die Summe wird gebildet. Das entspricht einer Urne mit 6 Kugeln, aus der 3-mal mit Zuruecklegen gezogen wird. Die Reihenfolge spielt keine Rolle. * "ohne Zuruecklegen, ohne Reihenfolge": binkoeff(n,k) Beispiel: Anzahl der Moeglichkeiten, beim Lotto aus 49 Kugeln ohne Reihenfolge und ohne Zuruecklegen 6 Richtige zu haben. Permutation: Eine Permutation eines N-Tupels ist ein N-Tupel, das aus denselben N Elementen in einer anderen Reihenfolge besteht. Die Anzahl der moeglichen Permutationen ist N!. Dies entspricht einer Urne mit N Kugeln, aus der N Kugeln ohne Zuruecklegen aber mit Reihenfolge gezogen werden. Teilmengenaufteilung: Hat man eine Menge A von N Elementen, so kann man sie in r disjunkte Teilmengen A1,A2,...Ar aufteilen. Dabei ist dann SUM(|Ai|)=N. Es gibt N! / |A1|! / |A2|! / ... / |Ar|! moegliche Aufteilungen. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Diskrete Verteilungen (Teil 3.6, S. 62) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Diskrete Verteilung: Aussagen ueber die Wahrscheinlichkeiten P(X=x) einer diskreten Zufallsvariable X. Die Summe aller P(X=x) einer Zufallsvariablen (entsprechend der Flaeche unter fX(x)) muss 1 sein. Diskrete Gleichverteilung: Eine diskrete Zufallsvariable X hat diskrete Gleichverteilung, wenn sie alle ihre Werte x1,x2,...xN mit der gleichen Wahrscheinlichkeit annimmt. fX(x) = 1/N fuer x E {x1,x2,...xN}, sonst 0 E(X) = SUM(xi) / N (Mittelwert der moeglichen Werte x1,x2,...xN) Var(X) = SUM(xi^2)/N - SUM(xi)^2/N Ein Lapalce-Experiment (s.o.) fuehrt beispielsweise zu einer solchen Verteilung. Bernoulli-Experiment: Wiederholte Durchfuehrung eines Zufallsvorgangs, bei dem ein Ereignis A mit der Wahrscheinlichkeit P(A)=p eintritt und mit der Wahrscheinlichkeit P(-A)=1-p nicht eintritt. Von Interesse ist die Wahrscheinlichkeit, dass bei n Wiederholungen A k-mal eingetreten ist. Ist X die Zufallsvariable, die ein Bernoulli- Experiment mit n Zufallsvorgaengen auf die Anzahl der eingetretenen A-Ereignisse abbildet, so gilt: P(X=k) = P(A ist bei n Wiederholungen k-mal eingetreten) = binkoeff(n,k)*p^k*(1-p)^(n-k) = fX(k) P(X<=x) = P(A trat bei n Wiederholungen hoechstens k-mal ein) = SUM( binkoeff(n,k)*p^k*(1-p)^(n-k) ) fuer k=1,2,..x = FX(x) fX(k) findet sich in Tabelle A (S. 825-829) der Tabellenkopien. Binomialverteilung: Eine Zufallsvariable, deren Verteilung nach FX(x) = P(X<=x) = SUM( binkoeff(n,x)*p^x*(1-p)^(n-x) ) gegeben ist, heisst binomialverteilt. Ein Bernoulli-Experiment mit n Zufallsvorgaengen und der Wahrscheinlichkeit p des positiven Ausgangs erzeugt demnach eine Binomialverteilung. Fuer p=0.5 ist die Wahrscheinlichkeitsfunktion symmetrisch zu n/2, fuer p<0.5 liegt das Maximum links, fuer p>0.5 rechts. Es gilt: E(X) = n * p Var(X) = n*p*(1-p) "Bernoulli-Experiment ohne Zuruecklegen": Ein Urnenmodell, bei dem die Urne N Kugeln enthaelt, wovon M weiss sind und der Rest schwarz. Nun wird n-mal ohne Zuruecklegen und ohne Reihenfolge gezogen. Von Interesse ist die Anzahl m der gezogenen weissen Kugeln. Hypergeometrische Verteilung: Diejenige Verteilung einer Zufalls- variable, die bei einem "Bernoulli-Experiment ohne Zuruecklegen" auftritt. Es gilt: P(X=m) = P(Bei N Kugeln, wovon M weiss sind, wurde m-mal eine weisse gezogen) = fX(m) = binkoeff(M,m)*binkoeff(N-M,n-m)/binkoeff(N,n) E(X) = n*M/N Var(X) = n * M/N * (N-M)/N * (N-n)/(N-1) Bei grossem N und kleinem n sind Binomialverteilung und hypergeometrische Verteilung aehnlich. (S.64) Poissonverteilung: Hypergeometrische Verteilung mit grossem n und kleinem p. Sei X die Zufallsvariable, die bei n->unendlich Wiederholungen eines Zufallsprozesses die Anzahl der (seltenen) positiven Ausgaenge zaehlt. P(X=k) = lambda^k/k! * e^-lambda lambda ist ein Parameter der Funktion. E(X) = lambda Var(X) = lambda E(X), der Erwartungswert, kann daher umgekehrt als Schaetzung fuer lambda verwendet werden, falls er bekannt ist. Wahrscheinlichkeit des k-maligen Eintretens eines Ereignisses A: Bei n unabhaengigen Zufallsvorgaengen: Es handelt sich um ein Bernoulli-Experiment mit Binomialverteilung p = Wahrscheinlichkeit des Ereignisses A P(X=k) = binkoeff(n,k)*p^k*(1-p)^(n-k) Bei n Zufallsvorgaengen ohne Zuruecklegen: Es handelt sich um ein "Bernoulli-Experiment ohne Zuruecklegen" mit hypergeometrischer Verteilung (S. 64, Formel 3.56) N = Gesamtzahl der moeglichen Ereignisse M = Anzahl der moeglichen positiven Ereignisse P(X=k) = binkoeff(M,k)*binkoeff(N-M,n-k)/binkoeff(N,n) Falls n sehr gross und die Wahrscheinlichkeit von A sehr klein ist: Es hanelt sich um eine Poissonverteilung (S. 65, Formel 3.59) P(X=k) = lambda^k/k! * e^-lambda lambda kann mit E(X) abgeschaetzt werden. ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Stetige Verteilungen (Teil 3.7-3.8, S. 67) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Normalverteilung: Hat eine stetige Zufallsvariable X die Dichte fX(x) = 1/sigma/SQRT(2*pi) * e^(-0.5*(x-my)^2/sigma^2) so heisst sie normalverteilt mit den Parametern my und sigma>0. Man schreibt: X ist in N(my,sigma). Es entsteht eine Glockenkurve, deren Maximum an my liegt. Beide Wendepunkte sind rechts und links je ein sigma von my entfernt. Je groesser sigma wird, desto flacher wird die Kurve. Es gilt: E(X) = my Var(X) = sigma^2 Standardnormalverteilung: Eine Normalverteilung mit my=0 und sigma=1. Die Verteilungsfunktion ist dann FX(X) = Psi(x) = INTEGRAL(-00,x,e^(-0.5*t^2)*dt) / SQRT(2*pi) Die Wahrscheinlichkeitsfunktion ist fX(x) = e^(-0.5*x^2) / SQRT(2*pi) fX(x) und FX(X) sind in Tabelle B (S. 830-836) der Tabellenkopien als "Ordinate" und "Flaeche" angegeben. z-Transformation einer Normalverteilung: Jede Normalverteilung N(my,sigma) einer Zufallsvariablen X laesst sich in eine Standard- Normalverteilung umrechnen: Z = (X - my)/sigma = (X-E(X))/SQRT(Var(X)) Wahrscheinlichkeit,dass ein Wert k Stdabweichungen von 0 entfernt ist: P(ABS(x)>k) = P(x<-k) + P(x>k) = FX(+1) - FX(-1) in einer Standardnormalverteilung. FX(x) findet sich als "Flaeche" zu einem z-Wert in Tabelle B (S. 830-836) der Tabellenkopien. Zentraler Grenzwertsatz: Sei X1,X2,...XN eine Folge von unabhaengigen Zufallsvariablen, die alle die gleiche Verteilung haben. Sei E(X)=my, Var(X)=sigma^2 und Yn = X1+X2+...Xn. Dann ist E(Yn) = n*my Var(Yn) = n*sigma^2 Dann strebt die normierte Verteilung der Summe Yn Zn = (Yn-n*my)/sigma/SQRT(n) mit wachsendem n gegen die Standardnormalverteilung, d.h. FZn(x) -> Psi(x) fuer n->00. Beispiel: Die Augensumme beim n-maligen Wuerfeln ist nach diesem Satz annaehernd normalverteilt. Gesetz der grossen Zahlen: Sei A ein Ereignis, das mit der Wahrscheinlichkeit P(A)=p eintritt, und X die Anzahl des Eintretens von A bei n unabhaengigen Wiederholungen. Dann gilt fuer jede beliebig kleine Zahl epsilon: P(X/n-p < epsilon) -> 1 fuer n->00 D.h. die durchschnittliche Anzahl des Eintretens von A (naemlich X/n) naehert sich fuer grosse n an p an. Dieser satz kann benutzt werden, um aus einem haeufigen Vorgang eine Wahrscheinlichkeit zu schaetzen. Freiheitsgrad: Berechnet sich eine Zufallsvariable Y aus anderen Zufallsvariablen X1,X2,...XN, so ist die Anzahl N dieser Zufallsvariablen der Freiheitsgrad von Y. Fuer den Freiheitsgrad schreibt man auch "df" ("degrees of freedom"). chi^2-Verteilung: Die Verteilung einer Zufallsvariablen X, die sich aus den unabhaengigen, standardnormalverteilten X1,X2,...Xn berechnet zu X = SUM(Xi^2) heisst chi^2-Verteilung mit n Freiheitsgraden. Es gilt: E(X) = n Var(X) = 2*n Mit chi^2(n,a) wird derjenige Wert bezeichnet, fuer den gilt: P(X<=chi^2(n,a)) = 1-a Die chi^2-Verteilung findet sich in Tabelle C (S. 837-839) der Tabellenkopien. t-Verteilung: Die Verteilung einer Zufallsvariablen Y, die sich aus den unabhaengigen, standardnormalverteilten X,X1,X2...Xn berechnet zu Y = X / SQRT(SUM(Xi^2)/n) heisst t-Verteilung mit n Freiheitsgraden. Es gilt: E(Y) = 0 falls n>1 Var(X) = n/(n-2) falls n>2 Mit t(n,a) wird derjenige Wert bezeichnet, fuer den gilt: P(X<=t(n,a)) = 1-a Die t-Verteilung ist symmetrisch zum Nullpunkt, daher gilt: P(Y liegt zwischen -t(n,a)/2 und +t(n,a)/2) = 1-a Die t-Verteilung findet sich in Tabelle D (S. 840-841) der Tabellenkopien. Siehe auch t(n,a) F-Verteilung: Die Verteilung einer Zufallsvariablen X, die sich aus den unabhaengigen, standardnormalverteilten X,X1,X2...Xm und Y1,Y2,...Yn berechnet zu X = SUM(Xi^2)/m / SUM(Yi^2) * n heisst t-Verteilung mit m Zaehler-Freiheitsgraden und n Nenner-Freiheitsgraden. Es gilt: E(Y) = n/(n-2) falls n>2 Var(X) = 2*n^2*(m+n-2)/m/(n-2)^2/(n-4) falls n>4 (S.74) Mit F(m,n,a) wird derjenige Wert bezeichnet, fuer den gilt: P(X<=F(m,n,a)) = 1-a Die F-Verteilung findet sich in Tabelle E (S. 840) der Tabellenkopien. Siehe auch F(m,n,a) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Einfuehrung in die Inferenzstatistik (Teil 4.1, S. 76) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Grundgesamtheit, Population: Menge aller Objekte oder Personen, die potenziell in eine Untersuchung eingehen koennten und ueber die nachher Aussagen gemacht werden sollen. Stichprobe: Teilmenge der Population, an der die Untersuchung durchgefuehrt wird. Stichprobendurchfuehrung: Aus der Population wird eine Stichprobe ausgewaehlt und an allen Objekten der Stichprobe ein bestimtes Merkmal gemessen. Dieses Vorgehen kann als Zufallsprozess angesehen werden, wobei X das gemessene Merkmal ist und Omega die Population. Streng genommen muessten die Elemente der Stichprobe "mit Zuruecklegen" gezogen werden, was man aber in der Praxis nicht tut. Bei einer grossen Population ist der Fehler verschwindend gering, der Standardfehler (s.u.) vervielfacht sich um SQRT( (|Q|-N) / (|Q|-1) ) Parameter von Verteilungen und Stichproben: Die Parameter der Population haben ihr Analogon bei den Parametern der Stichprobe: Kennwert Population Stichprobe Erwartungswert/Mittelwert my x quer Median my Schlange x Schlange Standardabweichung sigma s Varianz sigma^2 s^2 Korrelation rho r Wahrscheinlichkeitsfunktion relative Haeufigkeitsvert. Verteilungsfunktion relative Sumenhaeufigkeit Zufallsvariablen einer Stichprobe: Aus einer Population Omega wird eine Stichprobe {w1,w2,...wN} der Groesse N ausgewaehlt, an der das Merkmal X gemessen wird. Jede der N Messungen wird als neue Zufallsvariable aufgefasst: Xi(wi) = xi. Stichprobenraum: Menge aller N-elementigen Stichproben der Population Omega: Omega^N. Stichprobenfunktionen: Funktionen, die eine ganze Stichprobe in die reellen Zahlen abbilden. Stichprobenmittelwert: XMittel = SUM(Xi) / N Wenn die Xi alle gleichverteilt sind, also E(X1)=E(X2)...E(XN)=my und Var(X1)= Var(X2)=...Var(XN)=sigma^2, dann gilt: E(XMittel) = my Var(XMittel) = sigma^2 / N StdAbw(XMittel) = sigma / SQRT(N) Standardfehler des Mittelwertes: Standardabweichung der Zufallsvariablen XMittel: sigmaX = StdAbw(XMittel) = sigma / SQRT(N) Damit ist die Abweichung eines Stichprobenmittelwertes vom Erwartungswert geringer als die Abweichung eines Messwertes vom Erwartungswert (sigma). Der Standardfehler des Mittelwertes gibt die Wahrscheinlichkeit der Abweichung des Stichprobenmittelwertes vom Populationsmittelwert an. Stichprobenvarianzen: S^2 = SUM( (Xi-XMittel)^2 ) / (N-1) E(S^2) = sigma^2 Der Erwartungswert der Stichprobenvarianz ist gleich dem zu schaetzenden Parameter sigma^2 der Population (Erwartungstreue). Parameterschaetzung: Die Aufgabe, aus Werten der Stichprobe Werte der Population zu schaetzen (z.B. Erwartungswert oder Korrelationskoeffizient). Punktschaetzung: Bestimmung eines moeglichst guten Wertes fuer eine Stichprobe und Verallgemeinerung auf die Population. Vertrauensintervall, Koinfidenzintervall, Mutungsintervall: Ein Paar aus Unter- und Obergrenze mit Angabe der Wahrscheinlichkeit, mit der ein zu beschreibender Wert zwischen den beiden Grenzen liegt. Hypothesenpruefung: Eine wissenschaftliche Hypothese wird in die Sprache der Wahrscheinlichkeitstheorie uebersetzt. Dabei reduziert sich die Hypothese auf den Bezug von Wahrscheinlichkeitswerten zueinander (z.B. "my1 = my2"). Die Ausgangshypothese nennt man meist H1, die "Alternativhypothese" H0. Sodann zeigt man, dass H0 falsch ist (bzw. unwahrscheinlich) und folgert daraus H1. Kann die Hypothese nicht nach H1, so kommt sie nach H0. In diesem Fall waehlt man den Alpha-Fehler gross (s.u.) um den hier wichtigen Beta-Fehler gering zu halten. Signifikanzniveau: Vor der Hypothesenpruefung legt man sich auf einen Wahrscheinlichkeitswert fest, der angibt, mit welcher Wahrscheinlichkeit man H0 faelschlicherweise verwirft, d.h. die eigentliche Hypothese H1 faelschlicherweise annimmt. Dieser Wert ist moeglichst klein (z.B. 1%) und wird Signifikanzniveau genannt. D.h.: Nur wenn der tatsaechlich gemessene Wert sehr viel von dem von H0 geforderten Wert abweicht, was sehr unwahrscheinlich waere, wenn H0 wahr waere, entscheidet man sich fuer H1. signifikant: Ein Signifikanzniveau von unter 5%. hochsignifikant: Ein Signifikanzniveau von unter 1%. Fehler erster Art, Alpha-Fehler: Die Alternativ-Hypothese H0 faelschlicherweise verwerfen und damit die eigentliche Hypothese H1 faelschlicherweise annehmen. Aeusserst unguenstig, da eine falsche Theorie H1 veroeffentlicht wird. Die Wahrscheinlichkeit eines Alpha-Fehlers wird durch das Signifikanzniveau im Vorhinein festgelegt. Fehler zweiter Art, Beta-Fehler: Die Alternativ-Hypothese H0 faelschlicherweise annehmen und damit die eigentliche Hypothese H1 faelschlicherweise verwerfen. Nicht so schlimm, da nicht Ruf-schaedigend: Die ansich gute Theorie wird bloss nicht veroeffentlicht. Die Wahrscheinlichkeit eines Beta-Fehlers laesst sich nur berechnen, wenn H1 nicht zu allgemein formuliert ist. Wird der Alpha-Fehler groesser, so wird der Beta-Fehler kleiner und umgekehrt. Hypothese und Realitaet: Realitaet H0 H1 H0 korrekte Beibehaltung Beta-Fehler Test von H0 H1 Alpha-Fehler korrekte Zurueckweisung von H0 Anpassungstest: Spezialfall eines Hypothesentests, bei dem die Hypothese eine Aussage ueber eine ganze Verteilung einer Zufallsvariablen macht und nicht bloss ueber einen einzelnen Kennwert. In diesem Fall existiert keine eindeutige negierte Hypothese, die nach H0 koennte (die "Negation" einer Verteilung kann jede moegliche andere Verteilung sein). Daher kommt die Hypothese nach H0 und man haelt den Beta-Fehler indirekt klein, indem man den Alpha-Fehler gross waehlt (z.B. 20%). ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ Parameterschaetzung (Teil 4.2, S. 88) ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ z(a): Dasjenige Argument einer Standardnormalverteilungsfunktion, fuer das gilt P(X<=z(a)) = 1-a. Zu finden unter tabelleB(Spalte = 'z', Flaeche = 1-a) auf S. 830-836. t(n,a): Dasjenige Argument einer t-Verteilungsfunktion mit df Freiheitsgraden, fuer das gilt P(X<=t(n,a))=1-a. Zu finden unter tabelleD( df=n , Flaeche=1-a ) auf S. 840-841. Falls n>30, so ist t(n,a) = z(a). F(z,n,a): Dasjenige Argument einer F-Verteilungsfunktion mit z Zaehlerfreiheitsgraden und n Nennerfreiheitsgraden, fuer das gilt P(X<=t(z,n,a))=1-a. Zu finden unter tabelleE(Nennerdf=n, Zaehlerdf=z, Flaeche=1-a) auf S. 842-847. U(n1,n2,a): Wert einer U-Verteilung. Fuer a=5% zu finden als tabelleF(a=0.05,n1=n1,n2=n2) auf S. 849 chi^2(df,a): Dasjenige Argument einer chi^2-Verteilungsfunktion mit df Freiheitsgraden, fuer das gilt P(X<=chi^2(df,a)) = 1-a. Fuer a<25% zu finden unter tabelleC(df=df,Flaeche=1-a) auf S. 837-839. chi^2( 1 , 0.05) = 3.84146 chi^2( 1 , 0.01) = 6.63490 R(n,a): R-Wert fuer Stichprobengroesse n und Irrtumswahrscheinlichkeit a. Zu finden unter tabelleG(n = n, Spalte = a) auf S. 819 unten. Schaetzung des Erwartungswertes einer Zufallsvariablen aus Stichprobe: 1. Bestimme Stichprobengroesse N Irrtumswahrscheinlichkeit alpha = 5% Stichprobenmittelwert xMittel Stichprobenvarianz s^2 Standardfehler des Mittelwertes sx = s / SQRT(N) 2. Berechne Intervallhaelfte d = t(N-1,alpha/2)*sx 3. Gib an Der Erwartungswert my der Verteilung liegt mit einer Wahrscheinlichkeit 1-alpha im Intervall [ xMittel-d , xMittel+d ]. Schaetzung des Parameters p einer Binomialverteilung aus Stichprobe: 1. Bestimme Stichprobengroesse N Irrtumswahrscheinlichkeit alpha = 5% Relative Haeufigkeit von A r = AnzahlDesEintretens/N 2. Pruefe Normalitaet N*r*(1-r) >= 9 ? 3. Berechne Intervallhaelfte d = z(alpha/2) * SQRT(r*(1-r)/N) 4. Gib an Der Anteil des Ereignisses A liegt mit Wahrscheinlichkeit 1-alpha im Intervall [ r-d , r+d ]. Bestimmung der Stichprobengroesse bei stetiger Verteilung: 1. Bestimme Irrtumswahrscheinlichkeit alpha = 5% Laenge des Vetrauensintervalls d Varianz einer vorherigen Stichprobe s 2. Gib an Die Stichprobengroesse sollte ( 2*z(alpha/2)*s/d )^2 betragen. Bestimmung der Stichprobengroesse bei Binomialverteilung: 1. Bestimme Irrtumswahrscheinlichkeit alpha = 5% Laenge des Vetrauensintervalls d Parameter vorherigen Stichprobe p 2. Gib an Die Stichprobengroesse sollte (2*z(alpha/2)/d)^2 * p*(1-p) betragen. Einseitige Fragestellung: Die Frage, ob der Wert der einen Population groesser (bzw. kleiner) ist als der Wert der zweiten Population. Wird hier nicht behandelt, da fuer die Klausur vermutlich irrelevant. Zweiseitige Fragestellung: Die Frage, ob der Wert der einen Population verschieden ist vom Wert der zweiten Population. Abhaengige Stichproben: Stichproben mit denselben Merkmalstraegern oder vom statistischen Standpunkt her aequivalenten Merkmalstraegern. Unabhaengige Stichproben: Stichproben mit verschiedenen Merkmalstraegern. Test: Ein Algorithmus, der anhand zweier Stichproben bestimmt, ob sich die Kennwerte der zwei Populationen unterscheiden. Sind die Vorraussetzungen fuer einen Test (s. jew. unter "Pruefe") nicht erfuellt, so weicht man zu einem weniger anspruchsvollen Test aus, der dann zwar anwendbar ist, aber weniger aussagenkraeftig ist. t-hom-Test: Ein Test fuer den Vergleich der Erwartungswerte zweier unabhaengiger Stichproben ab Varianzhomogenitaet und Intervallskalenniveau. 1. Pruefe Unabhaengigkeit der Stichproben Intervalldaten Normalverteilung (wird angenommen) Varianzhomogenitaet (mit F-Test) 2. Stelle Hypothesen auf H0: my1 = my2 H1: my1 != my2 3. Bestimme Signifikanzniveau alpha = 5% Erste Stichprobengroesse N1 Zweite Stichprobengroesse N2 Erster Stichprobenmittelwert x1 Zweiter Stichprobenmittelwert x2 Erste Stichprobenvarianz s1^2 Zweite Stichprobenvarianz s2^2 4. Berechne sgq = ( (N1-1) * s1^2 + (N2-1) * s2^2 ) / (N1+N2-2) t = (x1 - x2) / SQRT( sgq * (1/N1 - 1/N2) ) tcrit = t( N1+N2-2 , alpha/2 ) 5. Gib an Falls ABS(t)>=tcrit: H0 wird verworfen Andernfalls: H0 wird beibehalten t-cor-Test: Ein Test fuer den Vergleich der Erwartungswerte zweier abhaengiger Stichproben ab Intervallskalenniveau. 1. Pruefe Abhaengigkeit der Stichproben Intervalldaten Normalverteilung der Differenzen (wird angenommen) 2. Stelle Hypothesen auf H0: my1 = my2 H1: my1 != my2 3. Bestimme Signifikanzniveau alpha = 5% Stichprobengroesse N Messwerte der ersten Messung x1,x2,...xN Messwerte der zweiten Messung y1,y2,...yN Mittelwert der ersten Messung x Mittelwert der zweiten Messung y Messwert-Differenzen d[i] = x[i]-y[i] Quadrierte Messwert-Differenzen d[i]^2 4. Berechne sdq = ( SUM(d[i]^2) / N - (x-y)^2 ) / (N-1) t = (x - y) / SQRT(sdq) tcrit = t( N1-1 , alpha/2 ) 5. Gib an Falls ABS(t)>=tcrit: H0 wird verworfen Andernfalls: H0 wird beibehalten F-Test: Test fuer den Vergleich der Varianzen zweier unabhaengiger Stichproben ab Intervallskalenniveau. 1. Pruefe Unabhaengige Stichproben Intervallskalenniveau Normalverteilung (wird angenommen) 2. Stelle Hypothesen auf H0: sigma1 = sigma2 H1: sigma1 != sigma2 Im Falle von H0 ist die Vorraussetzung fuer den t-hom-Test gegeben, daher ist die gewuenschte Hypothese in H0! 3. Bestimme grosse Irrtumswahrscheinlichkeit alpha = 10% Erste Stichprobengroesse N1 Zweite Stichprobengroesse N2 Erste Stichprobenvarianz s1^2 Zweite Stichprobenvarianz s2^2 4. Berechne Falls s1^2 >= s2^2: F = s1^2 / s2^2 dfZaehler = N1 - 1 dfNenner = N2 - 1 Andernfalls: F = s2^2 / s1^2 dfZaehler = N2 - 1 dfNenner = N1 - 1 Fcrit = F( dfZaehler, dfNenner, alpha) 5. Gib an Falls F >= Fcrit: H0 wird verworfen Andernfalls: H0 wird beibehalten U-Test: Test fuer den Vergleich der Erwartungwerte zweier unabhaengiger Stichproben ab Ordinalskalenniveau. 1. Pruefe Unabhaengige Stichproben Ordinalskalenniveau Stetige Verteilung (z.B. nicht fuer Binomialverteilung) 2. Stelle Hypothesen auf H0: P(X<=Y) = 0.5 (entspricht gleichem Erwartungsert) H1: P(X<=Y) != 0.5 (entspricht Ungleichgewicht) 3. Bestimme Signifikanzniveau alpha = 5% Erste Stichprobengroesse N1 Zweite Stichprobengroesse N2 4. Ordne Erstelle _eine_ _gemeinsame_ Rangreihe aller Messwerte (Achtung bei Rangbindungen) 5. Berechne Summe der Rangplaetze der ersten Stichprobe R1 = SUM(rangplatz(x[i])) U = N1*N2 + N1*(N1+1)/2 - R1 U' = N1*N2 - U Falls N1>20 oder N2>20: U ist approximativ normalverteilt Vcrit = z(alpha/2) E(U) = N1*N2/2 Var(U) = N1 * N2 * (N1+N2+1) / 12 V = ( U - E(U) ) / Var(U) Andernfalls: Ucrit = U(N1,N2,alpha) 6. Gib an Falls N1>20 oder N2>20: Falls ABS(V) >= Vcrit: H0 wird verworfen Andernfalls: H0 wird beibehalten Andernfalls: Falls min(U,U') <= Ucrit: H0 wird verworfen Andernfalls: H0 wird beibehalten Wilcoxon-Test: Test fuer den Vergleich der Erwartungswerte zweier abhaengiger Stichproben ab Ordinaldatenniveau. 1. Pruefe Abhaengige Stichproben Ordinalskalenniveau Stetige Verteilung (z.B. keine Binomialverteilung) 2. Bestimme Signifikanzniveau alpha = 5% Stichprobengroesse N (unveraenderte Merkmalstraeger werden weggelassen !) 3. Berechne Falls die Differenzen keine Aussage haben: Bilde fuer X und Y getrennte Rangreihen, ersetze jeden Messwert durch seinen Rangplatz Differenzen der Messwerte d[i] = x[i] - y[i] 4. Ordne Bringe die d[i] unter Vernachlaessigung ihres Vorzeichens in eine Rangreihe (Vorsicht bei Rangbindungen). 5. Berechne Summe der Rangplaetze der positiven d[i] R+ = SUM(rangplatz(d[i])) fuer d[i]>0 Summe der Rangplaetze der negativen d[i] R- = SUM(rangplatz(d[i])) fuer d[i]<0 R = min(R+,R-) Falls N gross: R ist normalverteilt E(R) = N * (N+1) / 4 Var(R) = N * (N+1) * (2*N+1) / 24 V = (R - E(R)) / SQRT(Var(R)) Vcrit = Z(alpha/2) Andernfalls: Rcrit = R(N) 6. Gib an Falls N gross: Falls ABS(V) >= Vcrit: H0 wird verworfen Andernfalls: H0 wird beibehalten Andernfalls: Falls R <= Rcrit: H0 wird verworfen Andernfalls: H0 wird beibehalten Vierfelder-chi^2-Test: Test fuer den Vergleich der Binomial-Parameter zweier unabhaengiger Stichproben ab Nominalskalenniveau. 1. Pruefe Nominalskalenniveau Die Stichproben K1 und K2 sind unabhaengig Zwei Reaktionskategorien R und ~R fuer beide Stichproben K1 und K2 2. Stelle Hypothesen auf H0: p1 = p2 H1: p1 != p2 p1 ist die Wahrscheinlichkeit fuer einen Merkmalstraegers aus K1, in R zu fallen, p2 die Wahrscheinlichkeit fuer einen Merkmalstraeger aus K2, in R zu fallen. Unter H0 ist die Verteilung auf die Reaktionskategorien R und ~R in beiden Stichproben gleich 3. Bestimme Signifikanzniveau alpha = 5% Anzahl aller aus K1 mit R a Anzahl aller aus K2 mit R b Anzahl aller aus K1 mit ~R c Anzahl aller aus K2 mit ~R d Gesamtzahl N = a+b+c+d Es ergibt sich folgende Tabelle: K1 K2 R a b a+b ~R c d c+d a+c b+d N = a+b+c+d 4. Pruefe Erwartete Haeufigkeiten >= 1, d.h. (a+b)*(a+c) >= N ? (a+b)*(b+d) >= N ? (a+c)*(c+d) >= N ? (b+d)*(c+d) >= N ? 5. Berechne chi^2 = N * (a*d-b*c)^2 / (a+b) / (a+c) / (b+d) / (c+d) chicrit = chi^2(1,alpha) 6. Gib an Falls chi^2 >= chicrit: H0 wird verworfen Andernfalls: H0 wird beibehalten McNemar-Test: Test fuer den Vergleich der Binomial-Parameter zweier abhaengiger Stichproben ab Nominalskalenniveau. 1. Pruefe Nominalskalenniveau Die Stichproben K1 und K2 sind abhaengig Zwei Reaktionskategorien R und ~R fuer beide Stichproben K1 und K2 2. Stelle Hypothesen auf H0: p = 0.5 H1: p != 0.5 p ist die Wahrscheinlichkeit eines gewechselten Merkmalstraegers, in der ersten Stichprobe in R zu fallen und in der zweiten Stichprobe in ~R zu fallen. Unter H0 wechseln in etwa gleich viele von R nach ~R und von ~R nach R. 3. Bestimme Signifikanzniveau alpha = 5% Anzahl aller aus K1 mit R a Anzahl aller aus K2 mit R b Anzahl aller aus K1 mit ~R c Anzahl aller aus K2 mit ~R d Gesamtzahl N = a+b+c+d Es ergibt sich folgende Tabelle: K2 R ~R R a b a+b K1 ~R c d c+d a+c b+d N = a+b+c+d 4. Pruefe Erwartungswert (b+c)/2 gross genug, d.h. (b+c)>=10 ? 5. Berechne chi^2 = (b-c)^2 / (b+c) chicrit = chi^2(1,alpha) 6. Gib an Falls chi^2 >= chicrit: H0 wird verworfen Andernfalls: H0 wird beibehalten Finden des richtigen Tests: Falls nur Nominalskalenniveau: Falls abhaengige Stichproben: McNemar-Test Andernfalls: Vierfelder-chi^2-Test Falls nur Ordinalskalenniveau: Falls abhaengige Stichproben: Wilcotzen-Test Andernfalls: U-Test Falls Intervallskalenniveau: Falls Vergleich der Varianzen: Falls abhaengige Stichproben: t-cors-Test (nicht bespr.) Andernfalls: F-Test Falls Vergleich der Erwartungswerte: Falls abhaengige Stichproben: t-cor-Test Andernfalls: F-Test durchfuehren Falls Varianzhomogenitaet: t-hom-Test Andernfalls: U-Test