Sie sind auf Seite 1von 26

Strategii de analiza datelor

Criterii pentru alegerea metodelor de analiza


Tipul de scala (n,o,i,p) Numarul de esantioane... (unul, doua sau mai multe) Natura relatiilor dintre aceste esantioane (independente sau dependente) Numarul variabilelor luate in considerare in analiza (unul, doua sau mai multe)

Obiectivele urmarite

Determinarea tendintei centrale a variabilelor considerate Caracterizarea variatiei si repartitiei acestora Masurarea gradului de asociere dintre ele Realizarea unor estimari si previziuni Evaluare diferentelor dintre variabile sau grupuri de variabile Evidentierea legaturilor cauzale dintre ele

Analiza univariata

Modalitatile de determinare a tendintei centrale Modalitati de caracterizare a variatiei si repartitiei variabilelor

Analiza bivariata

Presupune masurarea gradului de asociere a doua variabile sub aspectul


Directiei (naturii) Intensitatii Semnificatiei statistice

Testele utilizate sunt alese in functie de


modul de masurare al variabilelor, numarul de esantioane (grupuri) analizate si relatiile existente intre esantioane

Variabile categoriale

Variabile categoriale:

2 grupuri: Independente:

2 , MannWhitney, WaldWolfowitz 2 (varianta McNemar), Wilcoxon

Dependente:

mai multe grupuri: KruskalWallis

Variabile proportionale

2 grupuri:

Independente:

testul Student pentru variabile independente

Dependente:

testul Student pentru variabile dependente

mai multe grupuri:

ANOVA

Testul neparametric 2

In varianta clasica, testul 2 presupune testarea unor variabile categoriale (de regula nonparametrice) si independenta esantioanelor analizate. Se bazeaza pe utilizarea tabelelor de contingenta. Bazat pe ipoteza nula:

H0: nu exista diferente semnificative intre cele doua variabile.

Testul neparametric 2

Valoarea calculata c2 a testului se compara cu valoarea tabelata t2 a acestuia, obtinuta in functie de probabilitatea de garantare a rezultatului si gradele de libertate asociate: (r-1)(k1).

c2 t2 : se accepta ipoteza nula c2 > t2 : se respinge ipoteza nula

Pentru mai mult de doua subesantioane independente trebuie ca frecventele Oij > 1 si Oij < 5 sa nu depaseasca 20%.

Masurarea gradului de asociere

Pt Variabile nominale

rphi =

ad-bc

(a+b)(c+d)(a+c)(b+d)

Doar pt tabele 2x2 Valori intre -1 si 1

rphi2 determina in ce proportie preferintele pt o variabila sunt explicate de cealalta variabila

Masurarea gradului de asociere

Coeficientul de contingenta
C=

c2
N+ c2

Utilizat

indiferent de natura repartitie (normala sau nu) si de natura variabilelor (continue sau discrete)

Limitele coeficientului de contingenta

Nu ia valori intre (0, 1) ci intre 0, (k-1/k)1/2 cand k=r Doi indicatori de contingenta nu pot fi comparati intre ei decat daca sunt din tabele de contingenta de aceiasi marime C are sens doar daca se poate calcula c2

Testul neparametric 2 pt tabele 2x2

c2=

N(ad-bc)2
(a+b)(c+d)(a+c)(b+d)

Corectia pt continuitate

Deoarece testul este conceput pentru repartitii continue atunci cand il aplicam pentru date in forma discreta, pentru o mai mare exactitate aplicam o corectie de continuitate Corectia lui Yates

Recomandari
Daca

intr-un tabel de contingenta de tipul 2x2, N>40, se utilizeaza c2 preferandu-se pentru calcul ultima formula c2 se poae utiliza doar daca toate frecventele Aij sunt mai mari decat 5

20<N<40

Daca

N<20 sau 20<N<40 si Aij<5, se va utiliza testul probabilitatii exacte ale lui Fisher

Testul Mc Nemar

Inlocuieste testul 2 atunci cand cele doua esantioane investigate nu sunt independente

Utilizarea testelor neparametrice

atunci cnd variabila dependent este msurat pe scal nominal sau ordinal atunci cnd variabila dependent este de tip categorial, indiferent de scala de msurare volumul esantionului este foarte mic. atunci cnd, desi variabila dependent este msurat pe scal cantitativ (interval sau raport), nu ntruneste conditiile impuse de testele parametrice:

distributie care se abate grav de la forma normal asimetrie sau boltire mari, valori excesive:

Tipuri de teste neparametrice

Teste neparametrice pentru date nominale:

testul z pentru proportia unui singur esantion; testul z pentru diferenta dintre proportiile a dou esantioane; testul semnului; testul chi-ptrat al asocierii (independentei) testul chi-ptrat pentru gradul de corespondent (goodness of fit).

Teste neparametrice pentru date ordinale:


testul Mann-Whitney (U) pentru dou esantioane independente; testul Wilcoxon pentru dou esantioane perechi testul Kruskal-Wallis pentru mai mult de dou esantioane independente ; testul Friedman pentru msurri repetate teste de corelatie pentru date ordinale (Spearman, Kendall)

Comparaia a 2 grupuri distribuie normal teste parametrice Comparaia a 3 grupuri Corelaia a 2 variabile n acelai grup distribuie nonnormal Corelaia a 2 variabile n acelai grup teste nonparametrice Comparaia a 2 grupuri Comparaia a 3 grupuri Variabil dihotomic Interval de timp

Student (t) Test F (ANOVA) Corelaie (coeficient Pearson)/ regresie Corelaie (coef. Spearman)

Regresie liniar multipl

Variabil cantitativ

Variabil ordinal

Mann-Whitney U, Wilcoxon Kruskall-Wallis Regresie logistic Modelul lui Cox

X2 Fisher exact Log rank

Number of Dependent

Nature of Independent

Nature of Dependent Variable(s)

Variables

Variables
interval & normal ordinal or interval categorical (2 categories) 0 Ivs (1 population) 1 IV with 2 levels categorical interval & normal ordinal or interval

Test(s)
one-sample t-test one-sample median

binomial test Chi-square goodness-of-fit 2 independent sample t-test Wilcoxon-Mann Whitney test Chi- square test

categorical interval & normal 1 IV with 2 or more levels (independent groups) 1 IV with 2 levels (dependent/matched groups) ordinal or interval categorical interval & normal ordinal or interval categorical 1 IV with 2 or more levels (dependent/matched groups) interval & normal ordinal or interval categorical

Fisher's exact test one-way ANOVA Kruskal Wallis Chi- square test paired t-test Wilcoxon signed ranks test McNemar one-way repeated measures ANOVA Friedman test repeated measures logistic regression

2 or more IVs

interval & normal

factorial ANOVA

Number of Dependent Variables

Nature of Independent Variables 1 IV with 2 or more levels

Nature of Dependent Variable(s) Test(s)

2 or more 2 or more 2 sets of 2 or more

(independent groups) 2 or more

interval & normal interval & normal

one-way MANOVA multivariate multiple linear regression

interval & normal

canonical correlation

2 or more

interval & normal

factor analysis

http://www.ats.ucla.edu/stat/spss/sk/

Das könnte Ihnen auch gefallen