Cours Stata Mbaye Final

Introduction stata
SAMBA MBAYE Enseignant Chercheur UGB - CERDI E-mail: sambambayeptci@yahoo.fr Avril 2011
CHAPITRE I INTRODUCTION GENERALE
Quest ce que STATA

Cest un logiciel dentre, de gestion, danalyse des donnes statistiques. Cest un outil qui permet de produire des rsultats conomiques utiles pour les chercheurs et les dcideurs conomiques Cest un outil conomtrique et statistique puissant. Cest un logiciel souple car on peut ajouter des commandes supplmentaires Son langage est simple
Limites
Sa seule limite actuelle est la gestion de trs grosses bases de donnes.
Organisation pour travailler avec STATA: quelques conseils

Avant tout, pensez sauvegarder vos donnes (Un accident vite peut arriver et on risque de tout perdre).
Il faut toujours avoir un et un seul fichier pour chaque projet. Ce projet va contenir les donnes, les codes sources et les rsultats, ainsi que les rapports ventuels.
Il est aussi conseill de travailler avec les do file.
Organisation interne du logiciel

Stata est une srie de commandes rsultant de programmes trop longs ds fois. Stata peut-tre install sous trois format: petit(small), moyen (intercolled) grand (special edition) Il y a quatre principales fentres: Une fentre portant le nom de command pour taper les diffrentes commandes. Un fentre results affiche les calculs de Stata le plus souvent sous forme de tableaux. Un fentre variables ou les variables de la base de donnes utilises saffichent Une commande review permet de revoir les commandes effectues dans le pass et de les rpter sans avoir les rinscrire.
Comment crer une base de donnes

On utilise lditeur de donnes (data editor) (Faire un exemple simple) Si on a un fichier stata notre disposition, on peut louvrir en allant dans file open et on spcifie le chemin. On peut aussi utiliser le logiciel stat transfert pour transformer nimporte quelle base de donnes en format stata et travailler avec. Les bases de donnes stata ont une extension .dta . Quelle que soit la mthode, il est impratif dallouer stata suffisamment de mmoire (set memory).
Traitement de la base de donnes

Il faut commencer par labelliser les variables. (cela peut se faire directement partir du data editor)
Comment Trouver de laide

Il existe plusieurs faon dobtenir de laide. Les commandes man help, search sont les plus utilises. Les manuels de rfrence de Stata Le Site de stata, particulirement leur quipe technique qui est l pour conseiller et guider les usagers sur des problmes pointus Le moteur de recherche google
CHAPITRE II: DATA MANAGEMENT
STATA ET GESTIONS DES DONNES

Pour grer une base de donnes, il y a trois possibilits: Soit utiliser les menus droulants; Soit utiliser linteractivit Le do file
Quelques petits problmes

Vous allez rencontrer des difficults, stata va cracher et mettre des messages derreur. Ne vous dcouragez pas, cest normal pour un dbutant. Aprs chaque erreur stata met un code derreur. Mais ces codes ne sont pas trs parlant et servent surtout pour la programmation avance.
ANALYSE DESCRIPTIVE
Les commandes suivantes: inspect [nom de la variable] cette commande permet de faire des statistique sur le nombre des valeurs positives,ngative etc.. list[nom de la variable] affiche les valeurs prises. Codebook statistiques sur chaque valeur prise par les variables. La commande tabulate permet de crer des tableaux. La commande summarize (statistique descriptive,moyenne, cart type, )
ULISATION DE LA COMMANDE tabulate

Avec la version 9.1, on peut sarrter juste au diminutif de tabulate, en crivant tab ou ta , le rsultat sera le mme. La commande tab suivie de deux variables permet de sortir des tableaux croiss. On peut aussi utiliser la commande tab1. Elle a la mme fonction que tab
La commande summarize
On peut aussi utiliser le diminutif sum ou su On peut faire suivre la commande sum, plusieurs variables. Cela permet de voir ltat global de la base de donnes. su nom de la variable, detail permet davoir toutes les informations sur la variable en question.
La commande if
if permet de nappliquer la commande quaux observations remplissant une condition particulire. Syntaxe : commande variable if condition. Exemple: sum eau if region == Dakar.
La commande by, sort, in

by permet dappliquer une commande chaque valeur dune variable. La syntaxe de cette expression est: by variable : commande variable. Il faut que la base de donnes soit ordonne ou classe par cette variable. La commande sort permet de classer cette variable. On peut utiliser le sort avant le by ou bien faire tout en mme temps en utilisant la commande bysort. Exemple : bysort region : sum eau Permet dobtenir laccessibilit moyenne en eau potable par rgion. in permet de nappliquer la commande quaux observations se situant dans un intervalle donn. Syntaxe : commande variable in condition. Exemple sum eau in 10/20 donne les statistiques descriptives de la variable eau pour les observations de la 10me la 20me ligne de la base de donnes.
Commandes replace et drop

replace permet de changer le contenu dune variable Exemple : replace eau =2 Drop supprimer tout simplement une variable. Exemple: drop nom de la variable.
Exemple
N Amadou Boubacar Sophie Joseph Aminata Khady Alex Fatou Malick Abibatou Mamadou sexe 1 1 0 1 0 0 1 0 1 0 1 ressources 1 1 0 0 1 0 1 0 1 0 1 examen 6 9 14 11 10 13 15 16 13 12 10 mention
Renommer une variable

rename N nom rename examen notes La variable initialement appele , N portera le nom nom et examen prendra le nom notes . La commande browse nous permet de visionner les variables de la base.
Labellisation
Pour labelliser une variable, on peut crire directement la commande suivante: label var nom de la variable puis le label (label var n Noms des personnes). Pour labelliser une variable avec plusieurs modalits, on doit procder comme suit: label define sexe 1 masculin 0 feminin label values sexe sexe Pour ajouter un label on procde comme suit: label define sexe 3 "perhaps", add label define sexe 3 "maybe", modify
Crer une variable

La commande generate permet de crer de nouvelles variables on utilise souvent le diminutif gen
gen admis = 0 replace admis =1 if notes >=10 label define admis 1 russi 0 chec gen mention = 0 replace mention =1 if notes >=10 & notes < 12 replace mention =2 if notes >=12 & notes < 14 replace mention =3 if notes >=14 & notes < 16 replace mention =4 if notes >=16 label define mention 0 Insuffisant 1 Passable 2 Assez_bien 3 Bien 4 Trs_bien label values mention mention
label define ressources 1 Boursier 0 non boursier label values ressources ressources. bysort ressources : ta mention
Les graphiques
Faire des graphiques avec stata nest pas une chose simple. Nous prsentons les commandes nous permettant de faire des graphiques simples. Pour obtenir un graphique circulaire: graph. pie nom des variables Exemple: graph pie eau ecole_prim sante commerce route On peut afficher les graphiques par rgion aussi: Exemple: graph pie eau ecole_prim sante commerce route, by(region)
Les graphiques (X,Y)

Pour tous les graphiques (X,Y), la commande dbute par twoway suivi du type de graphique (X,Y) souhait. Parmi les principaux types : Les histogrammes On crit : twoway hist variable Exemple : twoway hist eau Loption title permet dcrire le titre du graphique Exemple : twoway hist eau, title(accs leau). Loption note permet de faire des notes de bas de page sur le graphique twoway hist eau, title(accs leau) note(accessibilit moyenne) Exemple : twoway hist eau, by(region)
Autres exemples
twoway line age examen, title(volution des rsultats suivant lage) note(source: scolarit) ytitle(age) xtitle(notes) sort note
Quelques oprateurs logiques utiles

Soustraction Division non Ou Renvoie de largument possdant la valeur la moins leve Min(x1xa) / Addition Multiplication Puissance Et Renvoie de largument possdant la valeur la plus leve + * ^ & Max(x1xa )
Diffrent Racine carre de x Plus petit Logarithme de x Plus petit ou gal
~= Sqrt(x) < Log(x) <=
gal ex Plus grand x Plus grand ou gal
== Exp(x) > Sum(x) >=
Chapitre III: Introduction la programmation sous stata
Fichier do ou do file
Pour crire un programme il faut ouvrir un fichier do. Donner un nom ce fichier.
Prambules
- #delimit Il permet de dlimiter les diffrentes instructions par un point virgule. version 9.1; clear; capture log close; - log using samba.log, text replace Il cre un fichier ou sera enregistr lensemble des rsultats du programme effectu. - set memory 100m Permet dallouer une mmoire vive stata. Cela permet douvrir des bases assez lourdes. - Set matsize 100 : permet de spcifier la taille de la matrice des donnes. - Use[nom de la base] permet dappeler la base utiliser pour effectuer le programme. Ici, il faut bien spcifier le le chemin (dans le cas contraire, le programme ne tournera pas). - A la fin de chaque programme faire un log close pour fermer le fichier log ( pas toujours ncessaires).
Chapitre IV: Introduction lEconomtrie

L'conomtrie: un lien entre la thorie conomique et les donnes. Elle permet d'ajouter une dimension empirique au raisonnement conomique.
Objets de lconomtrie
Reprsentation de modles conomiques sous une forme empiriquement testable: la recherche de spcification empirique. Estimation et tests d'hypothse sur des modles partir de donnes observes: l'infrence. Utilisation de modles des fins de prvision ou d'analyse de politiques.
De faon schmatique
Thorie conomique
Modle empirique
Donnes
Estimations
Tests dhypothses conomiques
Utilisation du modle, prvision et analyse politique
Dangers de lanalyse
Utiliser la thorie seulement sans valuation empirique. d'analyser des corrlations empiriques sans rfrence la thorie conomique.
Les modles de rgression linaire(simple ou multiple)
Les rgressions sont des outils qui permettent, entre autre, destimer leffet marginal de la variation dune unit de la variable indpendante sur la variable dpendante. On peut, par exemple, tester des thories conomiques, valuer limpact dune politique publique sur un chantillon de population ou mme de faire des prvisions
Le modle de rgression simple

Le modle rgression simple permet de spcifier le lien qui existe entre une variable quantitative et une autre. Par exemple la relation entre le revenu et la consommation, niveau du salaire et anciennet dans lentreprise etc. Sa formule se prsente comme suit: Y = aX + b + (1) Y est la variable dpendante, X est appel variable indpendante ou bien rgresseur (aussi covariate) a le coefficient de X, b le terme constant et le terme derreur.
Modle de rgression linaire multiple

Il Il arrive souvent qu'on veuille expliquer la variation d'une variable dpendante par l'action de plusieurs variables explicatives. Dans de telle situation on fait recours au modle de rgression multiple. Y = c + a1x1 + + anxn + (2) c est la constante du modle, ai les diffrents coefficients des variables explicatives et xi les diffrentes variables explicatives, est le terme derreur. (i varie de 1 n).
Les hypothses du modle

H1 Linarit: la relation entre y et x doit tre linaire H2 : Il nexiste pas de relation linaire exacte entre les variables indpendantes H3: Les variables indpendantes sont exognes. Cest-dire quil n y a pas de lien entre les variables indpendantes et le terme derreur. E( i) = 0, quel que soit i =1 n. Homoscdasticit: var( ) = 2 Autocorrlation: i et j sont non corrls cest--dire quil nexiste pas de relation entre ces deux termes.
Les mthodes de rgression: MCO

Si les conditions susmentionnes sont satisfaites lestimateur par les Moindres carrs ordinaires (MCO) est le meilleur estimateur quon peut utiliser. On parle alors destimateur BLUE (best linear unbiased estimator). Il sagit dun estimateur sans biais, variance minimale (estimateur le plus efficace) et convergent. La commande regress nous permet de faire des MCO.
Description sommaire de la mthode

Les paramtres inconnus de la relation stochastique suivante Yi = aXi + Sont a et . Leurs estimateurs fonds sur un chantillon de donnes sont notes par et e Ainsi lestimateur de Yi est donne par i = Xi. Lestimateur de lerreur (e) est obtenue en faisant: ei= Yi - Xi
Maintenant la mthode consiste minimiser la somme des carrs du rsidu (lerreur), do le nom de moindres carrs. Ce programme de minimisation aboutit au rsultat suivant: b = (XX)-1 XY
Sil existe par exemple un problme dhtroscdasticit ou dautocorrlation:

Lestimateur reste sans biais et est toujours convergent. Mais il nest plus lestimateur le plus efficient.
Interprtation des rsultats

Interprtation des rsultats Le R2 : coefficient de dtermination du modle. quand le R carr de lestimation est gal par exemple 0.50 cela veut dire que la variabilit des variables explicatives du modle expliquerait 50% la variabilit de la variable dpendante. R2 = 1- SCR/SCT SCT = SCR + SCE A partir de cette dcomposition, on peut juger la qualit de lajustement du modle. Pour calculer le R2, nous avons besoin des SCT SCR=somme des carrs rsiduels SCE=somme des carrs estims SCT=somme des carrs totale
dmonstration
La SCT permet de connatre la variabilit totale de la variable explique. Ceci est mesure par la distance qui spare les valeurs observes et leur moyenne.
N
SCT=
i !1
( yi y)
SCT peut-tre dcompose en deux parties: La variabilit des valeurs ajustes (SCE) ou variabilit explique et la variabilit des rsidus.
Dmonstration
En fait
( yi y ) ! ( yi y ) ( yi yi ) (yi y) ! (yi y) (yi yi)
Dmonstration
Variabilit totale = variabilit explique + variabilit rsiduelle
Qualit ajustement
Plus le SCE est proche de la SCT, meilleur est lajustement Plus le R2 est proche de 1, meilleur est lajustement . Cependant ce coefficient nest pas pertinent pour comparer le pouvoir explicatif plusieurs modles ne comprenant pas le mme degr de libert.
Qualit de lajustement
Se baser sur R carr pour apprcier le modle peut conduire lerreur. Par exemple un R carr faible peut-tre justifier par labsence de certaines variables explicatives. Il peut aussi tre biais la hausse si le nombre de variables indpendantes est lev. Il est prfrable dutiliser le R carr ajust. SCR ( N K ) 2 2 K 1 2 R !R (1 R ) ! 1 N K SCT ( K 1)
Le test de significativit globale du modle (significativit globale du modle F de Fischer). La formule du test de fisher: R / K 1) F[K 1, n K] ! 2 (1 R ) /(n K)
2
Le test de student.
Qualit ajustement
MSE : Mean Square Error : Il sagit de la valeur espre de lerreur au carr. Il permet de dterminer si le modle nest pas adapt au donnes utilises ou bien sil peuttre simplifi en enlevant certaines limites. Root MSE: cest la racine carr de MSE. En statistiques, l'erreur quadratique moyenne ou MSE d'un estimateur est une des nombreuses faons de quantifier la diffrence entre un estimateur et la vraie valeur de la quantit estime. Lidal cest davoir une EQM = 0 dans ce cas on a une prcision parfaite. Cependant dans la ralit cette situation narrive jamais.
Les tests de validit dun modle

Test de normalit des rsidus La commande sktest permet de faire le test de normalit dune variable donne. On procde comme suit: on rcupre le rsidu avec la commande predict aprs la rgression: regress Y X1 X2, robust predict residu, resid sktest residu Quand la probabilit du test est suprieure 10% on ne peut pas rejeter lhypothse nulle (Ho) de normalit des erreurs. La commande kdensity nous permet de visualiser lallure du terme derreur. kdensity, normal permet de faire une comparaison avec la distribution normale
Test de Ramsey Reset ou test de validit du modle

Le test de Ramsey permet de tester lomission de variables explicatives pertinentes ou une mauvaise spcification du modle. La commande ovtest nous permet de faire un tel test. Si la probabilit est suprieure 10% on accepte (Ho) dune bonne spcification.
Test de dtection de lhtroscdasticit

La commande hettest utilise le test de breusch Pagan pour tester lhypothse dhomocdasticit des rsidus. Elle fonctionne suivant le mme principe que le test ovtest. Seulement ici dans la rgression, on utilise pas loption robust. Loption robust permet de corriger le problme dhtroscdasticit par la mthode de white.
Test dautocorrlation
En panel on utilise la commande xtserial pour faire le test dautocorrlation. Il sagit du test de wooldridge pour dtecter lautocorrlation.
Lconomtrie des variables qualitatives
Introduction
Les modles des variables qualitatifs sont dvelopps pour la premire fois par Berkson(1944,1951). Il sagit essentiellement des modles (probit et logit). Les premires applications taient faites dans le domaine de la biologie de la sociologie et de la psychologie. Les conomistes lutilisent vers les annes 70 avec les travaux de Daniel Macfadden(1974) et James Heckman(1976).
Le modle qualitatif
Supposons lexistence dun caractre qualitatif qui peut prendre K modalits distinctes Si k=2 on dit que la variable est dichotomique; si k>2 on dit que la variable est polytomique. Maintenant la question cest comment intgrer un caractre qualitatif dans un modle conomtrique?
exemples
Le type dtudes suivi par un tudiant: (universitaire,cole dingnieur etc) . La catgorie socio-professionnelle (ouvrier, employ, cadre .) . Le fait dtre ou non au chmage Comment doit on reprsenter ces diffrents caractres qualitatifs. La rponse naturelle consiste coder les diffrentes modalits.
Yi =0 si lvenement sest ralis pour lindividu i Yi=1 si lvenement ne sest pas ralis pour lindividu i
Soit le modle suivant:

y*i = axi + i O i indique lobservation tandis que reprsente le terme derreur. Quand la variable explique prend 1 ou 0 lestimation linaire nest pas approprie car les valeurs prdites peuvent tre suprieures 1 inf 0 ou entre 0 et 1; Etant donn que nous avons des probabilits, on ne peut avoir une valeur suprieure 1; Donc les MCO ne passent pas.
Ici on modlise non pas la variable dpendante y mais la probabilit quelle prenne la valeur 1 ou 0. Pour modliser cette probabilit, on suppose quil existe une variable latente y* telle que: y=1 si y*0 et y= 0 si y*0.
Les modles probit logit

la commande probit permet de faire la rgression des variables qualitatives. La commande logit permet de faire des rgressions sur des variables qualitatives.
Les modles dichotomiques probit et logit admettent pour variable explique, non pas un codage quantitatif associ la ralisation dun vnement (comme dans le cas de la spcification linaire), mais la probabilit dapparition de cet venement, conditionnellement aux variables exognes: Ainsi, on considre le modle suivant :
pi = Prob (yi = 1| xi) = F (xi )

o la fonction F(.) dsigne une fonction de rpartition.
Toutefois, on utilise gnralement deux types de fonction : la fonction de rpartition de la loi logistique et la fonction de rpartition de la loi normale centre rduite. A chacune de ces fonctions correspond un nom attribu au modle ainsi obtenu: modle logit et modle probit
Le modle probit et logit

Comme dj annonc, le modle probit est bas sur la fonction de rpartition de la loi normale. On suppose que lerreur suit une loi normale centre et rduite. Le modle utilise la fonction de rpartition de la loi logistique de moyenne nulle et de variance pi2/3. Il est difficile de justifier sur le plan thorique le choix entre un modle probit et un modle logit. Il est donc conseill de prsenter les rsultats issus des deux modles.
Le modle probit et logit

Il faut se rappeler que les coefficients du probit ne sont pas immdiatement comparables ceux du logit. La variance des carts alatoires du probit est normalis 1 alors que celle du logit pi2/3. Pour rendre les coefficients du probit comparables ceux du logit il suffit donc de les multiplier par 1,8. (aussi le coefficient de 1,6 a t propos par Amemiya (1981). La diffrence entre les deux lois reposent dans les queues de distribution qui sont plus paisses dans le cas de la loi logistique.
La mthode destimation
La mthode destimation appropri est celle du Maximum de vraisemblance. La vraisemblance cest la probabilit dobserver un chantillon sachant les paramtres du modle qui ont engendr les observations. Maximiser la vraisemblance consiste alors chercher la valeur des paramtres telle que lobservation de lchantillon soit la plus probable.
applications
probit foreign weight mpg logit foreign weight mpg Quand par exemple la variable weight a un coef ngatif et significatif cela veut dire comme interprtation quil est peu probable que des cars lourds proviennent de ltranger.
Lvaluation de la qualit du modle

Pseudo R2 sinterprte de la mme faon que le coefficient de dtermination du modle.
Si les variables dpendantes ont plusieurs modalits:

Si ces modalits sont ordonnes : on fait appel ce quon appel les probits ordonns ou logit ordonns effectus par les commandes oprobit et ologit Si les modalits ne sont pas ordonnes on fait rfrence aux modles multinomiaux. Les commandes sont alors mlogit et mprobit.
Dfinition modalits ordonnes ou pas

Les diffrents niveaux de pauvret sont considrs comme ordonns car nous avons une suite logique. Trs Riche riche Pauvre Trs pauvre Cependant les donnes non ordonnes .Franais .Amricain .Asiatique
Lconomtrie des donnes de panel
Dfinitions
Un panel: Il sagit dobservations sur un ensemble dindividus plusieurs moments du temps Exemple: les enqutes mnage sur la pauvret: un chantillon de mnage observ sur plusieurs priodes.
Niveau de revenu des mnages dans le temps
Men1 1990 1991 2007 (t=18) .

X17,1 X1,1
Men2
X1,2
Men30
X1,30
X2,1
X2,2
X2,30
..
X17,2
.
X17,30
Avantages des donnes

Plus dobservations Prise en compte de lhtrognit On peut tenir compte de linfluence des caractristiques non observables On capte des effets de court et de long terme Rduction du biais destimation des coefficients
Inconvnients
Prsence dobservations aberrantes qui peut entrainer la perturbation de la qualit des estimations Observations non renseignes.
Caractristiques des donnes de panel

Une des caractristiques fondamentales des donnes de panel cest leur double dimension. Une dimension individuelle et une dimension temporelle Cette double dimension permet dtudier la dynamique et lhtrognit des comportements des agents (Balestra et Nerlove 1995).

Il existe deux types dhtrognit Lhtrognit observe et lhtrognit inobserve La premire est contrlable avec les variables explicatives La seconde est plus problmatique Par exemple la productivit dun individu dpend de son niveau dducation et de certaines caractristiques individuelles inobserves (habilet, prfrences)

Ne pas tenir compte de cette htrognit inobserve peut conduire soit une perte defficacit de lestimateur des MCO soit un estimateur biais. Cette htrognit ne peut pas tre contrl dans les analyses en coupe instantane ou sur srie temporelle.
Les modles effets fixes et alatoires

En conomtrie de panel nous avons essentiellement deux types de modle (les modles effets fixes et effets alatoire)! Ces deux types de modles permet de capter les caractristiques individuelles non mesurables. Pour faire un application en panel, il faut procder comme suit:
Crons un identifiant individuel et temporel soit ident lidentifiant individuel et temp identifiant temporel pour crer ident, on crit: egen ident = group(nom de lobservation individuelle) pour lidentifant temp il sagit juste de la variable temps.
Il faut maintenant dclarer les identifiants en faisant: tis nom de lidentifiant: pour lidentifiant temporel iis nom de lidentifiant : pour ce qui de lidentifiant individuel
LE Modle effets fixes

xtreg variable dpendante variables indpendantes, fe On parle deffets fixes quand les effets spcifiques sont corrles avec les variables explicatives. xtreg calcule trois statistiques: Pour le modle effet fixe, le R2 le plus pertinent est le R2 within Dans le tableau, il existe deux statistiques du test de Fisher. La premire en haut du tableau teste la significativit conjointe des variables explicatives du modle. La deuxime en bas du tableau test la significativit jointe des effets fixes introduits.

La commande xtreg ne permet pas doption robust pour corriger lhtroscdasticit par la mthode de White. Pour le faire il faut utiliser la commande areg. Il sagit areg la place de xtreg pour obtenir les mmes rsultats tout en corrigeant pour lhtroscdasticit. La syntaxe: areg nom des variables, absorb(id) robust Loption absorb (id) spcifie la variable (id) comme reprsentant de la dimension transversale.

Loption predict yhat, xb prdit la variable dpendante et stocke les donnes dans la variable nomme yhat predict ef, u prdit les effets fixes stocks dans la variables ef predict residu, e prdit les erreurs stockes dans la variables residu

predict ef, d prdit leffet fixe predict residu, r prdit des rsidus
Le modle effets alatoires

xtreg var dependantes var indpendantes, re On parle deffet alatoire quant on suppose quil y a une indpendance entre les effets spcifiques et les variables explicatives du modles En faisant des effets alatoires le R2 le plus pertinent cest le R2 between. Le R2 within donne une ide de la contribution des effets alatoires au modle
Le modle effets alatoires

La commande xttest0 aprs une estimation des effets alatoires permet dobtenir la statistique du test de Breusch Pagan qui teste la significativit des effets alatoires. La probabilit obtenue est compare 5% Si on obtient une probabilit de 5%, on dit que les effets alatoires sont globalement significatifs un seuil de 5%.
Le test de Hausman
Le test de hausman nous permet de savoir entre les effets fixes et les effets alatoires, quel est le modle choisir? La syntaxe: xtreg, ., fe est store eq1 Xtreg, , re hausman eq1
Le test de Hausman
Si la probabilit obtenue est infrieure 10%, cela signifie que le modle effets fixes est prfrable au modle effets alatoires.

Cours Stata Mbaye Final

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Cours Stata Mbaye Final

Hochgeladen von

Copyright:

Verfügbare Formate

Introduction stata

CHAPITRE I INTRODUCTION GENERALE

Quest ce que STATA

Organisation pour travailler avec STATA: quelques conseils

Il est aussi conseill de travailler avec les do file.

Organisation interne du logiciel

Comment crer une base de donnes

Traitement de la base de donnes

Comment Trouver de laide

CHAPITRE II: DATA MANAGEMENT

STATA ET GESTIONS DES DONNES

Quelques petits problmes

ULISATION DE LA COMMANDE tabulate

La commande by, sort, in

Commandes replace et drop

Renommer une variable

Crer une variable

Les graphiques (X,Y)

Quelques oprateurs logiques utiles

Diffrent Racine carre de x Plus petit Logarithme de x Plus petit ou gal

~= Sqrt(x) < Log(x) <=

gal ex Plus grand x Plus grand ou gal

== Exp(x) > Sum(x) >=

Chapitre III: Introduction la programmation sous stata

Chapitre IV: Introduction lEconomtrie

Tests dhypothses conomiques

Utilisation du modle, prvision et analyse politique

Les modles de rgression linaire(simple ou multiple)

Le modle de rgression simple

Modle de rgression linaire multiple

Les hypothses du modle

Les mthodes de rgression: MCO

Description sommaire de la mthode

Sil existe par exemple un problme dhtroscdasticit ou dautocorrlation:

Interprtation des rsultats

Les tests de validit dun modle

Test de Ramsey Reset ou test de validit du modle

Test de dtection de lhtroscdasticit

Lconomtrie des variables qualitatives

Soit le modle suivant:

Les modles probit logit

pi = Prob (yi = 1| xi) = F (xi )

Le modle probit et logit

Le modle probit et logit

Lvaluation de la qualit du modle

Si les variables dpendantes ont plusieurs modalits:

Dfinition modalits ordonnes ou pas

Lconomtrie des donnes de panel

Niveau de revenu des mnages dans le temps

Men1 1990 1991 2007 (t=18) .

Avantages des donnes

Caractristiques des donnes de panel

Caractristiques des donnes de panel

Caractristiques des donnes de panel

Les modles effets fixes et alatoires

LE Modle effets fixes

LE Modle effets fixes

LE Modle effets fixes

LE Modle effets fixes

Le modle effets alatoires

Le modle effets alatoires

Das könnte Ihnen auch gefallen