Beruflich Dokumente
Kultur Dokumente
Date ………………………………….
Python en utilisant Pandas
pour l’analyse des données Excel
Bibliographie : https://python.sdv.univ-paris-diderot.fr/cours-python.pdf
http://eric.univ-lyon2.fr/~ricco/tanagra/fichiers/fr_Tanagra_Data_Manipulation_Pandas.pdf
https://www.datacamp.com/community/tutorials/python-excel-tutorial?utm_
https://www.datacamp.com/community/tutorials/python-excel-tutorial?utm_source=adwords
P 1 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
-Un fichier anaconda.exe sera enregistrer à chercher dans le dossier (téléchargement ou download ) de du
disque dur c :
-Lancer le fichier d’extension (.exe) pour installer sur l’ordinateur et suivre l’installation
-Pour commencer à écrire un programme , Lancer le logiciel « anaconda Navigator » et
lancer « Spider » :
II. Introduction
2. Éditeur de texte
L’apprentissage d’un langage informatique comme Python va nécessiter d’écrire des lignes de codes à
l’aide d’un éditeur de texte ( exemple : anaconda, EduPython, , IDLE python … )
Premier contact avec Python est un langage interprété, c’est-à-dire que chaque ligne de code est lue puis
interprétée afin d’être exécutée par l’ordinateur.
Comme tout langage informatique, on peut enregistrer ces instructions dans un fichier, que l’on appelle
communément un script (ou programme) Python.
3. Introduction à Pandas
Pandas est une librairie ou bibliothèque python qui permet de manipuler facilement des données à
analyser :
Manipuler des tableaux de données avec des étiquettes de variables (colonnes) et d'individus (lignes).
Ces tableaux sont appelés Data Frames. On peut facilement lire et écrire ces data frames à partir ou vers
un fichier tabulé.
On peut facilement tracer des graphes à partir de ces data Frames grâce à matplotlib.
P 2 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Le module pandas a été conçu pour la manipulation et l’analyse de données. Il est particulièrement
puissant pour manipuler des données structurées sous forme de tableau.
Pour charger pandas dans la mémoire de Python, on utilise la commande import habituelle :
Pandas est souvent chargé avec un nom raccourci, comme pour NumPy et matplotlib :
- NumPy
La bibliothèque NumPy permet d’effectuer des calculs numériques avec Python. Elle introduit une
gestion facilitée des tableaux de nombres.
Il faut au départ importer le package numpy avec l’instruction suivante : >>> import numpy
4. Utilisation d’un fichier Excel ( scheet ) déjà créée avec Google drive
(formulaire) et faire des opérations de calculs avec pandas :
Activité :
Ouvrir Google drive,
ouvrir l’activité ‘éducation et scolarité’
Cliquer sur l’option « réponses »
Générer les réponses en un fichier sheet
Enregistrer le fichier obtenu sur D:/Scolarite_et_education_reponses.xlsx
Utiliser ce dernier fichier pour faire les exercices suivants hors ligne (sans connexion)
Conseil : Différenciez rapidement les fichiers Sheets et Excel dans Drive à l'aide des icônes ci-dessous.
Sheets Excel
Vous pouvez également télécharger une copie du fichier Sheets au format Excel, PDF, CSV, ODS ou
dans d'autres formats.
P 3 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Remarque : Votre fichier Excel ne sera pas modifié après avoir exécuté les programmes des exercices
Lancer le logiciel « Anaconda navigator / Spider », écrire le code source , enregistrer le fichier sous le nom
(lecturefichier.py) et faire son exécution comme suit :
P 4 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Vocabulaire et définition :
Instruction Rôle
Print (df.head) Ecrire ou afficher toutes les lignes du tableau sur l’écran de
l’ordinateur
Rem : header = 0 : la ligne numéro 0 correspond aux noms des champs du tableau
Exercise-2
Ecrire un Pandas programme pour lire les colonnes ( 1, 2 et 4 ) du fichier
D:/Scolarite_et_education_reponses.xlsx
Lancer « Anaconda navigator/ Spider », écrire le code source , enregistrer le fichier sous le nom
(lirecolone.py) et faire l’exécution comme suit :
Vocabulaire et définition :
Instruction Rôle
Import pandas Importer la bibliothèque appelée ‘pandas’ qui représente les
procédures et les fonctions prédéfinies de python
Remaeque : on utilisera le fichier scolarité.xlsx suivant car la colonne du formulaire est de type chaine de
caractères dont on ne peut pas faire des calculs.
--> Lancer « Anaconda navigator / spider», écrire le code source , enregistrer le fichier sous le nom (calcul.py) et
faire l’exécution comme suit :
P 6 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Exercice 4
Ecrire un Pandas programme pour insérer ou ajouter une colonne vide (nan) à la position zéro (0) (début
du fichier) nommée «VILLE» dans le fichier D:/Scolarite_et_education_reponses.xlsx
--> Lancer « Anaconda navigator/spider », écrire le code source , enregistrer le fichier sous le nom
(inserecolone.py) et faire l’exécution comme suit :
P 7 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Application 1 :
Lire et afficher le tableau application.xlsx
Import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df.head)
Application 2 :
Afficher les noms de colonnes du tableau application1.xlsx
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df.columns)
Application 3 :
Afficher le type de chaque colonne
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df.dtypes)
Application 4 :
Afficher les premières lignes du tableau de la colonne NOM
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df['NOM’].head())
Application 5 :
Afficher les dernières lignes du tableau de la colonne NOM
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df[‘NOM’].tail())
P 8 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Application 6 :
Afficher l’âge maximale
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df['AGE 2020'].max())
Application 7 :
Afficher la première valeur de la colonne « AGE 2020 »
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df[‘AGE 2020’][0])
Application 8 :
Afficher les 3 premières valeurs de la colonne « AGE 2020 »
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df['AGE 2020'][0:3])
ou bien :
df = pandas.read_excel('D:/application.xlsx')
print(df. AGE 2020 [0:3])
Application 9 :
Afficher les valeurs de la colonne 'AGE 2020' triées ou classées d'une manière croissante (du
petit au grand)
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df['AGE 2020'].sort_values())
Application 10 :
Afficher le nombre de personnes pour chaque ville
import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df[‘VILLE’].value_counts())
P 9 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Application 10 :
Avec python créer un fichier Excel appelé ("spreadsheet.xls"), nommer la feuille 1 de travail ("Python
feuille 1") et écrire le titre suivant à la ligne 1 colonne 1( "c’est le premier fichier excel")
# 1. Import `xlwt`
import xlwt
# Initialize a workbook
book = xlwt.Workbook(encoding="utf-8")
--> Un fichier Excel sera créé automatiquement dans le dossier de travail comme suit :
P 10 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Rem : pour refaire l’exécution du fichier python, fermer le logiciel Excel d’abord
Application 11
Remplir le fichier précédent par des données numériques
# 1. Import `xlwt`
import xlwt
# Initialize a workbook
book = xlwt.Workbook()
# The data
cols = ["A", "B", "C", "D", "E"]
txt = [0,1,2,3,4]
# Loop over the rows and columns and fill in the values
for num in range(5):
row = sheet1.row(num)
for index, col in enumerate(cols):
value = txt[index] + num
row.write(index, value)
--> Un fichier Excel sera créé automatiquement dans le dossier de travail comme suit :
P 11 / 11