Sie sind auf Seite 1von 11

MME KESKES AMEL Lycée MED Ali 2ème eco

Date ………………………………….
Python en utilisant Pandas
pour l’analyse des données Excel

Bibliographie : https://python.sdv.univ-paris-diderot.fr/cours-python.pdf
http://eric.univ-lyon2.fr/~ricco/tanagra/fichiers/fr_Tanagra_Data_Manipulation_Pandas.pdf
https://www.datacamp.com/community/tutorials/python-excel-tutorial?utm_
https://www.datacamp.com/community/tutorials/python-excel-tutorial?utm_source=adwords

I. Installer le logiciel « Anaconda »


- Se connecter à cette adresse https://www.anaconda.com/distribution/

-Vérifier le système d’exploitation de l’ordinateur 64-bits ou 32-bits et choisir le lien adéquat

P 1 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco

-Un fichier anaconda.exe sera enregistrer à chercher dans le dossier (téléchargement ou download ) de du
disque dur c :
-Lancer le fichier d’extension (.exe) pour installer sur l’ordinateur et suivre l’installation
-Pour commencer à écrire un programme , Lancer le logiciel « anaconda Navigator » et
lancer « Spider » :

II. Introduction

1. C’est quoi Python ?


Le langage de programmation Python a été créé en 1989 par ‘Guido van Rossum’.
La première version publique de ce langage a été publiée en 1991.
La dernière version de Python est la version 3, Plus précisément, la version 3.7 a été publiée en juin 2018.

2. Éditeur de texte
L’apprentissage d’un langage informatique comme Python va nécessiter d’écrire des lignes de codes à
l’aide d’un éditeur de texte ( exemple : anaconda, EduPython, , IDLE python … )

Premier contact avec Python est un langage interprété, c’est-à-dire que chaque ligne de code est lue puis
interprétée afin d’être exécutée par l’ordinateur.

Comme tout langage informatique, on peut enregistrer ces instructions dans un fichier, que l’on appelle
communément un script (ou programme) Python.

Remarque : L’extension du fichier standard des scripts Python est .py.

3. Introduction à Pandas
Pandas est une librairie ou bibliothèque python qui permet de manipuler facilement des données à
analyser :

Manipuler des tableaux de données avec des étiquettes de variables (colonnes) et d'individus (lignes).
Ces tableaux sont appelés Data Frames. On peut facilement lire et écrire ces data frames à partir ou vers
un fichier tabulé.
On peut facilement tracer des graphes à partir de ces data Frames grâce à matplotlib.

P 2 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Le module pandas a été conçu pour la manipulation et l’analyse de données. Il est particulièrement
puissant pour manipuler des données structurées sous forme de tableau.

Pour charger pandas dans la mémoire de Python, on utilise la commande import habituelle :

Pandas est souvent chargé avec un nom raccourci, comme pour NumPy et matplotlib :

- NumPy
La bibliothèque NumPy permet d’effectuer des calculs numériques avec Python. Elle introduit une
gestion facilitée des tableaux de nombres.
Il faut au départ importer le package numpy avec l’instruction suivante : >>> import numpy

4. Utilisation d’un fichier Excel ( scheet ) déjà créée avec Google drive
(formulaire) et faire des opérations de calculs avec pandas :

Activité :
 Ouvrir Google drive,
 ouvrir l’activité ‘éducation et scolarité’
 Cliquer sur l’option « réponses »
 Générer les réponses en un fichier sheet
 Enregistrer le fichier obtenu sur D:/Scolarite_et_education_reponses.xlsx
 Utiliser ce dernier fichier pour faire les exercices suivants hors ligne (sans connexion)

Conseil : Différenciez rapidement les fichiers Sheets et Excel dans Drive à l'aide des icônes ci-dessous.
Sheets Excel

Vous pouvez également télécharger une copie du fichier Sheets au format Excel, PDF, CSV, ODS ou
dans d'autres formats.

Dans Sheets, cliquez sur Fichier Télécharger au format.


Sélectionnez le format de fichier que vous souhaitez télécharger.

P 3 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco

 Exemple notre fichier de travail « D:/Scolarite_et_education_reponses.xlsx) » est le suivant :

Remarque : Votre fichier Excel ne sera pas modifié après avoir exécuté les programmes des exercices

III. Exercices prat/ théo


Exercise-1
Ecrire un Pandas programme pour lire un fichier Excel existant (exemple :
D:/Scolarite_et_education_reponses.xlsx) déjà créée par la génération des réponses du formulaire
créée dans le cours précédent ( création d’un formulaire avec Google forms ).

 Lancer le logiciel « Anaconda navigator / Spider », écrire le code source , enregistrer le fichier sous le nom
(lecturefichier.py) et faire son exécution comme suit :

P 4 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco

 Vocabulaire et définition :

Instruction Rôle

Import pandas Importer la bibliothèque appelée ‘pandas’ qui représenteles


procédures et les fonctions prédéfinies de python

df = pandas.read_excel(le chemin Df c’est le nom du Data frame créée: ( = tableau de données )


d’accés du fichier) Read : c’est pour lire le fichier Excel indiqué entre les parenthèses

Print (df.head) Ecrire ou afficher toutes les lignes du tableau sur l’écran de
l’ordinateur
Rem : header = 0 : la ligne numéro 0 correspond aux noms des champs du tableau

Exercise-2
Ecrire un Pandas programme pour lire les colonnes ( 1, 2 et 4 ) du fichier
D:/Scolarite_et_education_reponses.xlsx

 Lancer « Anaconda navigator/ Spider », écrire le code source , enregistrer le fichier sous le nom
(lirecolone.py) et faire l’exécution comme suit :

 Vocabulaire et définition :

Instruction Rôle
Import pandas Importer la bibliothèque appelée ‘pandas’ qui représente les
procédures et les fonctions prédéfinies de python

Cols = [1, 2, 4 ] On définit les numéros des colonnes à afficher

df = pandas.read_excel ( le Df c’est Data frame : ( = tableau de données )


chemin d’accés du fichier), Read : c’est pour lire le fichier Excel indiqué entre les parenthèses
usecols=cols et utiliser les colonnes définies dans cols
Print(df.head) Ecrire ou afficher toutes les colonnes du fichier sur l’écran de
l’ordinateur
P 5 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Exercise-3

Ecrire un Pandas programme pour déterminer et afficher ( la somme, la moyenne, le minimum et le


maximum ) de la colonne « Le prix d’une matière en moyenne par mois » du fichier
D:/Scolarite_et_education_reponses.xlsx

Remaeque : on utilisera le fichier scolarité.xlsx suivant car la colonne du formulaire est de type chaine de
caractères dont on ne peut pas faire des calculs.

--> Lancer « Anaconda navigator / spider», écrire le code source , enregistrer le fichier sous le nom (calcul.py) et
faire l’exécution comme suit :

P 6 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco

Exercice 4

Ecrire un Pandas programme pour insérer ou ajouter une colonne vide (nan) à la position zéro (0) (début
du fichier) nommée «VILLE» dans le fichier D:/Scolarite_et_education_reponses.xlsx

--> Lancer « Anaconda navigator/spider », écrire le code source , enregistrer le fichier sous le nom
(inserecolone.py) et faire l’exécution comme suit :

IV. applications prat/ théo:


D’abord créer le tableau suivant avec le logiciel « Excel » et faire les applications ci-dessous avec le logiciel
« python » (Anaconda/spyder), l’enregistrer sur D:/application.xlsx

P 7 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Application 1 :
Lire et afficher le tableau application.xlsx

Import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df.head)

Application 2 :
Afficher les noms de colonnes du tableau application1.xlsx

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df.columns)

Application 3 :
Afficher le type de chaque colonne

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df.dtypes)

Application 4 :
Afficher les premières lignes du tableau de la colonne NOM

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df['NOM’].head())

Application 5 :
Afficher les dernières lignes du tableau de la colonne NOM

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df[‘NOM’].tail())

P 8 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Application 6 :
Afficher l’âge maximale

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df['AGE 2020'].max())

Application 7 :
Afficher la première valeur de la colonne « AGE 2020 »

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df[‘AGE 2020’][0])

Application 8 :
Afficher les 3 premières valeurs de la colonne « AGE 2020 »

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df['AGE 2020'][0:3])
ou bien :
df = pandas.read_excel('D:/application.xlsx')
print(df. AGE 2020 [0:3])

Application 9 :
Afficher les valeurs de la colonne 'AGE 2020' triées ou classées d'une manière croissante (du
petit au grand)

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df['AGE 2020'].sort_values())

Application 10 :
Afficher le nombre de personnes pour chaque ville

import pandas
df = pandas.read_excel('D:/application.xlsx')
print(df[‘VILLE’].value_counts())

P 9 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco

IIV. Automatisation du processus d'écriture des données dans un fichier Excel :

Application 10 :
Avec python créer un fichier Excel appelé ("spreadsheet.xls"), nommer la feuille 1 de travail ("Python
feuille 1") et écrire le titre suivant à la ligne 1 colonne 1( "c’est le premier fichier excel")

# 1. Import `xlwt`
import xlwt

# Initialize a workbook
book = xlwt.Workbook(encoding="utf-8")

# Add a sheet to the workbook


sheet1 = book.add_sheet("Python feuille 1")

# Write to the sheet of the workbook


sheet1.write(0, 0, "c’est le premier fichier excel")

# Save the workbook


book.save("spreadsheet.xls")

--> Un fichier Excel sera créé automatiquement dans le dossier de travail comme suit :

P 10 / 11
MME KESKES AMEL Lycée MED Ali 2ème eco
Rem : pour refaire l’exécution du fichier python, fermer le logiciel Excel d’abord

Application 11
Remplir le fichier précédent par des données numériques

# 1. Import `xlwt`
import xlwt

# Initialize a workbook
book = xlwt.Workbook()

# Add a sheet to the workbook


sheet1 = book.add_sheet ("feuille1")

# The data
cols = ["A", "B", "C", "D", "E"]
txt = [0,1,2,3,4]

# Loop over the rows and columns and fill in the values
for num in range(5):
row = sheet1.row(num)
for index, col in enumerate(cols):
value = txt[index] + num
row.write(index, value)

# Save the result


book.save("test.xls")

--> Un fichier Excel sera créé automatiquement dans le dossier de travail comme suit :

P 11 / 11

Das könnte Ihnen auch gefallen