TP Traitement Image PDF

UNI
VERSI
TÉHASSAN 1ERSETTAT
3ÉMÉ ANNÉECYCLEI
NGÉNI
EUR
ECOLENATI
ONALEDESSCIENCESAPPLI
QUÉES
2013
GÉNI
EÉLECTRI
QUE
KHOURIBGA
2014-
ANORMEJ
L PEG
ETUDEDECOMPRES
SION
S
ETUDEDECOMPRESION
PEG
ANORMEJ
L
COMPTERENDUDETRAVAUXPRATI
QUES
L
ANORMEJ
PEGDECOMPRESI
ONDESI MAGESFI
XESS
OUSMATL
AB
REALI
SERPAR ENCADREPAR
OMARBARMAKI PR.
FATANI
YACI
NEA.AMKAS
SOU
2013-
2014
Université HASSAN I
ENSA Khouribga
La norme JPEG de compression des

images fixes
Réalisé par :
Yacine Abdessalam Encadrant :
AMKASSOU Pr. Imad F.Eddine FATANI
Omar BARMAKI
8 janvier 2014
Table des matières
1 Introduction 2
1.1 Traitement d’image . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 La norme JPEG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Préparation 3
3 La transformée en cosinus Discrète 3

3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.2 Propriétés de base de la DCT . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3.3 Calcul de la DCT via une FFT . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.4 La DCT à deux dimensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.5 Description du noyau de la transformée bidimensionnelle . . . . . . . . . . . . . 7
4 Traitement de l’image par bloc 8
5 La quantification, clef de lma compression 8

5.1 Étude de la quantification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
6 Conclusion 12
1
1 Introduction
1.1 Traitement d’image
Le traitement d’images est une discipline de l’informatique et des mathématiques appliquées
qui étudie les images numériques et leurs transformations, dans le but d’améliorer leur qualité
ou d’en extraire de l’information. Il s’agit d’un sous-ensemble du traitement du signal dédié aux
images et aux données dérivées comme la vidéo (par opposition aux parties du traitement du
signal consacrées à d’autres types de données : son et autres signaux monodimensionnels notam-
ment), tout en opérant dans le domaine numérique (par opposition aux techniques analogiques
de traitement du signal, comme la photographie ou la télévision traditionnelles).
Dans le contexte de la vision artificielle, le traitement d’images se place après les étapes
d’acquisition et de numérisation, assurant les transformations d’images et la partie de calcul
permettant d’aller vers une interprétation des images traitées. Cette phase d’interprétation est
d’ailleurs de plus en plus intégrée dans le traitement d’images, en faisant appel notamment à
l’intelligence artificielle pour manipuler des connaissances, principalement sur les informations
dont on dispose à propos de ce que représentent les images traitées (connaissance du domaine).
Le traitement d’images commence à être étudié dans les années 1920 pour la transmis-
sion d’images par le câble sous-marin allant de New York à Londres. Harry G. Bartholomew
et Maynard D. McFarlane effectuent la première numérisation d’image avec compression de
données pour envoyer des fax de Londres à New York. Le temps de transfert passe ainsi de plus
d’une semaine à moins de trois heures. Il n’y a pas vraiment d’évolution par la suite jusqu’à la
période d’après-guerre1. Le traitement du signal prend de l’importance vers la fin de la Seconde
Guerre mondiale avec l’arrivée du radar. La prospection pétrolière participe aussi beaucoup au
développement des techniques de traitement du signal.
Le véritable essor du traitement d’images n’a lieu que dans les années 1960 quand les ordi-
nateurs commencent à être suffisamment puissants pour travailler sur des images. Peu après,
la redécouverte de la transformée de Fourier rapide (FFT) révolutionne le domaine, en ren-
dant possible les manipulations du contenu fréquentiel des signaux sur ordinateur. Cependant,
l’essentiel des recherches porte encore, à cette époque, sur l’amélioration des images et leur
compression.
1.2 La norme JPEG

La norme JPEG est une norme qui définit le format d’enregistrement et l’algorithme de
décodage pour une représentation numérique compressée d’une image fixe. JPEG est l’acronyme
de Joint Photographic Experts Group. Il s’agit d’un comité d’experts qui édite des normes
de compression pour l’image fixe. La norme communément appelée JPEG, de son vrai nom
ISO/CEI 10918-1 — UIT-T Recommendation T.81, est le résultat de l’évolution de travaux qui
ont débuté dans les années 1978 à 1980 avec les premiers essais en laboratoire de compression
d’images. JPEG définit deux classes de processus de compression :
– avec pertes ou compression irréversible. C’est le JPEG classique . Il permet des taux de
compression de 3 à 100.
– sans pertes ou compression réversible. Il n’y a pas de pertes d’information et il est donc
possible de revenir aux valeurs originales de l’image. Les gains en termes de compression
sont alors plus modestes, avec un taux de compression de l’ordre de 2 à 8. Cette partie
fait l’objet d’une norme spécifique appelée JPEG-LS.
2
Cet algorithme est très populaire, en particulier sur Internet où la compression d’un fichier
permet de réduire le coût en bande passante. Il est de plus possible d’enregistrer une image
dans le format JPEG avec la majeure partie des appareils photos numériques et téléphones
portables. Cependant, les pertes se produisant lors de la compression ”classique” font qu’il
est moins utilisé dans certains domaines comme l’imagerie médicale, où la restitution fidèle de
l’image initiale est plus importante.
2 Préparation
1. Le procssus de codage/décodage JPEG :
– 8x8 : Découpage de l’image original sous forme numérique ;

– Transformée en cosinus discrète (DCT) : on l’utilise pour la décorrélation des donées
et pour la concetration de l’energie dans les basses fréquencs.
– La quantification (Q) : Pour éliminer les hautes fréquences.
– Zig-Zag : Pour la mise en série des données.
– Codage : Codage de manière optimale.
2. Dans la pratique, une certaine perte d’informations reste cependant possible en raison
des erreurs d’arrondis introduites en cours de calcul lorsqu’on fait la quantification.
3. la quantification ramène beaucoup de coefficients à 0 (surtout en bas à droite dans la
matrice, là où se trouvent les hautes fréquences). Seules quelques informations essentielles
(concentrées dans le coin en haut à gauche) sont gardées pour représenter le bloc. La
redondance des données contenues dans le bloc augmente ainsi fortement, ce qui peut être
exploité par un algorithme de compression : au moment de coder le résultat dans le fichier,
la longue suite de zéros nécessitera très peu de place. Cependant, si la quantification est
trop forte (= taux de compression trop élevé), il y aura trop peu de coefficients non nuls
pour représenter fidèlement le bloc. Le problème apparaı̂tra lors du décodage nécessaire
pour l’affichage de l’image : à l’écran la division en blocs deviendra visible, et l’image
aura un aspect pixellisé .
3 La transformée en cosinus Discrète

3.1 Introduction
La transformée en cosinus discrète ou TCD (de l’anglais : DCT ou Discrete Cosine Trans-
form) est une transformation proche de la transformée de Fourier discrète (DFT). Le noyau de
projection est un cosinus et crée donc des coefficients réels, contrairement à la DFT, dont le
3
noyau est une exponentielle complexe et qui crée donc des coefficients complexes. On peut ce-
pendant exprimer la DCT en fonction de la DFT, qui est alors appliquée sur le signal symétrisé.
La variante la plus courante de la transformée en cosinus discret est la DCT type-II, souvent
simplement appelée la DCT . Son inverse, qui correspond au type-III est souvent simplement
appelée IDCT . Il existe quatre types de DCT , qui peuvent tous se mettre sous forme :
X
X[k] = x[n]Φkn (1)
n
où les fonctions de base Φkn sont définies à partir de fonctions cosinus. Dans le cadre de la
compression vidéo, on utilise la DCT de type II de la forme suivante :
1
  
r
2  k(n + )π
Φkn = ck cos 
 2   n, k = 0, 1, 2, ..., N − 1

(2)
N N
L’équation (1) définit une transformation matricielle Φ = [Φkn ], d’un vecteur temporel x[n]
en un vecteur de même longueur X[k]. Dans la suite du TP, on prendra N=8.
3.2 Propriétés de base de la DCT

1. Le code MATLAB pour implémenter la DCT sous la forme d’un produit matrice-vecteur :
function [X]= dct8(x)
N=length(x); % Dans notre cas N=8
phi=zeros(N,N);
X=zeros(N,1); % Initialisation de la matrice
A=sqrt(2/N); % Coefficient de la transformée
for i=0:N-1
if i==0
c=1/sqrt(2);
else
c=1;
end
for j=0:N-1
phi(i+1,j+1) = c*cos((i*pi)/N*(j+(1/2))); % calcul de noyau
end
end
X= A*phi*x; % Le résultat
end
2. Le code MATLAB de la DCT inverse (iDCT) :

function [x]= dct8inv(X)
N=length(X);
4
phi=zeros(N,N);
x=zeros(N,1);
A=sqrt(2/N);
for i=0:N-1
if i==0
c=1/sqrt(2);
else
c=1;
end
for j=0:N-1
phi(i+1,j+1)=c*cos((i*pi)/N*(j+(1/2)));
end
end
x= A*phi’*X;
end
3. Si on applique à un vecteur x quelconque la DCT et son inverse on trouve le vecteur x.
Exemple par MATLAB :
x =
1
5
6
>> X = dct(x)
X =
6.9282
-3.5355
-1.2247
>> idct(X)
ans =
1.0000
5.0000
6.0000
3.3 Calcul de la DCT via une FFT

Là il s’agit d’appliquer la fonction fft de Matlab sur 2N échantillons (échantillons (0 à N)
+ zéros (N+1 à 2N)), de multiplier les N premiers échantillons par exp(-i*2*pi*k/(4*N), puis
5
de prendre la partie réelle et la multiplier par Ck et racine(2/N).
Le code MATLAB :
function [X] = dctfft(x)
N=length(x);
X=zeros(N,1);
A=sqrt(2/N);
x=[x;zeros(N,1)];
W=zeros(N,1);
F=fft(x)
for n=1:N
W(n,1)=exp(-1i*(n-1)*pi/(2*N));
end
FF=F(1:N,1).*W
for i=1:N
if i==1
c=1/sqrt(2);
else
c=1;
end
X(i,1)=c*A*real(FF(i,1));
end
end
3.4 La DCT à deux dimensions

La DCT-II à deux dimensions est une extension modifiée de la transformation unidimen-
sionnelle :
N −1 N −1
2Ck Cl X X πk 1 πl 1
X(k, l) = x(n, m)cos (n + ) cos (m + )
N n=0 m=0 N 2 l 2
N −1 N −1
2 XX πk 1 πl 1
x(n, m) = Ck Cl X(k, l)cos (n + ) cos (m + )
N k=0 l=0 N 2 l 2
1
avec : 0 ≤ n, m, k, l ≤ N − 1 et Ck = √ si k = 0, 1 sinon
2
Comme plusieurs transformées 2D, la DCT-II est séparable, ce qui implique qu’on peut
l’implémenter à partir de la DCT à une dimension. Elle s’écrit alors sous la forme matricielle :
[X] = [Φ][x][Φ]t
1. La propriété utilisée dans la fonction dct2.m est que l’on applique deux DCT unidimen-
sionnelle, une suivant les lignes, puis suivant les colonnes.
6
2. Dans la fonction dct8.m, on retrouve le principe de calcul de la DCT unidimensionnel
cas impair. C’est à dire que si la fonction rem retourne 1 (cas impair,n/2 non entier), on
double le nombre d’échantillons pour avoir n pair. On a la matrice originale de 1 à N et
la matrice flippée (inversée) de N+1 à 2N.
3. La fonction dct ne fait le calcul que suivant les colonnes, il faut utiliser la fonction dct2.
4. Application de DCT sur le blc sampl1.mat, tracage de mesh 3D du bloc original, ainsi
que du signal transformée :
On remarque que l’image ne contient principalement que des basses fréquences.
3.5 Description du noyau de la transformée bidimensionnelle

On veut retrouver la matrice de transformation (ou noyau)Φ sans calcul, en utilisant la
fonction idct2 pour faire ressortir chaque vecteur en fonction de k, l . Pour trouver Φ(k, l), il
faut que X(0, 0) = 1 et le reste soit à 0, puis que X(1, 0) = 1 et le reste à 0, et ainsi de suite...
On rempli une matrice phi de 64 blocs de 8x8 pixels qui correspondent à chaque idct2(X(k, l)).
On obtient :
7
4 Traitement de l’image par bloc
L’image est découpées en blocs de tailles 8x8 pixels pour appliquer à chacun d’entre eux
une DCT. L’instruction blkproc permet de découper une images en plusieurs blocs de taille [M
N] et d’appliquer une fonction à chacun de ces blocs, ici on utilisera la fonction dct2.
>> load sampl1.mat

>> x = sampl1;
>> imshow(x,gray(256))
>> y = blkproc(sampl1,[8 8],’dct2’);
>> imshow(y,gray(256))
Le résultat :
L’image étant très uniforme dans les noirs, on observe des pics blancs pour les basses
fréquences de chaque bloc.
5 La quantification, clef de lma compression

La quantification est l’étape de l’algorithme de compression JPEG au cours de laquelle se
produit la majeure partie de la perte d’information (et donc de la qualité visuelle), mais c’est
aussi celle qui permet de gagner le plus de place (contrairement à la DCT, qui ne compresse
pas). La DCT a retourné, pour chaque bloc, une matrice de 8x8 nombres (dans l’hypothèse que
les blocs de l’image font 8x8 pixels). La quantification consiste à diviser cette matrice par une
autre, appelée matrice de quantification, et qui contient 8x8 coefficients spécifiquement choisis
par le codeur. Le but est ici d’atténuer les hautes fréquences, c’est-à-dire celles auxquelles l’œil
humain est très peu sensible. Ces fréquences ont des amplitudes faibles, et elles sont encore plus
atténuées par la quantification ; certains coefficients sont même souvent ramenés à 0.
5.1 Étude de la quantification

1. On charge la table de quantification matquant.mat
>> load matquant.mat
>> matquant
matquant =
16 11 10 16 24 40 51 61
12 12 14 19 26 58 60 55
14 13 16 24 40 57 69 56
8
14 17 22 29 51 87 80 62
18 22 37 56 68 109 103 77
24 35 55 64 81 104 113 92
49 64 78 87 103 121 120 101
72 92 95 98 112 100 103 99
Cette table atténue les hautes fréquences d’un rapport 7 par rapport aux basses fréquences.
L’oeil étant moins sensible aux hautes fréquences.
2. Il s’agit de charger une image(LENA.MAT), de lui appliquer toutes les étapes de la
compression (DCT, quantification directe, puis inverse, et DCT inverse. Les opérations
sont écrites dans le fichier codec.m qui fait appel aux fonctions dct2.m, quantifdirecte.m,
quantifinverse.m et idct2.m. On utilise la matrice de quantification matquant.mat. Cette
matrice peut être multipliée par un facteur c dans la ligne de commande pour visualiser
les pertes dûes aux arrondis entre quantification directe et quantification inverse.
Le programme dans le fichier codec.m :
load(’LENA.mat’);
I_dct = blkproc(LENA,[8 8],’dct2(x)’);
I_quant = blkproc(I_dct,[8 8],’round(x./P1)’,A);
I_q_inv = blkproc(I_quant,[8 8],’x.*P1’,A);
Ima = blkproc(I_q_inv,[8 8],’round(idct2(x))’);
d =LENA-Ima;
PSNR = 10* log10 ( 255^2/mse(d))
3. Le programme affiche l’image originale, l’image compressée/décompressée puis l’image

d’erreur qui est défini par la relation :
ε = 128 + 2(original − reconstruite)
On prend un facteur (8) multiplicateur de table de quantification très important pour

bien mettre en évidence le phénomène. On remarque sur l’image d’erreur que les erreurs
se trouvent surtout sur les contours, donc sur les petits transition, les détails, qui sont
faits de hautes fréquences. L’arrondi a plus d’influence sur les hautes fréquences d’autant
plus que les coefficients de la table sont réduits en hautes fréquences.
4. Le psnr est donné par la formule :
2
d
P SN R = 10 log10
EQM
9
Où
m−1 n−1
1 XX
EQM = kI0 (i, j) − Ir (i, j)k2
mn i=0 j=0
5. Lorsqu’on change le facteur de qualité on trouve les résultats suivants :
Facteur de qualité PSNR de LENA

0.5 13.35
1 11.15
2 9.52
4 7.07
Rmq : Un bon psnr en image est de 30 à 40 dB, on l’obtient pour un facteur
qualité de 0,01.
6. La courbe représentant l’evolution de P SN R en dB en fonction du facteur de qualité Q
pour les différentes images.
100
90
80
70
60
50
40
30
20
10
0
40 35 30 25 20 15
Le code MATLAB est le suivant :

load(’bateau.mat’);
load(’MATQUANT.mat’);
dct=blkproc(double(bateau2),[8 8],@dct2);
qjpeg=zeros(1,99);
alpha=zeros(1,99);
PSNR=zeros(1,99);
for i=1:99
qjpeg(i)=i;
if (1<=qjpeg(i)<=50)
alpha(i)=50/qjpeg(i);
else
10
alpha(i)=2-(2*qjpeg(i))/100;
end
quant=blkproc(dct,[8 8],’round(x./P1)’,alpha(i)*Q);
%à la réception
Iquant=blkproc(quant,[8 8],’round(x.*P1)’,alpha(i)*Q);
Idct=blkproc(Iquant,[8 8],@idct2);
%PSNR
PSNR(i)=10*log10((255^2)/mse(double(bateau2)-Idct));
end
plot(qjpeg,PSNR)
11
6 Conclusion
Le format JPEG, très couramment utilisé pour le codage des images bitmap et des pho-
tos, est un format de compression très efficace. La perte de qualité d’image occasionnée par
l’algorithme de compression peut être maı̂trisée car le taux de compression des fichiers .jpeg
est réglable. Le format JFIF, plus connu sous le nom de format JPEG, est complémentaire des
formats GIF et PNG pour la publication d’images sur le Web : il sauvegarde plus d’informations
couleur que le format GIF et permet de comprimer des photographies ou des images lourdes.
L’algorithme de compression provoque une perte d’information et peut donc entraı̂ner une
perte de qualité visible quand on utilise un taux de compression élevé ou sur certains types
d’images. Ainsi, le format .jpeg convient bien aux photos mais pas aux images comportant peu
de couleurs ou aux figures géométriques (pour lesquelles le format GIF est plus adapté).
Le principal avantage de ce format est le taux de compression réglable qui permet à l’utili-
sateur de trouver un compromis entre le taux de compression et la qualité de l’image.
12

TP Traitement Image PDF

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

TP Traitement Image PDF

Hochgeladen von

Copyright:

Verfügbare Formate

UNI

La norme JPEG de compression des

3 La transformée en cosinus Discrète 3

4 Traitement de l’image par bloc 8

5 La quantification, clef de lma compression 8

1.2 La norme JPEG

– 8x8 : Découpage de l’image original sous forme numérique ;

3 La transformée en cosinus Discrète

3.2 Propriétés de base de la DCT

2. Le code MATLAB de la DCT inverse (iDCT) :

3.3 Calcul de la DCT via une FFT

function [X] = dctfft(x)

3.4 La DCT à deux dimensions

On remarque que l’image ne contient principalement que des basses fréquences.

3.5 Description du noyau de la transformée bidimensionnelle

>> load sampl1.mat

5 La quantification, clef de lma compression

5.1 Étude de la quantification

I_quant = blkproc(I_dct,[8 8],’round(x./P1)’,A);

I_q_inv = blkproc(I_quant,[8 8],’x.*P1’,A);

Ima = blkproc(I_q_inv,[8 8],’round(idct2(x))’);

PSNR = 10* log10 ( 255^2/mse(d))

3. Le programme affiche l’image originale, l’image compressée/décompressée puis l’image

On prend un facteur (8) multiplicateur de table de quantification très important pour

5. Lorsqu’on change le facteur de qualité on trouve les résultats suivants :

Facteur de qualité PSNR de LENA

Le code MATLAB est le suivant :

Das könnte Ihnen auch gefallen