Sie sind auf Seite 1von 14

Computer & Mobile Vision

Ralis par: Fares Ben Hamouda & Jawher Jouini

Plan de la prsentation

Introduction la vision par ordinateur

Problmatique et Description de lide du projet

Etat de lart

Etude et critique de lexistant

Ralisation et Description Technique

Conclusion & perspectives

5SIM1 - 2015/2016

Introduction la vision par ordinateur


La vision humaine permet de:
Comprendre la composition dune
scne en terme des objets qui la
composent
La vision
ordinateur:
Dtecter
despar
objets
mobiles

Ne cherche
reproduire
Comprendre
et pas
interprter
lesla vision humaine (bien trop complexe->
neurosciences)
concavits
dun objet partir

Cherche
rsoudre certaines tches (rduites) que peut effectuer la vision
dune seule image
humaine
est de
toujours
enforme
qute dun
Et ce, On
partir
limage
sur systme dinterprtation partir dimages
la rtine mais aussi dun processus
dinterprtation visuel complexe
incorporant des connaissances a
priori

5SIM1 - 2015/2016

Problmatique

5SIM1 - 2015/2016

Description de lide du projet

Ce projet utilise de la reconnaissance optique des caractres OCR

Permet lutilisateur de chercher un mot ou une chaine alphanumrique dans


nimporte quel texte (plusieurs langages sont supports) et laide de la
camra de son priphrique

Il na qu entrer la chaine au clavier ou au micro (Reconnaissance vocale)

Il oriente la camra vers le texte et le prend en photo, si le mot est trouv il


sera colori.

Lutilisateur peut aussi configurer lapplication en mode scan continu, ainsi le


mot sera colori au fur et mesure de la visualisation camra

Le texte reconnu et extrait est aussi stock localement et peut tre diffus,
gnr comme PDF

5SIM1 - 2015/2016

Description de lide: points forts

Utile dans les milieux administratifs et institutionnels

Ncessite juste un smartphone Android

5SIM1 - 2015/2016

Etat de lart: Comment fonctionne un OCR?


Au
cours
de ce processus,
utilise:
1.
Les contours
de limage Tesseract
sont analyss
et stocks

2. Les contours sont rassembls sous forme de Binary Large OBject

8. Les espaces superflus sont limins et le texte vrifi pour les petites capitalisations

9. Sortie du texte numris

Des algorithmes de dtection de lignes de texte


3. Les
Blobs sont organises
en lignes
de texte
Des
algorithmes
de dtection
de mots
proportionnelles et non proportionnelles
(un
motlignes
proportionnel
est
un mot
toutes les lettres sont de la mme largeur)
4. Les
de texte sont
divises
en o
mots
Des
algorithmes
pour
lesdecaractres
lis tente
et pour
associer des
caractres
5. La
Premire passe
duhacher
processus
reconnaissance
de reconnatre
chaque
mot
casss
son tour
Lanalyse linguistique pour identifier le mot le plus probable form par un
6. Les mots accepts sont passs un adaptative trainer
groupe de personnages eux classificateurs de caractres: un classificateur
7. Les rgles apprises par le trainer seront employs dans un second passage, puisquil
statique, et un classificateur adaptatif qui emploie des donnes de formation,
tentera de reconnatre les mots qui nont pas t reconnus de manire satisfaisante lors
qui
sert mieux distinguer entre les majuscules et minuscules
du premier passage

5SIM1 - 2015/2016

Etat de lart: prtraitement

Images captures en niveau de gris

Application au choix dun seuillage par 3 mthodes (Mthode de Fisher, dOtsu ou la mthode de
Seuillage avec le filtre de Sobel)

Le seuillage a pour objectif de segmenter une image en plusieurs classes en n'utilisant que
l'histogramme. On suppose donc que l'information associe l'image permet elle seule la
segmentation et qu'une classe est caractrise par sa distribution de niveaux de gris. A chaque pic
de l'histogramme est associe une classe (un segment).

Le seuillage minimisation de la variance intraclasse (mthode de Fisher) est difficilement


applicable lorsque le nombre de segments est lev. En effet, il faut tester exhaustivement tous
les (N-1)-uples (s1,...,sN-1 ) possibles. De plus, il faut que chaque classe ait une taille significative
en nombre de niveaux de gris pour que les indicateurs statistiques aient un sens. Dans le cas de la
binarisation (N=2), cette mthode est performante.

Otsu a propos de raliser plutt une maximisation de la variance inter-classe.

La mthode dOtsu est plus intressante d'un point de vue calculatoire car elle ne ncessite pas de
calcul de variances.

5SIM1 - 2015/2016

Etude et critique de lexistant

Plusieurs solutions mobiles utilisent ou implmentent des OCR afin dassurer


des oprations de numrisation simples et habituelles (conversion dun texte
du support papier en texte numris)

Les concurrents ayants le plus de notorit:

Google Goggles (une numrisation assez fiable et avance qui se base sur un
algorithme avanc et de lintelligence artificielle

Google Translate pour Android, traduction en temps rel et laide de la


ralit augmente, dun texte pris par la camra du terminal mobile

5SIM1 - 2015/2016

Ralisation

5SIM1 - 2015/2016

10

Description technique

Lapplication a t dveloppe en utilisant Eclipse, Android SDK et NDK

Lapplication supporte la version 14 de lAPI au minimum (version 4.0)

Lapplication est disponible en 3 langues: Anglais, Franais et Arabe

Lapplication utilise le moteur OCR Tesseract qui supporte plusieurs langages

5SIM1 - 2015/2016

11

Description technique: Limites

Tesseract OCR est performant mais prsente quelques limites:

Contrairement dautres OCR, Tesseract ne reconnait pas lcriture


manuscrite et est limit environ 64 polices

Sans le prtraitement quon a effectu (entre autres le recours au seuillage),


la fiabilit de la conversion est loin detre garantie

5SIM1 - 2015/2016

12

Conclusion & perspectives

Cette application est forte de ses fonctionnalits et de son design attirant

Elle est destine tous ceux qui utilisent quotidiennement une grande
quantit de documents en papier et qui nont besoin que de certains points
qui ne ncessitent pas une lecture complte

Elle reste sujette des volutions et des mises jours qui peuvent amliorer
certaines fonctionnalits afin de les optimiser. Par exemple, lors du
prtraitement, agir sur les images captures pour avoir une meilleure nettet

5SIM1 - 2015/2016

13

5SIM1 - 2015/2016

14

Das könnte Ihnen auch gefallen