Sie sind auf Seite 1von 52

VIELLE TECHNOLOGIQUE SUR INTERNET

Mr Mounir GRARI

2007/2008

Plan
2

Enjeux j de la veille Spcificits des moteurs de recherche Les agents intelligents Elaborer une stratgie de recherche Extraire linformation Types de recherche Savoir exploiter le Web invisible et les zones spcifiques Constituer une banque doutils Rdiger et consigner les rsultats de la recherche

Introduction
3

La veille technologique est une activit qui met en uvre des techniques d'acquisition, de stockage et d'analyse d'informations La veille technologique peut s'alimenter de donnes provenant de tous types de sources :

Internet :
Moteur de recherche : Google , Yahoo, Site Si web b Forum

Introduction ( (Moteur de recherche) )


4

Google g ( (environ 60% des 61 milliards de recherches sur internet) Yahoo (8,5 milliards de recherches, soit 14% du total) Baidu le Google chinois" " qui monte en puissance (3,3 milliards de requtes, soit 5,4% du total) Live Search moteur de recherche de Microsoft (2,1 (2 1 milliards de recherches, 3,4%) Naver moteur de recherche coren du groupe NHN (2 milliards de recherches). Le site de commerce eBay (1,3 milliards de recherches).

Enjeux j de la veille ((Quelques q dfinitions)


5

Une organisation est :


Un ensemble d'individus, regroups au sein d d'une une structure rgule, dans le but de rpondre des besoins et d'atteindre des objectifs dtermins. le moyen pour environnement. un individu de connatre son

L'information est :

Enjeux j de la veille ((Quelques q dfinitions)


6

LInformation technique : L

Il s'agit donc d'une information gnralement fiable et une donne pertinente. Ces informations sont diffuses par diffrentes sources.

Internet : annuaires, moteurs de recherche, mta moteurs et agents intelligents .

Enjeux j de la veille ((Quelques q dfinitions)


7

La Veille :

se dfinit comme une activit continue et en grande partie itrative visant une surveillance active de lenvironnement technologique, commercial pour en anticiper les volutions. Il sagit donc dun outil de recherche et de dveloppement.

Enjeux j de la veille ( (Objectifs) j )


8

La veille permet :

d'viter les erreurs de dcision, de dtecter les opportunits et les menaces, de faciliter le processus de dcision, De voir ce q qui s'est dj j fait Mieux cibler et bien choisir des projets innovants Comparer p son savoir et le dvelopper pp Anticiper lvolution de lenvironnement Dvelopper louverture de lorganisation sur son environnement.

Enjeux j de la veille
9

Les diffrents types de veille :


conomique Commerciale Marketing Socitale Technologique Concurrentielle

La veille est un processus qui permet de collecter, danalyser et de diffuser des informations juges utiles.

Enjeux de la veille : Intgrer la veille dans les processus de l l'entreprise entreprise


10

Le processus de la veille comporte plusieurs tapes cycliques . Il se dcompose p en deux p parties savoir : La surveillance de lenvironnement L Lexploitation exploitation de l lenvironnement environnement

Enjeux de la veille : Intgrer la veille dans les processus de l l'entreprise entreprise


11

La surveillance de l lenvironnement environnement : Cette phase ncessite en premier lieu la recherche et la collecte de linformation. Il faut donc cibler le sujet j et ses enjeux et mettre en place une stratgie de recherche efficace de linformation utile. En deuxime lieu, il est ncessaire de passer ltape de lanalyser et de la validation des informations, en respectant les critres de validation : pertinence , exhaustivit, fiabilit des donnes.

Enjeux de la veille : Intgrer la veille dans les processus de l l'entreprise entreprise


12

L exploitation de l Lexploitation lenvironnement environnement : Il sagit du traitement, de la diffusion et de lutilisation des informations p pour la p prise de dcision.
Le traitement des informations permet de retrouver linformation pertinente do la ncessit de mettre en place un dispositif de stockage et darchivage de donnes. donnes La diffusion des informations traites permet leur utilisation pour une prise de dcision dans lenvironnement socio-conomique de lorganisation.

Veille et la recherche sur internet


13

Face l lnormit normit exponentielle du web devenu la premire source dinformation mondiale, linternaute qui dsire obtenir la rponse une question peut recourir diffrents outils ; on distingue entre annuaires, moteurs de recherche, mtamoteurs et agents t intelligents i t lli t

Spcificits p des moteurs de recherche


14

Dfinition des outils de recherche utiliser : Les annuaires :


recensent selon une arborescence souvent complexe de catgories et de sous-catgories les sites Internet qui leur sont soumis (par leur auteur ou leur propritaire, le plus souvent) t) ; leur l f ti fonctionnement t repose sur une dclaration d l ti pralable, associe le plus souvent une validation qui peut faire intervenir de faon alatoire ou systmatique un agent humain. On peut citer Yahoo!, Voila, Nomade ou encore Lycos.

Spcificits p des moteurs de recherche


15

Dfinition des outils de recherche utiliser : Les annuaires :


Le nombre de sites rfrencs est infrieur ce que proposent en gnral les moteurs de recherche, et la pertinence relle des sites rfrencs est difficile valuer. Ces annuaires, dabord ports par leur inscription dans un portail offrant dautres services (voir Yahoo!), sont de moins en moins utiliss

Spcificits p des moteurs de recherche


16

Dfinition des outils de recherche utiliser : Les moteurs de recherche :


fonctionnent diffremment : ils commencent par constituer un index de pages Internet (et non de sites) ; les auteurs peuvent soumettre leurs pages pour inscription dans cet i d index, mais i la l grande d masse en est rcupre de d faon f automatique, laide dun robot (un logiciel) qui suit et analyse y les liens rencontrs dans les p pages g et navigue g ainsi de lune lautre.

Spcificits p des moteurs de recherche


17

Dfinition des outils de recherche utiliser : Les moteurs de recherche :


Une copie de ces pages est stocke sur des serveurs ddis (le chiffre exact est tenu secret, mais on estime dans le cas de Google plus de 15 000 le nombre de PC permettant d faire de f i tourner t ce cache h ). ) Lorsque L li t linternaute t tape t ensuite un mot dans la zone de saisie, un programme lanalyse sommairement (reconnaissance de la langue dorigine, filtre orthographique), puis parcourt les pages ainsi stockes sa recherche.

Spcificits p des moteurs de recherche


18

Dfinition des outils de recherche utiliser : Les moteurs de recherche :


Ce sont les rsultats de cette recherche, classs selon une mthode que nous verrons plus loin, qui sont prsents linternaute, avec ladresse de la page correspondante ainsi quun extrait t it du d contexte t t dans d l lequel l le l mot t apparat t au sein de la page. La quantit de pages examines est beaucoup plus importante que dans le cas des annuaires la recherche se fonde pour lessentiel sur le contenu des pages, et non sur le rsum dun site fourni par son auteur.

Spcificits p des moteurs de recherche


19

Dfinition des outils de recherche utiliser : Trier les rsultats :


Chaque requte via un moteur de recherche pouvant produire une quantit norme de rsultats, il est bien entendu ncessaire de les trier avant de les prsenter li linternaute. C prcisment Cest i sur la l pertinence i d ce tri de i que Google a assur son succs rapide au dbut des annes 2000.

Spcificits p des moteurs de recherche


20

Dfinition des outils de recherche utiliser : Trier les rsultats :


Pour tudier la pertinence dune page rapporte au mot-cl recherch, ec e c , les es moteurs o eu s se fondent o de d dabord abo d su sur le e co contenu e u de la a page et sa structure :

le mot est-il prsent dans le titre de la page ? Dans la page elle-mme ? quelle frquence ? Apparat-il rapidement ou plus loin au sein du document ? Apparat-il dans les balises (ces zones dont le contenu nest pas affich lors de la consultation par linternaute mais qui permettent de renseigner les moteurs : description de la page, page mots-cls de la page, page etc.) ? Apparat-il dans ladresse da la page ? Dans les liens conduisant vers cette page ?

Spcificits p des moteurs de recherche


21

Dfinition des outils de recherche utiliser : Les mtamoteurs:


quant eux, sont des outils logiciels qui interrogent en simultan i lt plusieurs l i moteurs t d recherche de h h ; principal i i l dfaut df t de d la plupart dentre eux : Google, acteur technologique incontournable, interdit laccs son moteur ce type doutils. il s sagit agit d doutils outils paramtrables destins effectuer de faon semi-autonome des missions de recherche dinformation et surtout de veille (observation des changements) sur diffrentes sources choisies.

Quant aux agents intelligents ,


Agents g intelligents g
22

Exemples d d'agents agents intelligents


Agents

de recherche Agents de veille Agent de navigation

Agents intelligents
A t d Agents de recherche h h d'informations d'i f ti
23

Par le terme d d'agents agents de recherche d d'informations, informations, nous qualifierons toute la gamme de logiciels intermdiaires entre les moteurs de recherche et les "agents intelligents", consacrs la recherche d'informations. Leur intrt rside dans leur capacit remplir li et automatiser i d tches des h la l place l d de l'utilisateur. Ils suivent la lettre la dfinition du terme agent : "entit entit agissant pour le compte de quelqu quelqu'un" un . On distinguera quatre fonctions principales :

Agents intelligents
A t d Agents de recherche h h d'informations d'i f ti
24

Recherche d d'informations informations : celle celle-ci ci peut se faire de manire "intelligente" par l'utilisation de mtamoteurs perfectionns (WebSeeker, Copernic Pro), d'outils d'analyse linguistique des requtes (Autonomy, DigOut4U) ou par exploration de liens hypertextes partir i d'une d' URL (adresse ( d d' d'une page web) b) donne, d sans utilisation d'un moteur de recherche (DigOut4U)

Agents intelligents
A t d Agents de recherche h h d'informations d'i f ti
25

Analyse des informations rcupres : indexation smantique des rsultats (EchoSearch, WebCompass), rsum automatique (EchoSearch, WebCompass, DigOut4U) Filtrage, dition, archivage, mise jour de rsultats (WebSeeker, BullsEye) Navigation off-line parmi des pages ou des sites web tlchargs (WebWhacker, Teleport Pro)

Agents intelligents
C Caractristiques t i ti des d agents t intelligents i t lli t
26

Les chercheurs en intelligence artificielle s s'accordent accordent sur la ncessit de l'existence de quelques caractristiques pour qu'on puisse parler d'agents intelligents. A l'heure actuelle, aucun produit ne rassemble toutes ces caractristiques. L'autonomie Capacit communiquer et cooprer Capacit raisonner, ragir leur environnement La mobilit

Agents intelligents
C Caractristiques t i ti des d agents t intelligents i t lli t
27

L'autonomie L autonomie

L'agent doit pouvoir prendre des initiatives et agir sans intervention de l'utilisateur final. Dans le contexte du web il doit pouvoir agir alors que l'utilisateur est dconnect.

d'Autonomy de la socit Agentware. Les agents de General Magic devraient aussi en tre capable. capable

La mobilit

Les agents doivent pouvoir tre multi-plate-forme et multiarchitecture. Ils doivent pouvoir se dplacer sur le rseau o ils accomplissent des tches sans que l'utilisateur ait le moindre d contrle l sur celles-ci. ll

Agents intelligents
C Caractristiques t i ti des d agents t intelligents i t lli t
28

Capacit communiquer et cooprer L'agent doit pouvoir changer des informations plus ou moins complexes p avec d'autres agents, g , avec des serveurs ou avec des humains.

Service Firefly : Indiquez cet agent vos gots musicaux et cinmatographiques et il vous fera lui aussi des recommandations assez pertinentes.

Agents intelligents
C Caractristiques t i ti des d agents t intelligents i t lli t
29

Capacit raisonner, ragir leur environnement


Capable de s'adapter son environnement et aux volutions de celui-ci. Cette adaptation doit s'appuyer sur l'analyse de l'environnement extrieur des agents. Firefly : les connaissances d'un agent sont en partie fonction des connaissances des autres agents Firefly. A mesure que leurs connaissances s s'enrichissent enrichissent, les connaissances d'un agent particulier s'enrichissent aussi grce aux changes entre agents

Elaborer une stratgie g de recherche


30

Formuler sa requte, stratgie de recherche Exemple :


Sujet:

Lpuisement professionnel et la satisfaction au travail chez les informaticiens

Elaborer une stratgie g de recherche


1 1. Identifier les principaux concepts
(Plus il y a de concepts, plus la recherche est prcise) Exemple E l : L Lpuisement i t professionnel f i l et tl la satisfaction ti f ti au t travail il chez les informaticiens

Concept A

Concept B

Concept C

puisement professionnel

Satisfaction au travail

informaticiens

Elaborer une stratgie de recherche


2 Choisir, 2. Choisir traduire et enrichir son vocabulaire

Identifier les synonymes ou termes quivalents en franais. Si ncessaire, utiliser un thsaurus, un dictionnaire, liste de mots cls, etc. Ainsi que la troncature (*) * sert de troncature dans plusieurs Bases de donnes. On peut utiliser la troncature pour viter d avoir rcrire des termes ayant la mme racine: Ex.: la racine Informaticien* permet de reprer les termes Informaticien, Informaticiens, Informaticienes, ETC,
Concept 1 Concept 2 Satisfaction au travail Concept 3

puisement professionnel Burnout


(Burn out, Burn-out)

Informaticien* Personnel informatique OU ET

Satisfaction professionnelle Motivation

Stress

Elaborer une stratgie g de recherche


(Traduire les termes en anglais pour faire une recherche dans des Bases de donnes anglophones)
Concept 1 Burnout
(Burn out, burn-out)

Concept 2 Job satisfaction Motivation

Concept 3 Nurs*
(Nurrse, Nurses, Nursing)

Stress

Computer science personnel OU ET

3. Lier les concepts avec des oprateurs logiques (oprateurs boolens --> ET, OU, SAUF (AND, OR, NOT))

Elaborer une stratgie g de recherche


(Formuler des quations de recherche en liant les concepts avec les oprateurs logiques appropris (ET, OU, SAUF)(AND, OR, NOT). On peut formuler plusieurs quations simples de recherche)
Concept 1 puisement p professionnel Burnout
(Burn out, burn-out)

Concept 2 Satisfaction au travail

Concept 3 Informaticien*

Satisfaction professionnelle Motivation ET

Personnel informatique OU

Stress

Exemples dquations d recherche de h h

Concept 1 puisement professionnel B Burnout


(Burn out, burn-out)

Concept 2 Satisfaction au travail

Concept 3 Informaticien*

Satisfaction S if i professionnelle Motivation ET

Personnel P l informatique OU

Stress

Exemples pour chercher dans des bases francophones puisement professionnel* ET satisfaction au travail ET informaticien* puisement professionnel ET satisfaction au travail ET personnel informatique puisement professionnel ET satisfaction professionnelle ET informaticien* puisement professionnel ET satisfaction professionnelle ET personnel computer science Burnout ET satisfaction au travail ET informaticien informaticien* Burnout ET satisfaction au travail ET personnel computer science etc

Exemples pour chercher dans des Banques g p anglophones


Concept 1 Burnout
(Burn out, burn-oput)

Concept 2 Job satisfaction Motivation

Concept 3 Nurs* Medical Personnel OU (OR) ET (AND)

Stress

Burnout AND Job satisfaction AND Nurs* Burnout AND Job satisfaction AND computer science personnel Burnout AND Motivation AND Nurs Nurs* Burnout* AND Motivation AND computer science personnel Stress AND Job satisfaction AND Nurs* Stress AND Job satisfaction AND computer science personnel Stress AND Motivation AND Nurs* Stress AND Motivation AND computer science Personnel

Elaborer une stratgie g de recherche


Formulation plus globale de la requte : un exemple
Burnout ET satisfaction professionnelle ET informaticien* Burnout ET satisfaction au travail ET informaticien* Burnout ET satisfaction p professionnelle ET personnel p informatique q puisement professionnel ET satisfaction professionnelle ET informaticien* puisement professionnel ET satisfaction au travail ET informaticien* puisement professionnel ET satisfaction au travail ET personnel informatique*

Elaborer une stratgie g de recherche


O peut On p aussi formuler sa recherche de faon plus p complexe en faisant des ensembles (i.e. placer les concepts entre parenthses):
(Burnout OU puisement professionnel) ET (satisfaction au travail il OU satisfaction i f i professionnelle) f i ll ) ET (informaticien* (i f i i * OU personnel informatique) (Burnout OR stress) AND (job satisfaction OR motivation) AND (nurs* OR computer science personnal)

Elaborer une stratgie de recherche


R h h une expression Rechercher i
Par exemple, p , on peut p essayer y de trouver des informations sur les chles de cachemire, l'exclusion des collections. La recherche sera transcrite ainsi : +chle hl +cachemire h i -collection ll i En fait, de plus en plus, les moteurs de recherche proposent des menus droulants qui crivent les oprateurs votre place. Pour y accder, cherchez les boutons du genre plus d'options , recherche avance .

Elaborer une stratgie de recherche


L oprateurs Les t boolens b l

Sont :
ET, en anglais AND. OU, en anglais OR, noter : de plus en plus d'outils de recherche considrent que le ET est implicite... mais pas tous, vous le saurez en allant chercher dans les options de recherche avance. SAUF, SAUF en anglais AND NOT ou NOT NOT.

Ces oprateurs peuvent tre remplacs par les signes :


+ coll devant le terme de la recherche et qui est l l'quivalant quivalant de ET. - coll devant le terme de la recherche et qui est l'quivalent de SAUF.

Elaborer une stratgie de recherche


i une recherche crire h h complexe l

Par exemple, p , on p peut essayer y de trouver v des informations sur les chles de cachemire, l'exclusion des collections. La recherche sera transcrite ainsi :

+chle +cachemire -collection

En fait, de plus en plus, les moteurs de recherche proposent des menus droulants qui crivent les oprateurs votre place. Pour y accder, cherchez les b t boutons du d genre plus l d' d options ti recherche , h h avance .

Elaborer une stratgie de recherche


M j Majuscules l ou minuscules i l ( (une hi histoire t i d de casse) )

Les avis v sont partags. p g Il faut savoir v que, q , si de plus p en plus d'outils de recherche ne sont pas sensibles la casse, certains gardent la diffrence. Si vous tapez tout en minuscules ils chercheront toutes les occurrences, quelle que soit leur graphie. Si vous utilisez des majuscules, ils ne chercheront que celles strictement crites comme vous l'avez tap. Les rsultats peuvent tre totalement diffrents. diffrents Par contre, Google s'en fiche compltement, il en va de mme pour les accents d d'ailleurs ailleurs, pas sre que a soit vraiment un progrs...

Extraire linformation
E l Evaluer la l pertinence ti d de l'i l'information f ti
44

Premire

rgle, vidente et pourtant, ne pas se limiter une seule source d'information. Bref agir comme on le fait lorsque l'on utilise des supports papier et, bien videmment croiser les informations. Certes, il peut arriver qu'une seule personne ait i raison i contre tous, et il y a effectivement des exemples historiques. Mais le cas inverse se justifie le plus souvent. souvent

Extraire linformation
E l Evaluer la l pertinence ti d de l'i l'information f ti
45

Deuxime

rgle, vrifier les sources des avis convergents. S'ils ont tous t pills au mme endroit, ils n'ont pas de valeur renforante. C'est en fait le gros problme d'internet o il est si facile de recourir au copier-coller pour ajouter du contenu sur un site i alors l qu'on ' ne sait i pas trop quoi i di dire.

Extraire linformation
E l Evaluer la l pertinence ti d de l'i l'information f ti
46

Troisime

point : une information srieuse est une information qui raconte son histoire. On peut donc savoir d'o elle provient, par qui elle a t mise et de quand elle date. S'il n'est pas possible de trouver ces lments, mfiance Et si l'on sait d'o elle provient mais que la source est une entreprise dont l'objectif est de commercialiser i li un produit d it en rapport t avec l'information, mfiance aussi car on peut douter de son objectivit et de sa neutralit.

Extraire linformation
E l Evaluer la l pertinence ti d de l'i l'information f ti
47

Quatrime

point : son origine. Il est vident que, par exemple, en astronomie, une information dlivre ou en provenance d'un observatoire sera beaucoup plus fiable qu'une information mise par un amateur, moins quip et souvent moins savant .

Extraire linformation
E l Evaluer la l pertinence ti d de l'i l'information f ti
48

Cinquime

point : les liens. Gnralement un site soigneusement fait prte attention ses liens. En outre certains types de liens peuvent donner l'orientation gnrale. Exemple en mdecine : une information mdicale est susceptible d'avoir plus de valeur lorsque le site lie vers des pages d'information mdicale srieuse que vers des d pages de d diverses di pratiques ti mdicales dites douces ou alternatives.

Extraire linformation
E l Evaluer la l pertinence ti d de l'i l'information f ti
49

Sixime

point : ne pas hsiter douter si l'information vous semble bizarre, mme si elle est dlivre par un organisme envers lequel vous avez toute confiance. Septime point : la charte graphique du site n'a strictement aucune incidence sur la qualit de son contenu. Il convient donc de ne pas se laisser prendre d son esthtique, thti ni i d' d ailleurs ill d de rejeter j t a priori le contenu sous prtexte que le contenant ne plat pas.

Types yp de recherche
50

- Recherche globale. - Recherche d'une image, d'un son, d'une vido. - Recherche d'une d une personne personne. - Recherche d'information sur une socit. - Recherche de donnes conomiques conomiques, scientifiques scientifiques.

Constituer une banque q doutils


51

Mthode incrmentale d d'approche approche

52

Rdiger et consigner les rsultats de l recherche la h h