Beruflich Dokumente
Kultur Dokumente
Von Neumann
Domaines dexploitation
PC actuels
Harvard
-contrleur : circuit =1 -CPU + RAM + PROM + PIA + Timer
-PIA = Peripheral Interface Adapter : circuit interfaage E/S en //
-Digital Signal Processor (DSP) :
-CPU spcialis en traitement numrique du signal
-Peripheral Interface Controller (PIC) : contrleur de priphrique
Schma
RAM (Volatile)
Mmoires
ROM
(Rmanente)
Non programmable
Programmable : PROM
o FPROM (Fuse PROM) : PROM non modifiable aprs programmation
o OTP (One Time PROM) : Programmable une fois
o EPROM : PROM programmable et effaable
EEPROM : EPROM effaable lectriquement
UV-PROM : EPROM effaable par exposition aux UV
EPROM flash : rapide, effaable lectriquement et totalement par blocs
TYPES
Statique : SRAM
o Synchrone : SSRAM
Dynamique : DRAM
o Asynchrone : intervalle temporel entre 2 accs conscutifs la mmoire irrgulier
FPM (Fast Page Mode)
EDO (Extended Data Out) : amlioration de la FPM
o Synchrone (SDRAM) : intervalle temporel entre 2 accs conscutifs la mmoire
rgulier
DR-SDRAM (Direct Rambus SDRAM) :
transfert des donnes sur un bus de 16 bits une cadence de 800Mhz
bande passante : 1,6 Go/s
SDR-SDRAM (Single Data Rate SDRAM) : transfert de donnes chaque front
MONTANT dhorloge
DDR-SDRAM (Double Date Rate SDRAM) : transfert de donnes chaque front
dhorloge
DDR2-SDRAM : amlioration de la DDR-SDRAM
Sparation physique du canal de lecture et celui dcriture
2 fois plus rapide que la DDR-SDRAM
DDR3-SDRAM : DDR2-SDRAM moins nergivore
Graphique : utilise sur les GPU
o 2 canaux de transfert permettant la lecture et l'criture des donnes en un seul CPI.
o Informations stocker reus partir du GPU
o VRAM (Video RAM) :
Plus rapide que la DRAM
Utilise sur les GPU
o WRAM (Window DRAM) : VRAM 25% plus rapide
o SGRAM (Synchronous Graphic RAM) :
SDRAM usage graphique
Pas de lecture/criture en simultan
Modification des donnes par blocs (mode rafales)
COMPLEMENTS
Barrette de mmoire correction derreurs :
o 1 Bit de parit : dans N bits de mmoire, (N-1)
bits sont utilises pour les donnes et 1 bit
pour stocker la somme des (N-1) bits
o Bits de contrle :
mmoire ECC (Error Coding Correction)
o Tampon : registre entre la DRAM et le
contrleur mmoire
Le registre retient les donnes avant leur
envoi au contrleur de mmoire
RAM rmanente :
o Utilisation dun circuit de contrle intelligent
pour se connecter aux batteries internes en
lithium en cas de coupure dalimentation
externe
-CPU
Circuit intgr complexe Capable d'effectuer squentiellement et automatiquement des suites d'oprations lmentaires
o Unit de commandes : lire, dcoder et envoyer les instructions lunit dexcution
Horloge
Squenceur : excution squentielle des instructions
Registre dinstruction (RI = iR = instruction Register) : registre contenant linstruction
en cours dexcution
Compteur Ordinal (CO = PC = Program Counter) : registre pointant sur la prochaine
instruction excuter
Mmoire
Registre dadresse (RA = AR = Adress Register) : registre contenant l'adresse de la case
mmoire lue ou crite lors d'un accs la mmoire
Registre tempon
o Unit dexcution : effectuer les tches provenant de lunit de commande
Unit arithmtique et logique (UAL) : calcul binaire et logique
Accumulateur : registre mmoire de lUAL
o Unit de gestion dE/S : gestion des flux de donnes changes entre les E/S et la RAM
BD = Bus Driver
R0 = Registre dentre de lUAL
R1 = Accumulateur
micro-Mem= micro-mmoire (stockage des micro-instructions)
- 6 : entre BRA
- 16 : entre du bit N Z V C
- 17 : jump if negative
- 18 : jump if zero
- 19 : jump if carry
- 20 : jump if overflow
ACC
C1
Squenceur
UAL
B1
C1
C1
Code
A4
RM
B2
UC
A1
Oprande
Instruction
O
U
C1
CO
B3
A3
RI
Adresse
A2
+1
RA
Mmoire centrale
Causes :
-lhorloge en cdant
la main lOS,
loverflow
-accs une zone
mmoire
protge/inexistante
-excution dune
instruction inconnue
ou (privilgi en
mode slave)
EXEMPLES DE PIPELINE
Alternatives au pipeline :
Architecture VLIW vs Architecture Superscalaire
Architecture
Principe
Contrle des
dpendances
de donnes et
des instructions
Mthode
Avantages
Schma
Superscalaire
VLIW
Dcider des instructions excuter en parallle
Lors de la compilation
Par matriel
Bus dextension :
ISA (Industry Standard Architecture) : bus traitant les informations indpendamment des performances du CPU
MCA (Micro Channel Architecture) : bus plus performant que lISA
EISA (Extended ISA) : bus plus performant que lISA, concurrenant le MCA
Bus locaux :
PCI(-X) ( (eXtended) Peripheral Component Interconnect) : bus synchrone permettant une architecture Plug & Play
AGP (Accelerated Graphical Port) : bus permettant linsertion dune carte graphique dans la carte mre
VLB (Video Electronics Standards Association Local Bus): bus de connexion de cartes dextension avec des performances meilleurs que chez lISA
Mmoires Caches
Mmoires statiques, rapides et trs chres, acclrant les changes entre la RAM et le CPU.
Principe de fonctionnement: coopration avec la RAM
o Les mots de mmoire centrale les plus frquemment utiliss sont placs dans le cache.
o Le processeur cherche dabord le mot dans le cache () :
Si le mot est prsent (succs = cache hit) il lobtient rapidement ().
Si le mot nest pas prsent (chec = cache miss), le processeur fait un accs la mmoire centrale (, plus lent) et place ce mot dans le cache ().
HIT
MISS
Ecriture
Principe de lecture
Algorithme
Commentaire
Le processeur cherche dabord si le mot mmoire
adress est dans le cache (mot prsent).
Si linformation est prsente on parle de succs
(cache hit).
Sinon linformation nest pas dans le cache, on
parle alors dchec (cache miss).
Dans ce cas, il faut aller chercher linformation
dans la mmoire centrale et placer celle-ci dans
le cache (charger cache) avec ventuellement un
remplacement dinformations actuellement
prsentes dans le cache puisque sa taille est finie
( charger cache (remplacer) ).
Enfin, le processeur est charg avec linformation
maintenant disponible dans le cache.
Principe dcriture
Algorithme
Commentaire
Le processeur doit accder la mmoire cache
pour vrifier si linformation est prsente dans le
cache (mot prsent) et ventuellement la
modifier (modifier cache).
Si toutes les informations sont dans la RAM, alors
il faut maintenir la cohrence des informations
entre le cache et la RAM, en modifiant les 2
mmoires lors de lcriture dans le cache.
Sinon, il faut modifier directement la RAM
(modifier mmoire principale).
On a en gnral C >> M.
compose dune partie de ladresse de la mmoire principale, qui identifie le bloc stock.
Structure de la RAM :
Si on lit un mot dun bloc de mmoire, on transfre ce bloc dans lune des lignes du cache.
Si les lignes de cache sont moins nombreuses que les blocs de mmoire principal,
on utilise des algorithmes de correspondance entre les blocs de la RAM et les lignes de cache
Algorithmes de correspondance :
o
Correspondance directe :
La mmoire utile contient les donnes, o chaque ligne a une longueur de K mots.
Le rpertoire comporte K lignes.
Chaque ligne L contient un bit de validit indiquant si des donnes sont disponibles dans L.
Chaque ligne L contient une cl permettant didentifier la ligne souhaite dans la RAM.
Le comparateur compare la cl et ltiquette.
Avantages :
Simple, facile raliser
Bon rsultats
Inconvnients :
Collisions (des adresses diffrentes ayant le mme numro dindex)
Correspondance associative :
Une ligne de donnes entre dans nimporte quelle entre libre du cache
Adresse = tiquette + offset
Le contrleur de cache vrifie en une seule opration si une tiquette est prsente dans une des lignes du rpertoire.
Inconvnients :
Cher
Complexe
Algorithmes de remplacement des lignes : algorithmes utiliss lorsquune ligne de la mmoire cache doit tre remplace.
o FIFO (First In, First Out) : la ligne remplace est la ligne la plus anciennement charge.
o LRU (Least Recently Used) : la ligne remplace est la ligne la moins rcemment accde.
Avantage : Cette politique est meilleure que la prcdente car elle tient compte des accs effectus par le processeur au cache
Inconvnient : elle est coteuse car ncessite de maintenir lordre des accs raliss.
o NMRU (Not Most Recently Used) : la ligne remplace nest pas la plus rcemment utilise.
Dans cette politique, la ligne remplace est une ligne choisie au hasard dans lensemble des lignes du cache, hormis la ligne la plus rcemment accde.
Avantage : implmentation facile, la plus performante
Algorithme/Formules
= ( )
+1 = + ( )
Addition
1 bit
Additionneur
Soustracteur
N bits
= + + 1
Schma
Rseau
Squentielle
Multiplication
Binaire
Divison binaire