Beruflich Dokumente
Kultur Dokumente
Spezialisierungstechniken
aus den bisherigen Betrachtungen lassen sich unterschiedliche
Spezialisierungstechniken ableiten
Spezialisierung des Befehlssatzes
Spezialisierung der Funktionseinheiten und Datenpfade
Spezialisierung der Speicherstruktur
Spezialisierung der Verbindungsstrukturen
Spezialisierung der Ablaufsteuerung
2- 186
Komponentenorientierte Spezialisierung - Zusammenspiel
2- 187
Komponentenübergreifende Spezialisierung
2- 189
Dynamischer Energieverbrauch
E LH U B I a ( t )dt U B QC L U B C L
2
t0
E HL 0 H
L
ID
Pdynamic U B C L f s
2
T
Edynamic Pdynamic dt
0
α Switching Activity
Prozent aller Gatter, die in einem Zyklus schalten
fs Schaltfrequenz (clock rate)
T Gesamtdauer der Ausführung
2-190
Verringerung des dynamischen Energieverbrauchs 1/2
T
Pdynamic U B C L f s
2
Edynamic Pdynamic dt
0
Verringerung UB
möglich, aber verringerte Rechenleistung
Verringerung der Schwellspannung Vt zur Erhöhung von ID
nur begrenzt möglich wegen exponentiell wachsender
Leckströme
Verringerung von UB wann immer die volle Rechenleistung nicht
benötigt
erfordert gleichzeitige Reduktion der Taktrate (linear)
Dynamic voltage and frequency scaling DVFS
Beobachtung
bei DVFS skaliert Pdynamic proportional zu UB³ , aber Edynamic nur
proportional zu UB² (Rechenzeit steigt proportional zu Taktzyklus)
eine Verringerung der Taktrate allein hat daher keinen Einfluss
auf Edynamic
2- 191
2- 192
Dynamic Voltage and Frequency Scaling
example: “speed-step”
several defined voltages
external
(faster switching) power supply
2-193
2- 194
Power Gating
Global
GND Grid
source:
VGND Puri et al. IBM, DAC 2005
Macro/Core
M1 metal
2- 196
Statische Verlustleistung wird begrenzender Faktor
2-198
Energieverbrauch - Zusammenfassung
hochrelevantes Problem – aktives Forschungsthema seit mehr als 20
Jahren
unterschiedliche Aspekte: Energie, Verlustleistung, Temperatur
vielfältige Methoden, von der Schaltkreis bis zur Systemebene
Spezialisierung ist wieder eine effiziente Methode
konträre Anforderungen aus der Minimierung der statischen und
dynamischen Verlustleistung führen zu einem Optimierungsproblem
2-199
2- 200
2.8 Historische Betrachtungen – „Lessons Learned“
gelegentlich führt eine hohe Spezialisierung zu praktischen Problemen
die Zusammenhänge sind dabei oft komplex
solche Beispiele bringen zusätzliche Erkenntnisse
Beispiel: TMS320C80 – ein früher Multicore-DSP (1995)
2- 201
Switch 32 64
126x32bit
64
64
Instruction Cache
Instruction Cache
Instruction Cache
Instruction Cache
Instruction Cache
Instruction Cache
Parameter RAM
Parameter RAM
Parameter RAM
Parameter RAM
Parameter RAM
TC
Data Cache
Data Cache
Data RAM2
Data RAM1
Data RAM0
Data RAM2
Data RAM1
Data RAM0
Data RAM2
Data RAM1
Data RAM0
Data RAM2
Data RAM1
Data RAM0
Memory
50kB
2-202
TMS320C80 cont´d
TMS320C80 cont´d
2-204
TMS320C80: data locality exploitation
Solution:
processor uses spatial or temporal locality of video processing
algorithms
TMS memory
video signal contents:window
TMS memory
contents:
line buffer
t external
frame
buffer
2-205
Start Address
Patch Q
Patch P
Memory Patch R
2-206
TMS320C80: summary
buffer
2-207
2-208