Beruflich Dokumente
Kultur Dokumente
La compressione audio
Come risparmiare spazio e tempo
lavorando sulla forma donda
2
La compressione audio
Larte di minimizzare le risorse per i dati audio
ridurre la memoria occupata
ridurre i costi di trasmissione
Risultati attuali: buona qualit in confronto
allaudio non compresso (stesso tasso di
trasferimento dati)
3
Obiettivo: riproduzione trasparente
Audio che anche orecchiesensibili non
riescono a distinguere dalloriginale
Numero minimo di bit mantenendo una
riproduzione trasparente del segnale
4
Laudio digitale
Vantaggi
alta fedelt delle copie del segnale
robustezza
gamma dinamica estesa
Svantaggio: alto tasso di trasferimento dati
campionamento: 44.1 kHz (CD), 48 kHz (DAT)
quantizzazione: PCM lineare a 16 bit
5
Perch nasce la compressione
Laudio digitale non compresso occupa ...
molto spazio sullhard-disk per la memorizzazione
una banda ampia sul canale di trasmissione
6
Esempio: brano di 1 min con qualit CD
Parametri
campionamento =44,100 c/s
quantizzazione =16 bit =2 byte
canali =2
Memoria = 44.100 c/s * 2 can * 2 byte/c * 60 s
~10 Mbyte
Tempo = 10 Mbyte * 8 bit/byte / (56 kbps * 60 s) ~ 24 min
Solo per scaricare un minuto di musica stereo!
7
non solo
Problemi di banda per applicazioni multimediali
Accesso e trasferimento dati sempre pi veloce,
ma ...
immagini, video, testo, e audio di alta qualit
sincronizzati tutti assieme
8
Due livelli di applicazioni
Bassa qualit
telefonia
Alta qualit
colonne sonore per giochi su CD-ROM
memorie allo stato solido (flash) per i suoni
audio su Internet
broadcast di audio digitale (Radio e TV)
9
Compressione e decompressione
Encoding,
Codifica,
Compressione
Dati audio
non compressi
Bitstreamin
modalit
compressa
Decoding,
Decodifica,
Decompressione
Audio non compresso
che suona come loriginale
lossless
lossy
10
Nellanalogico
Problema: gamma dinamica ridotta
Riduzione del rumore (Dolby) per aumentare la
gamma dinamica ridotta dal rumore
compansion: compression + expansion
registrazione: compressione della gamma dinamica
riproduzione: espansione della gamma dinamica
Compansion su tutte le frequenze (dbx) o su
bande selezionate (Dolby A, B, C)
11
La compansion nel digitale
Esempio: valori di 8 bit
00001101 = 1101 x 1
00011010 = 1101 x 10
00110100 = 1101 x 100
01101000 = 1101 x 1000
11010000 = 1101 x 10000
Sono sufficienti 7 bit = 4 + 3 (si risparmia 1 bit:
riduzione del 12,5%)
Perdita di accuratezza nei valori pi grandi
12
ITU-T G.711, -lawe A-law
-32768
+32767
0
255
-32768
+32767
13
-Law compansion
Quantizzazione logaritimica
Gamma dinamica di 14 bit con una codifica a 8-bit
Per i servizi voce ISDN in Nord America e Giappone
Semplice il computo della codifica
-8
+7
-4
+3
14
Codifica -law
Codifica PCM lineare
(a 16 bit)
codifica
-Law
a 8-bit
Decodifica PCM lineare
(a 16 bit)
15
Esempi di codifica -law
16
Lossy -law
- 200
(a 16 bit)
106
a 8-bit
- 193
(a 16 bit)
17
ADPCM
CCITT G.721, G.723, e ITU-T G.726
Standard per la compressione di dati vocali
CCITT G.721 (ADPCM a 32 Kbps)
CCITT G.723 (ADPCM a 24 e 40 Kbps)
ADPCM = Adaptive Differential PCM
metodo comune di compressione
buon compromesso tra velocit di elaborazione,
tasso di compressione e decodifica di qualit
18
Codifica della differenza (DPCM)
Ridondanze temporali tra i campioni
La differenza tra due campioni a x-bit si pu
rappresentare con meno bit di x
Si memorizza la differenza (non il campione)
+1
+1
+1 0 0
-1
-1
0 0
+1 0
-1
-1
-1
-3
0 +1
+2
+3
19
Problema Slope Overload
Differenze elevate (alte frequenze) non si possono
rappresentare con un numero piccolo di bit
Gli errori introdotti porterebbero a distorsioni sulle
alte frequenze
+1
+1
0
-1
-1
0
0
0 0
-1
-2
-4 +4
+5
-8 +6
-4
+1
+1
20
Adaptive DPCM (ADPCM)
Passi di quantizzazione pi grandi per
differenze pi grandi, e viceversa
Si usano i campioni precedenti per stimare i
cambiamenti futuri
21
Schema di ADPCM
22
Predictor
+
+
campione
PCM
a x-bit
differenza
ADPCM
a y-bit
Quantizer
Adattatore
Step-Size
Requantizer
+
Campione n+1
PCMpredetto
Raffiniamo ladattabilit ADPCM
+
+
23
Due varianti di ADPCM
IMA/DVI ADPCM
comprime dati audio a 16-bit in soli 4 bit
Microsoft ADPCM
variante di ADPCM da usare con i WAV
anchesso dati audio a 16-bit data in 4-bit data
24
IMA ADPCM
Register
+
+
campione
PCM
a 16-bit
differenza
ADPCM
a 4-bit
Quantizer
Adattatore
Step-Size
Requantizer
+
Campione n-1
PCM
Predictor non adattativo
Passo di quantizzazione aumenta in modo
logaritmico
+
+
25
IMA: Tabella Passi (di quantizzazione)
6484 71 1166 53 209 35 37 17
32767 88 5894 70 1060 52 190 34 34 16
29794 87 5358 69 963 51 173 33 31 15
27086 86 4871 68 876 50 157 32 28 14
24623 85 4428 67 796 49 143 31 25 13
22358 84 4026 66 724 48 130 30 23 12
20350 83 3660 65 658 47 118 29 21 11
18500 82 3327 64 598 46 107 28 19 10
16818 81 3024 63 544 45 97 27 17 9
15289 80 2749 62 494 44 88 26 16 8
13899 79 2499 61 449 43 80 25 14 7
12635 78 2272 60 408 42 73 24 13 6
11487 77 2066 59 371 41 66 23 12 5
10442 76 1878 58 337 40 60 22 11 4
9493 75 1707 57 307 39 55 21 10 3
8630 74 1552 56 279 38 50 20 9 2
7845 73 1411 55 253 37 45 19 8 1
7132 72 1282 54 230 36 41 18 7 0
Passo Indice Passo Indice Passo Indice Passo Indice Passo Indice
26
Selezione step-size adattiva
8 1,75 111 7/4passo <differenza
6 1,50 110 3/2passo <differenza <7/4passo
4 1,25 101 5/4passo <differenza <3/2passo
2 1,00 100 passo <differenza <5/4passo
-1 0,75 011 3/4passo <differenza <passo
-1 0,50 010 1/2passo <differenza <3/4passo
-1 0,25 001 1/4passo <differenza <1/2passo
-1 0,00 000 differenza <1/4passo
Variazione indice Moltiplicatore Output del
Quantizer
Quantizzazione
27
Lookup
Tabella
Step-Size
Registro
Calcolo
Adattamento
Indice
Tabella
Step-size
Adattamento
indice
Nuovo indice
Output
Quantizer
Nuovo
Step-Size
Adattatore Step-size
Quantizer
Adattatore
Step-Size
Requantizer
Quantizer
Requantizer
Nuovo
Step-Size
+
Limiti tabella
(0 - 88)
28
Esempio
20 51 1,5 22 6 110 3/2 34<51<7/4 34 16/34 -51 20 15
71 28 1,75 16 8 111 7/4 16<45 8/16 -45 54 14
99 13,75 1,25 8 4 101 5/4 11<14<3/2 11 4/11 -14 99 13
113 3 0,25 4 -1 001 1/4 12<3<1/2 12 5/12 3 113 12
110 10 1,00 5 2 100 10<11<5/4 10 3/10 11 111 11
100 0 0 3 -1 000 0<1/4 11 4/11 0 100 10
100 9 0,75 4 -1 011 3/4 12<9< 12 5/12 -9 100 9
109 9,75 0,75 5 -1 011 3/4 13<13< 13 6/13 -13 106 8
119 11,25 1,25 6 4 101 5/4 9<12<3/2 9 2/9 -12 118 7
130 0 0 2 -1 000 1<1/4 10 3/10 -1 129 6
130 2,75 0,25 3 -1 001 1/4 11<4<1/2 11 4/11 4 131 5
127 9 0,75 4 -1 011 3/4 12<9< 12 5/12 9 127 4
118 6,5 0,5 5 -1 010 1/2 13<9<3/4 13 6/13 9 120 3
111 10,5 1,5 6 6 110 3/2 7<12<7/4 7 0/7 12 112 2
100 0/7 100 1
Decode Molt.
Nuovo
indice
Var.
indice
Output
Quant.
Confronto
C[N]-Passo
Indice/
Passo
C[n] X[n]
29
La compressione di tipo percettivo
MP3 & Co.
Principi psicoacustici applicati
30
Schema generale
X(n)
Analisi
tempo/
frequenza
Quantizzazione
e
Codifica
Allocazione
di bit
Analisi
psicoacustica
Compressione
senza
perdite
(entropia)
Parametri
Soglie di
mascheramento
bitstream
nel canale
Info
aggiuntive
Decodifica del
bitstream
Ricostruzione
campioni per banda
Sintesi
segnale
X(n)
Codifica del
bitstream
31
Soglia assoluta delludito
32
Le bande di
frequenza critiche
Banda Centro Estremi
1 50 -100
2 150 100-200
3 250 200-300
7 700 630-770
11 1370 1270-1480
15 2500 2320-2700
19 4800 4400-5300
20 5800 5300-6400
25 19500 15500-
Bande di 100 Hz fino a
circa 500 Hz
Bande per 20% del centro
oltre 500 Hz
33
Soglie di mascheramento globale
34
Mascheramento simultaneo
Tono di
mascheramento
Soglia di
mascheramento
Minima soglia di
mascheramento
Banda
critica
Banda
vicina
m-1
m
m+1
SMR
MNR
SNR
dB
frequenza
35
Mascheramento temporale
masker
Pre
(5 ms)
Post
(50-300ms)
Simultaneo
-50 0 50100 0 50 150 250
150
100
ms
dB
36
MPEG
(Motion Picture coding Experts Group)
Gruppo di lavoro di ISO/IEC per lo sviluppo di
standard internazionali per ...
compressione, decompressione, elaborazione,
e rappresentazione codificata di
video, audio, combinazioni A/V.
37
Standard MPEG
MPEG-1: memorizzazione/recupero video/audio
(11/92)
MPEG-2, standard per la TV digitale (11/94)
MPEG-4
v. 1, standard applicazioni multimediali (10/98)
v. 2, standard audio/video HDTV (12/99)
MPEG-7: standard rappr. dei contenuti
ricerca, filtraggio, gestione di info multimediale
rilasciato a luglio 2001
38
e MPEG1/2 Layer III (MP3)
1987 progetto Eureka (Digital Audio
Broadcasting)
lavoro su audio percettivo in collaborazione tra
Fraunhofer IIS e lUniversit di Erlangen
risultato: algoritmo molto potente ISO-MPEG
Audio Layer-III
39
Lo schema di compressione MPEG-1
Struttura di base comune su pi layer
calcolo delle sottobande
calcolo del modello psicoacustico
3 Layer
Layer I: semplice, poco efficace
Layer III: complesso, efficace
Scelta del layer - rapporto qualit/compressione
40
Modalit di compressione
Pi frequenze di campionamento (32/44.1/48)
Bitstreamcompresso supporta mono, dual
mono, stereo, joint stereo
Bit rate da 32 a 224 kbps (compressione da 2,7
a 24 volte) tassi fissi e variabili
Supporta il controllo e la correzione degli errori
Informazioni supplementari
41
I tre livelli di compressione
Layer I
il pi semplice (bitrate oltre 128 kbps a canale)
DCC di Philips usa la compressione di Layer I a 192
Layer II
complessit media (bitrate circa 128 kbps a canale)
applicazioni in DAB
Layer III
il pi complesso, migliore qualit
64 kbps adatto per trasmissione audio su ISDN
42
MPEG 1 - Layer III
Loop controllo
distorsione
Codifica
di Huffman
bitstream
Banco di filtri
(32 sottobande)
FFT
1024 punti
audio digitale PCM
Codifica del
bitstream
Decodifica del
bitstream
Ricostruzione dei
campioni per bande
Ricostruzione dei
campioni nel tempo audio digitale
decompresso
Loop controllo
quant. log.
Codifica
info agg.
MDCT
0
31
Modello
psicoacustico
Analisi tempo-frequenza
0
575