Beruflich Dokumente
Kultur Dokumente
BRASILEIRA 15608-2
Primeira edio
22.08.2008
Vlida a partir de
22.09.2008
ICS 33.160.01
ISBN 978-85-07-00925-2
Nmero de referncia
ABNT NBR 15608-2:2008
27 pginas
ABNT 2008
ABNT NBR 15608-2:2008
ABNT 2008
Todos os direitos reservados. A menos que especificado de outro modo, nenhuma parte desta publicao pode ser reproduzida
ou utilizada por qualquer meio, eletrnico ou mecnico, incluindo fotocpia e microfilme, sem permisso por escrito pela ABNT.
ABNT
Av.Treze de Maio, 13 - 28 andar
20031-901 - Rio de Janeiro - RJ
Tel.: + 55 21 3974-2300
Fax: + 55 21 2220-1762
abnt@abnt.org.br
www.abnt.org.br
Impresso no Brasil
Sumrio Pgina
Prefcio........................................................................................................................................................................v
1 Escopo ............................................................................................................................................................1
2 Referncias normativas ................................................................................................................................1
3 Termos e definies ......................................................................................................................................2
4 Abreviaturas...................................................................................................................................................2
5 Guia de codificao de vdeo para servio full-seg...................................................................................3
5.1 Recomendaes gerais.................................................................................................................................3
5.2 Relao de aspecto .......................................................................................................................................3
5.2.1 Na transmisso ..............................................................................................................................................3
5.2.2 Na recepo ...................................................................................................................................................3
5.3 Tempo de troca de canal (zapping) .............................................................................................................4
5.4 Detalhes da compresso H.264....................................................................................................................4
5.4.1 Parmetros de codificao ...........................................................................................................................4
5.4.2 Limite das taxas de codificao de vdeo ...................................................................................................4
5.4.3 Converso de formatos.................................................................................................................................4
5.4.4 Perfil@nvel de codificao ..........................................................................................................................4
5.4.5 Colorimetria....................................................................................................................................................5
5.4.6 Restries do fluxo de transporte ...............................................................................................................5
5.5 Emprego das ferramentas de pan-scan ......................................................................................................7
5.5.1 Descrio dos vetores de pan-scan ............................................................................................................7
5.5.2 Relao de AFD com os vetores de pan-scan............................................................................................7
5.6 Emprego do AFD ...........................................................................................................................................8
5.6.1 Descrio do AFD..........................................................................................................................................8
5.6.2 Recomendaes para o codificador............................................................................................................8
5.6.3 Recomendaes para o decodificador........................................................................................................8
5.6.4 Recomendao para o vetor de pan-scan ..................................................................................................9
5.7 Parmetros de qualidade ..............................................................................................................................9
6 Guia de codificao de udio para recepo full-seg ...............................................................................9
6.1 Pr e ps-processamento.............................................................................................................................9
6.2 Downmixing ...................................................................................................................................................9
6.2.1 Orientaes gerais ........................................................................................................................................9
6.2.2 Faixa dinmica .............................................................................................................................................10
6.2.3 Nvel de udio e estouro (overflow)...........................................................................................................10
6.2.4 Uniformidade de volume.............................................................................................................................10
6.3 Mapeamento de canais para troca de programas....................................................................................10
6.4 Conectividade para os sistemas de home theater...................................................................................11
6.4.1 Orientaes gerais ......................................................................................................................................11
6.4.2 Priorizao da sada de udio ....................................................................................................................12
6.4.3 Sadas estreo e mono para os sistemas home theater .........................................................................12
6.4.4 Sadas multicanal para os sistemas home theater ..................................................................................12
6.4.5 Transcodificao para formato DTS..........................................................................................................12
6.5 Parmetros da codificao de udio para recepo full-seg..................................................................12
6.5.1 Perfis de codificao de udio...................................................................................................................12
6.5.2 Principais parmetros da codificao full-seg.........................................................................................13
6.5.3 Observaes sobre os modos e sinalizao ............................................................................................13
6.5.4 Mudana nos parmetros de codificao .................................................................................................14
6.6 Parmetros de qualidade do servio full-seg...........................................................................................15
6.6.1 Indicadores de qualidade de udio............................................................................................................15
6.6.2 Faixa de taxas de bits para codificao de udio ....................................................................................16
7 Informao detalhada de operao para recepo one-seg...................................................................17
Prefcio
A Associao Brasileira de Normas Tcnicas (ABNT) o Foro Nacional de Normalizao. As Normas Brasileiras,
cujo contedo de responsabilidade dos Comits Brasileiros (ABNT/CB), dos Organismos de Normalizao
Setorial (ABNT/ONS) e das Comisses de Estudo Especiais (ABNT/CEE), so elaboradas por Comisses de
Estudo (CE), formadas por representantes dos setores envolvidos, delas fazendo parte: produtores, consumidores
e neutros (universidade, laboratrio e outros).
Os Documentos Tcnicos ABNT so elaborados conforme as regras das Diretivas ABNT, Parte 2.
A Associao Brasileira de Normas Tcnicas (ABNT) chama ateno para a possibilidade de que alguns dos
elementos deste documento podem ser objeto de direito de patente. A ABNT no deve ser considerada
responsvel pela identificao de quaisquer direitos de patentes.
A ABNT NBR 15608-2 foi elaborada pela Comisso de Estudo Especial de Televiso Digital
(ABNT/CEE-00:001.85). O Projeto circulou em Consulta Nacional conforme Edital n 07, de 10.07.2008 a 08.08.2008,
com o nmero de Projeto 00:001.85-008/2.
Esta Norma baseada nos trabalhos do Frum do Sistema Brasileiro de Televiso Digital Terrestre, conforme
estabelecido no decreto presidencial n 5.820, de 29.06.2006.
A ABNT NBR 15608, sob o ttulo geral Televiso digital terrestre Guia de operao, tem previso de conter as
seguintes partes:
Parte 2: Codificao de vdeo, udio e multiplexao Guia para implementao da ABNT NBR 15602:2007;
Parte 3: Multiplexao e servio de informao (SI) Guia para implementao da ABNT NBR 15603:2007;
Parte 4: Codificao de dados e especificaes de transmisso para radiodifuso digital Guia para
implementao da ABNT NBR 15606:2007.
1 Escopo
Esta parte da ABNT NBR 15608 consiste em um guia para a implementao da ABNT NBR 15602 e contm
informaes adicionais dos parmetros de codificao para os sinais de udio e vdeo para o sistema brasileiro de
televiso digital terrestre (SBTVD).
2 Referncias normativas
Os documentos relacionados a seguir so indispensveis aplicao deste documento. Para referncias datadas,
aplicam-se somente as edies citadas. Para referncias no datadas, aplicam-se as edies mais recentes do
referido documento (incluindo emendas).
ABNT NBR 15602-1:2007, Televiso digital terrestre Codificao de vdeo, udio e multiplexao
Parte 1: Codificao de vdeo
ABNT NBR 15602-2:2007, Televiso digital terrestre Codificao de vdeo, udio e multiplexao
Parte 2: Codificao de udio
ISO/IEC 14496-10, Information technology Coding of audio-visual objects Part 10: Advanced Video Coding
ISO/IEC 13818-1, Information technology Generic coding of moving pictures and associated audio information:
Systems
ETSI TS 101 154:2007, Digital video broadcasting (DVB); Implementation guidelines for the use of Video and audio
coding in broadcasting applications based on the MPEG-2 transport stream
ITU Recommendation BT.601-6, Studio encoding parameter of digital television for standard 4:3 and wide-screen
16:9 aspect ratios
ITU Recommendation BT.709-5, Parameter values for the HDTV standard for production and international
programme exchange
ITU Recommendation H.264:2005, Advanced video coding for generic audiovisual services
3 Termos e definies
Para os efeitos desta parte da ABNT NBR 15608, aplicam-se os seguintes termos e definies.
3.1
receptor full-seg
dispositivo capaz de decodificar informaes de udio, vdeo, dados etc., contidas na camada do fluxo de
transporte de 13 segmentos destinada ao servio fixo (indoor) e mvel
NOTA A classificao full-seg aplicada aos conversores digitais, tambm conhecidos por set top box e aos receptores
de 13 segmentos integrados com tela de exibio, mas no exclusivos a estes. Este tipo de receptor capaz de receber e
decodificar sinais de televiso digital terrestre de alta definio e, a critrio do fabricante, tambm receber e decodificar
informaes transportadas na camada A do transport stream, aplicada para os servios direcionados aos receptores portteis,
definidos como one-seg.
3.2
receptor one-seg
dispositivo que decodifica exclusivamente informaes de udio, vdeo, dados etc., contidas na camada A
localizada no segmento central dos 13 segmentos
NOTA A classificao one-seg destinada aos receptores do tipo porttil, tambm conhecidos por handheld,
especialmente recomendados para telas de exibio de dimenses reduzidas, normalmente at 7 polegadas. Entre os produtos
classificados como one-seg, esto os receptores integrados com telefone celular, PDA, dongle e televisores portteis, os quais
so energizados por uma bateria interna e, portanto sem necessariamente demandar uma fonte externa de energia, bem como
aqueles destinados a veculos automveis. Este tipo de receptor capaz de receber e decodificar apenas sinais de televiso
digital terrestre transportado na camada A do fluxo de transporte e, conseqentemente, apenas sinais de perfil bsico,
destinado aos dispositivos portteis de recepo.
4 Abreviaturas
Para os efeitos desta parte da ABNT NBR 15608, aplicam-se as seguintes abreviaturas:
LATM Multiplexador de Transporte de udio de Baixo Overhead (Low Overhead Audio Transport Multiplex)
LOAS Multiplexador para Transporte de udio de Baixo Overhead (Low Overhead Audio Transport Multiplex)
Na especificao de qualquer receptor full-seg convm considerar que todas as estruturas descritas na
ITU Recommendation H.264 podem estar presentes nos fluxos de transporte compatveis com a ABNT NBR 15602-1,
ainda que, inicialmente, no sejam empregadas pelas emissoras.
5.2.1 Na transmisso
Quando usada uma relao de aspecto diferente da relao do contedo original de vdeo para transmisso, como
quando usado formato pilarbox ou letterbox, convm adicionar faixas ao contedo transmitido como parte da
imagem. As faixas adicionadas podem, a critrio dos produtores de contedo, conter grafismos e cores.
Convm tomar especial cuidado com as regies de transio da imagem, entre a regio do contedo original e as
regies artificialmente inseridas na imagem, para que a codificao seja suave e no sejam inseridos artefatos
indesejados no contedo.
5.2.2 Na recepo
Convm que os receptores full-seg sejam capazes de decodificar imagens com resoluo de luminncia conforme
Tabela 1 aplicando uma sobreamostragem na imagem decodificada sempre que necessrio para o preenchimento
total da tela. Da mesma forma, recomenda-se que os receptores full-seg sejam capazes de decodificar imagens de
menor resoluo que o monitor (SD) e apresent-las com pilarbox.
No convm transmitir imagens capturadas com resoluo inferior a 480 linhas, ainda que o contedo tenha sido
convertido para uma das resolues permitidas no sistema.
A sobreamostragem de imagens 4:3 em monitores 16:9 opcional no decodificador, uma vez que os monitores
16:9 podem ser configurados para operar em modo 4:3.
Para a exibio de imagens 480 x 720 com relao de aspecto 4:3 numa tela 16:9, convm retirar 8 pixels de cada
lado da imagem antes de aplicar o escalamento x 3/4.
Em um ponto de acesso aleatrio, o fluxo de vdeo caracteriza-se por uma das duas informaes a seguir:
2) Sequence Parameter Set, Picture Parameter Set, Recovery Point SEI Message e imagem tipo I.
O intervalo de tempo entre pontos de acesso aleatrio pode variar entre programas e dentro de um mesmo
programa. Contudo, convm que o intervalo mximo entre pontos de acesso consecutivos seja configurado pelos
radiodifusores em um range inferior a 1 s.
Convm que os receptores full-seg sejam capazes de iniciar o processo de decodificao e exibio das imagens
baseado em um ponto de acesso aleatrio.
A conformidade com as restries de parmetros de codificao da ABNT NBR 15602-1 pode ser assegurada
tendo em conta as restries impostas pelo perfil@nvel, HP@L4.0 da ITU-T Recommendation H.264.
O formato de campo ou o formato quadro podem ser utilizados para imagens entrelaadas. Tais formatos podem
ser chaveados entre as unidades seqenciais.
O limite das taxas de codificao de vdeo pode fornecer uma indicao com respeito s taxas de codificao de
vdeo dos equipamentos de transmisso usadas durante operaes regulares. No especificado um limite de
garantia para operao das unidades de recepo.
Convm que o limite das taxas de codificao de vdeo seja estabelecido pelos perfis da ITU Recommendation H.264.
Embora a ABNT NBR 15602-1 permita o emprego dos perfis de compresso Main ou High tanto para sinais-fonte
SDTV quanto para sinais HDTV, convm empregar sempre o perfil High para a codificao do vdeo.
Convm que o emprego do perfil High seja corretamente sinalizado atravs do emprego de profile_idc no valor 100.
Analogamente, embora o nvel 4.0 seja o nvel mximo a ser suportado pelos decodificadores de vdeo, convm
que os valores do parmetro level_idc para cada resoluo de imagem sejam conforme a Tabela 2 e
ABNT NBR 15602-1.
5.4.5 Colorimetria
Se o sinal de entrada for compatvel com as equaes de sinal de luminncia e crominncia (diferena de cor)
segundo provises de outras especificaes, que no a ITU-R Recommendation BT.709-5 e
ITU-R Recommendation BT.601-6, recomenda-se que as diferenas entre as equaes sejam compensadas antes
da transmisso.
Nos casos excepcionais em que sinais em outros padres de cores forem utilizados as informaes dos
parmetros de VUI da Tabela 3 podem ser indicadas de acordo com os parmetros indicados.
Convm que as configuraes de SPS, Sequence Parameter Set, na Tabela 4 e os parmetros de VUI na
Tabela 5 sejam observados.
Perfil main = 77 e
profile_idc 77 ou 100 77 ou 100 77 ou 100 77 ou 100 perfil high = 100
(recomendado)
constraint_set0_flag 0 0 0 0
Perfil main = 1 e
constraint_set1_flag 0 ou 1 0 ou 1 0 ou 1 0 ou 1
perfil high = 0
constraint_set2_flag 0 0 0 0
constraint_set3_flag 0 0 0 0
chroma_format_idc 1 1 1 1 4:2:0
chroma_samplo_loc_type_top_field 0 0 0 0
chroma_samplo_loc_type_bottom_field 0 0 0 0
0 No se aplica ao
qpprime_y_zero_transform_bypass_flag 0 0 0
perfil Main
0 Sem
gaps_in_frame_num_
0 0 0 compensao de
value_allowed_flag
quadros perdidos
pic_width_in_mbs_minus1 119 79 44 44
pic_height_in_map_units
33 44 29 14
_minus1
1 Somente quadro
frame_mbs_only_flag 0 1 0
tipo MB
frame_cropping_flag 1 0 0 0
frame_crop_left_offset 0 0 0 0
frame_crop_right_offset 0 0 0 0
frame_crop_top_offset 0 0 0 0
frame_crop_bottom_offset 2 0 0 0
1 Sinaliza
vui_parameters_present_flag 1 1 1
presena de VUI
EXEMPLO 2 Convm que quando time_scale = 24 000, num_units_in_tick = 1 001, o intervalo da imagem adjacente seja
2/23,9 s.
Os receptores full-seg com suporte aos vetores de pan-scan permitem que monitores 4:3 preencham
integralmente a tela para imagens codificadas em 16:9.
O vetor de pan-scan corresponde aos deslocamentos horizontais na posio central do quadro de vdeo
especificada por um valor diferente de zero no campo frame_center_horizontal_offset no fluxo de vdeo H.264.
O decodificador pode utilizar o AFD como parte da lgica que decide como o receptor full-seg processa e
posiciona da imagem reconstruda a ser exibida no monitor, nos casos em que a relao de aspecto do monitor
no casa com a relao de aspecto da fonte, ou seja, quando usar os vetores de pan-scan e quando gerar um
letterbox.
Convm que o AFD indique a rea de interesse do contedo visual para uma populao heterognea de
receptores. O AFD pode garantir a exibio tima do contedo em monitores com aspecto 4:3 ou 16:9,
considerando as preferncias definidas pelo usurio.
Para que este mecanismo atue no contedo visual corretamente, convm utiliz-lo em conjunto com a relao de
aspecto do contedo e o com o formato do quadro da televiso.
Convm que o AFD seja um campo de 4 bits, ou seja, possvel configurar at 16 opes, porm apenas 10
podem ser utilizadas. O emprego do AFD no necessrio quando desejado proteger somente a regio central
em formato 4:3 de uma imagem 16:9.
Este mecanismo opcional nos receptores full-seg. Para uma descrio mais detalhada, convm consultar a ETSI
TS 101 154.
A informao de relao de aspecto pode ser usada para definir o formato ativo a ser difundido
independentemente do formato do quadro transmitido (4:3 ou 16:9).
1) se a relao de aspecto for superior a 16:9, convm usar o Active format 4 (preferido a 8);
3) se o filme for feito para exibio com uma relao de aspecto maior (14:9) (com shout & protect) convm
usar o Active format 13; caso contrrio, convm usar o Active format 9;
4) se a relao de aspecto for 16:9 e se o filme for feito para exibio com uma relao de aspecto menor
(14:9 ou 4:3) (com shout & protect) convm usar o Active format 14 ou 15; caso contrrio, recomenda-se
usar o Active format 10;
Para permitir cortar as imagens usando Active format 13, 14 ou 15 quando o filme no foi feito para exibio com
uma relao de aspecto diferente, convm efetuar testes subjetivos para a determinao do valor mais adequado.
recomendado que o decodificador sempre considere a presena possvel de um campo AFD, mesmo se no
usar essa informao. O decodificador no pode presumir que o codificador no usou AFD.
Caso a informao de AFD no esteja presente, convm usar as preferncias do usurio ou preferencialmente o
formato que permite exibir a tela inteira (letterbox se o relao de aspecto da imagem for maior que o da televiso,
pilarbox se for menor).
Mesmo nos casos em que o AFD transmitido, desejvel ter a opo de by-pass do cdigo de AFD pelo usurio
atravs da escolha de suas preferncias no decodificador.
O vetor de pan-scan um deslocamento horizontal do vdeo na posio central especificado por um valor diferente
de zero do parmetro frame_center_horizontal_offset em um bitstream, conforme com ITU Recommendation H.264.
Convm que os vetores de pan-scan para uma janela 4:3 sejam includos no bitstream transmitido quando a
relao de aspecto da fonte 16:9 ou 2.21:1. Convm que o componente vertical do vetor de pan-scan seja zero.
Fica a critrio de cada emissora a determinao da taxa de bits empregada na codificao de vdeo dos sinais SD
e HD a serem transmitidos. Convm verificar a qualidade dos vdeos codificados com as taxas escolhidas.
Tal verificao pode ser efetuada utilizando-se analisadores de qualidade de vdeo disponveis comercialmente.
6.1 Pr e ps-processamento
Convm que funes de pr-processamento sejam aplicadas previamente entrada do udio no codificador para
conformar o(s) sinal(is) a parmetros recomendveis de qualidade de udio. Funes de pr-processamento
podem incluir a equalizao, a re-amostragem, o controle de ganho (intensidade ou volume) e o tratamento da
faixa dinmica. No uso de pr-processamento, convm evitar alteraes no contedo artstico dos programas.
Funes de ps-processamento podem ser empregadas para transformar e adequar o(s) sinal(is) para sua
apresentao final no receptor. Funes de ps-processamento nos receptores incluem mistura (mixagem),
downmixing, controle de volume, transcodificao de formato e tambm equalizao em alguns equipamentos.
Convm, no entanto, evitar alteraes no contedo artstico dos programas.
6.2 Downmixing
Convm que o downmix para estreo, ou seja, a converso de um programa de vrios canais em um programa
estreo, seja efetuado em todos os receptores full-seg que recebam sinal multicanal e tenham sada em dois
canais (estreo). Convm que os receptores full-seg do tipo settop box tenham sempre sada de udio estreo.
Convm seguir a equao de downmix descrita na ISO/IEC 14496-3 (matrix-mixdown process), bem como
recomendaes quanto ao seu uso, inclusive o procedimento recomendado quando pseudo_surround_enable
est ativado. O mtodo descrito pode ser aplicado somente para misturar e converter programas de 5 canais
(3 frontais + 2 surround, desprezando o canal LFE) para um programa estreo. Numa transmisso multicanal,
convm que a transmisso do coeficiente A de downmix que vai ser usado nesta equao seja sempre transmitida
conforme a ABNT NBR 15602-2.
Um dos propsitos desta equao evitar o estouro de bit (overflow) no decodificador AAC. Entretanto, quando a
equao usada para converter (downmix) um programa de 5 canais para um programa estreo, a diferena
entre os nveis de som do udio estreo gerado pela converso de um programa normal de 2 canais e um
programa de 5 canais ainda pode ser significativa e o downmix continuar a produzir clipping
(canais correlacionados no udio mixado). Diferentemente do caso de se ouvir um DVD onde o ajuste ativo pelo
usurio esperado no incio de sua execuo, o ajuste de volume pelo telespectador a cada programa pode ser
difcil. Convm empregar a funcionalidade de DRC para o controle como controle adicional do downmix para
estreo para evitar o clipping. O emprego de fatores de escala para a operao de downmix no recomendado.
Convm que o receptor utilize as informaes de controle de faixa dinmica (dynamic range control) sempre que a
informao dos respectivos metadados estiverem presentes.
Para que haja o aproveitamento efetivo da faixa dinmica na operao de downmix, convm adotar A=0,
que produz uma atenuao menor no nvel mdio dos sinais L e R.
Convm utilizar o nvel de referncia mdio prog_ref_level = 96 (0x60), que corresponde a -24 dBFS como
referncia de 0 dB.
Para garantir que o udio de cada canal esteja livre de estouro em qualquer caso, convm adotar valores de A
com maior atenuao, como A = 0,707 (que produzir uma atenuao global de aproximadamente -7,7 dB).
Entretanto, como este valor causa uma diminuio no nvel de um programa normal de udio, os bits de ordem
mais alta podem ficar virtualmente sem uso.
No caso de A = 0 quando sinais com alto nvel e em fase esto presentes nos 5 canais simultaneamente, L e R
podem sofrer estouro. Entretanto, considera-se esta situao improvvel em uma programao de udio.
Se a possibilidade de estouro for pequena, a utilizao de um esquema de codificao que provoque limitao
(clipping) na forma de onda, quando da ocorrncia de estouro, pode evitar distores significativas no sinal de
udio.
Em um receptor de 2 canais (estreo), convm que a diferena percebida de volume entre um programa
originalmente em estreo e um programa estreo obtido por downmix de um programa de 5 canais seja a menor
possvel. Isto ocorre com maior probabilidade adotando o fator de downmix A = 0,707, quando o mesmo fator de
atenuao aplicado ao canal central e canal surround.
A troca de programas pode ocasionar a troca do modo de udio. Para o sistema codificador, o mapeamento
recomendado para pares de canais durante troca de programa e no sistema de transmisso mostrado na Tabela
6, que adota como exemplo o par de canais de udio entregue no formato AES/EBU (AES-3). Outro sistema de
transporte pode ser adotado, valendo-se do mesmo mapeamento de canais por pares de entrada.
NOTA MS, LS e RS referem-se aos alto-falantes traseiros no modo envolvente (surround): M refere-se a mono, S refere-se
a estreo. O nmero diante da letra refere-se ao nmero do programa; 3/2/1 refere-se ao nmero de alto-falantes
frontais/envolvente/LFE. LFE (Low Frequency Enhancement) refere-se ao canal de nfase de baixas freqncias no modo
multicanal. L refere-se ao canal esquerdo (left), R, ao canal direito (right) e C, ao canal central.
A Tabela 6 define a relao entre o modo de udio durante a entrada para o codificador e o mapeamento dos
canais.
Convm que o decodificador seja capaz de decodificar o sinal MPEG-4 AAC em qualquer modo de canais
permitido na ABNT NBR 15602-2, contudo facultado ao fabricante do receptor disponibilizar terminal para sada
de udio em qualquer tipo de receptor. A exceo a este enunciado feita ao conversor digital (settop box), o qual
convm que seja equipado pelo menos com uma sada de udio analgica com dois canais (estreo).
Convm que os decodificadores sejam capazes de decodificar o sinal HE-AAC v1 nvel 2 (mono e estreo) em
taxas de at 48 kHz, e sejam capazes de decodificar o sinal HE-AAC v1 nvel 4 (sinal multicanal 5.1) em taxas de
amostragem de at 48 kHz, de acordo com a especificao ETSI TS 101 154:2007, subseo 6.4.
Se o receptor full-seg tiver dois modos de sada de udio (estreo e multicanal), convm que o ajuste default do
sinal de udio seja estreo e que o usurio seja capaz de selecionar o sinal de udio multicanal para sadas
digitais (S/PDIF, de acordo com a IEC 60958, ou HDMI) ou para sadas analgicas, quando disponveis.
Convm que o receptor converta os sinais disponveis apropriadamente para a sada selecionada, estreo ou
multicanal, analgica ou digital.
Nos casos em que o receptor tem sada digital nos formatos S/PDIF ou HDMI, convm que o sinal PCM estreo
esteja disponvel para os sistemas home theater.
Nos receptores sem sada multicanal, convm que os sinais de udio sejam downmixados para estreo na sada
analgica.
Para sada multicanal, nos casos em que o receptor tem sada digital no formato HDMI ou S/PDIF, convm ter o
sinal digital multicanal exportado para os sistemas home theater, ou ter as sadas analgicas no receptor.
O sinal digital multicanal pode ser exportado em formato PCM (canais no comprimidos) ou codificado
(por exemplo, AAC-LC, HE-AAC), e convm que os sistemas home theater faam a decodificao e reproduo
nas sadas analgicas correspondentes.
A transcodificao para outros formatos alm do MPEG-4 AAC no recomendvel do ponto de vista de
preservao da qualidade de udio.
Entretanto, em funo de outros requisitos, no caso de ser implementada a transcodificao para outros formatos
existentes (por exemplo, DTS ou Dolby AC-3) ou outro sistema futuro, convm que sejam seguidas as normas de
interfaces pertinentes e que os sistemas home theater faam a decodificao do formato escolhido e a reproduo
nas sadas analgicas correspondentes.
A transcodificao DTS dos fluxos de udio de implementao opcional nos receptores full-seg, entretanto uma
vez disponibilizado, convm que esteja de acordo com a especificao ETSI TS 102 114 na taxa fixa de
1 536 Mbps. Em presena de sinal 5.1, convm que o transcodificador seja configurado para Amode=9.
A codificao e a decodificao de fluxos elementares MPEG-4 AAC, MPEG-4 HE-AAC e MPEG-4 HE-AAC v2
esto baseadas na ISO/IEC 14496-3.
Os perfis MPEG-4 AAC e MPEG-4 HE-AAC v1 so subconjuntos do perfil MPEG-4 HE-AAC v2. O MPEG-4 HE-AAC
adiciona o audio object type (AOT) SBR ao perfil MPEG-4 AAC. O perfil MPEG-4 HE-AAC v2 adiciona o audio
object type (AOT) PS ao perfil MPEG-4 HE-AAC para melhorar a qualidade percebida de udio em taxas baixas.
Todo decodificador HE-AAC pode decodificar um fluxo de transporte HE-AAC v2, mas pode no ser capaz de
fazer uso das informaes de estreo paramtrico (PS) e, portanto, apresenta um sinal mono.
A codificao HE-AAC v2 no se aplica recepo full-seg. Entretanto, convm que todos os receptores full-seg
tenham capacidade para decodificao HE-AAC v1@L4 que corresponde ao formato de compresso mais
abrangente a ser suportado.
Convm que os parmetros de udio, tais como descrio do contedo e formatao do sinal, sejam
estabelecidos, inseridos e modificados nos seguintes estgios:
b) na entrada do codificador, estabelecidos pelo formato de entrada do sinal (por exemplo, taxa de amostragem);
d) na montagem das tabelas SI (por exemplo, descritor de componente de udio e descritor de parmetros do
MPEG-AAC);
e) no receptor, durante a decodificao e reproduo (por exemplo, volume, modo multicanal de reproduo
preferencial).
Se a ferramenta SBR for usada, o core do codificador AAC opera na metade da freqncia de amostragem
indicada na Tabela 7.
A Tabela 8 mostra as opes de sinalizao da codificao do sinal de udio, conforme ABNT NBR 15602-2.
Convm que o receptor trate as mudanas de servio de forma a causar a menor perturbao perceptvel para o
usurio. Essa recomendao se aplica s modificaes realizadas nos parmetros do fluxo de bits pertencentes
ao mesmo identificador de servio (service ID) a ser transmitido a partir de uma estao local. Especificamente,
aplica-se a mudanas nos seguintes parmetros:
taxa de amostragem;
taxa de bits;
Por ocasio das mudanas dos parmetros de udio, a decodificao gera rudo sob as condies presentes e as
unidades receptoras silenciam o sinal em muitos casos. Convm, portanto, inserir passagens de silncio no sinal
de entrada para o codificador, de maneira a prevenir a interrupo no programa de udio durante o chaveamento.
a) convm que mudanas realizadas em qualquer um dos parmetros de udio sejam realizadas com
aproximadamente 0,5 s de silncio na entrada do codificador de udio. Convm que esse tempo seja sempre
reduzido ao mnimo possvel;
b) o codificador pode esperar at que no haja mais dados armazenados nas memrias do codificador e
decodificador. Convm que s ento o codificador altere o parmetro de udio pretendido e continue o
processo de codificao. Aps o reincio da codificao, convm que uma quantidade de dados predefinida de
udio codificado seja armazenada na memria do codificador e, finalmente, os dados codificados sejam
transmitidos para o decodificador;
c) como, de acordo com a ABNT NBR 15602-2, os dados de udio so transmitidos utilizando MPEG-4, convm
que um PTS seja adicionado ao primeiro quadro de dados transmitido aps qualquer interrupo. Para
assegurar que o decodificador possa perceber que uma mudana foi efetuada em um parmetro, convm que
exista um intervalo de ao menos trs quadros entre o antigo PTS de dados e o PTS adicionado ao novo fluxo
de bits que for transmitido;
d) convm que o decodificador de udio possua capacidade de memria suficiente para o nmero mximo de
canais a ser manipulado;
e) no receptor, a memria pode sofrer underflow e convm que um sinal de silncio seja emitido se a memria
ficar vazia (se necessrio, convm que o nvel de udio decaia imediatamente antes da memria ficar vazia).
Aps a memria se esvaziar, convm que o processo de decodificao reinicie quando dados pr-
determinados de udio comearem a ser recebidos. Convm utilizar alguma estratgia de fade out no sinal
durante o silncio, para evitar estalos indesejveis quando do retorno do udio;
f) o decodificador pode paralisar o processo de decodificao e silenciar o udio quando no forem encontrados
dados de udio em sua memria de entrada. Se dados do fluxo de udio permanecerem na memria de
entrada do decodificador e se um novo quadro de udio for encontrado, convm que o decodificador aguarde
a quantidade de dados especificada e que somente aps o armazenamento na memria reinicie a
decodificao com base nos novos parmetros de udio.
Convm que o decodificador cancele o silncio de udio e emita os sinais de udio quando solicitado (a qualquer
tempo aps haver completado o processo de decodificao de dois quadros). No entanto, os fluxos de bits
gerados por este modelo so na prtica transmitidos atravs de sistemas MPEG-2 e o decodificador realiza
controle de memria utilizando a memria do sistema e PTS. Neste caso, nem sempre o decodificador pode
perceber que a sua memria est vazia. Convm ento que o decodificador determine que uma alterao de
parmetro foi feita notando que os fluxos de bits no so sucessivos, com base no PTS adicionado ao primeiro
quadro de udio que sucede a alterao do parmetro e tambm com base na informao do relgio do sistema.
Quando a taxa de amostragem for alterada, convm que o decodificador modifique seu relgio de referncia de
modo que uma condio transitria e instvel ocorra por um perodo limitado de tempo.
Pode-se assegurar mudana imperceptvel na taxa de bits controlando-se a memria no lado do codificador. Se
no for possvel o controle de memria devido a, por exemplo, mudanas no atraso de codificao causadas por
alteraes na taxa de bits, convm adotar as recomendaes gerais listadas em 6.5.4.2
A mudana de servio pode implicar a mudana no modo multicanal transmitido e isso pode provocar um reset do
decodificador no momento da mudana.
Do lado do receptor, convm que a configurao default da sada de do udio seja PCM estreo, ficando a cargo
do receptor full-seg realizar todos os tipos de converso necessrios para atender sada selecionada pelo
usurio.
Convm tomar o nvel de - 24 dBFS como volume de referncia. Entretanto, opcional para o radiodifusor
transmitir o valor de nvel de volume de referncia utilizado no programa de udio corrente, caso diferente do nvel
"default", para que receptor full-seg possa equalizar o nvel de volume entre mudanas de canal adequadamente.
Como o nvel de sinal mnimo aceitvel num sistema de udio est relacionado com a mnima relao sinal/rudo
(SNR) aceitvel para nveis de sinal baixos, convm que sua determinao seja uma deciso operacional.
Convm, entretanto que o sinal no nvel mais baixo aceitvel esteja ao menos 40 dB acima do rudo de fundo. A
faixa dinmica til , portanto, igual diferena entre o nvel mximo registrvel e o sinal no nvel mais baixo (40
dB acima do rudo de fundo). Para um sistema capaz de registrar 90 dB de faixa dinmica, o nvel mnimo
registrvel pode estar em torno de - 62 dBu. Este valor eventualmente pode estar acima do nvel mnimo aceitvel
de intensidade absoluta, o que leva a no utilizao dos nveis mais baixos.
Convm que a intensidade de referncia 0 dB tomada para o codificador esteja em torno de + 4 dBu ou
- 24 dBFS de intensidade, como prtica de equalizao e compatibilidade com nveis de referncia praticados por
equipamentos comerciais em estdio. Nesse caso h 24 dB de headroom de reserva disponvel.
O nvel de sinal mximo aceitvel est relacionado mxima distoro harmnica total (THD) e idealmente
convm que esta no exceda 0,1 %.
Se o usurio ouvir o programa em um ambiente ruidoso, a dinmica do udio ser extremamente reduzida pelo
rudo de fundo, podendo eventualmente no exceder 40 dB. Convm, neste caso, utilizar a funcionalidade de DRC
para reduo da faixa dinmica assegurando inteligibilidade.
A qualidade percebida de udio pode ser aferida por testes de qualidade subjetiva ou objetiva. Para que se tenha
uma indicao segura da qualidade mnima, convm tomar como referncia valores SDG (Subjective Difference
Grade) e ODG (Objective Difference Grade) obtidos, comparando-se o sinal codificado/recuperado com o sinal
original que esteja entre 0 e - 3.
A Figura 1 indica as faixas tpicas para uso dos codificadores MPEG-4 HE-AAC v2, MPEG-4 HE-AAC e MPEG-4
AAC na codificao de sinais estreo.
A Tabela 9 apresenta as faixas de taxas de codificao de udio amostrados a 48 kHz a serem usadas como
referncia para garantir uma uniformidade de qualidade mnima de udio nos servios de radiodifuso. Os valores
representam taxas indicativas para LATM/LOAS usando os perfis LC e HE AAC.
Para freqncias de amostragem em 44 kHz, convm que os valores de referncia apresentados na Tabela 9
sejam reduzidos em 10 %.
Convm que a codificao de vdeo para o servio one-seg siga as especificaes do ITU-T Recommendation
H.264 e ISO/IEC 14496-10.
Convm que todos os receptores para o servio one-seg compatveis com a ABNT NBR 15602-2 sejam capazes
de interpretar e decodificar adequadamente o estreo paramtrico (PS) na decodificao de sinais estreos.
Convm que restries dos parmetros de codificao de vdeo estejam de acordo com a ABNT NBR 15602-1 que
especifica o perfil Baseline e o nvel 1.3.
fatias I e P: codificao intra dos macroblocos atravs das fatias I e fatias P abre a possibilidade de
codificao inter utilizando um sinal de predio temporal;
CAVLC: o processo de codificao de entropia dos smbolos do codificador utiliza cdigos de tamanho
varivel baseados no contexto;
Flexible Macroblock Order (FMO): essa funcionalidade do perfil Baseline que permite a amostragem em
ordem arbitrria dos macroblocos no est prevista na ABNT NBR 15602-1. A proibio sinalizada pelo
emprego de constrained_set1_flag igual a 1;
Arbitrary Slice Order (ASO): essa funcionalidade do perfil Baseline que permite a ordenao arbitrria das
fatias dentro de uma imagem no est prevista na ABNT NBR 15602-1. A proibio sinalizada pelo emprego
de constrained_set1_flag igual a 1;
Redundant Slices (RS): essa funcionalidade do perfil Baseline que permite a transmisso de fatias
redundantes que se aproximam da fatia primria no est prevista na ABNT NBR 15602-1. A proibio
sinalizada pelo emprego de constrained_set1_flag igual a 1.
Considerando a mxima resoluo do sistema 288 x 352 pixels e a mxima taxa de quadros do perfil Baseline e
nvel 1.3, o vdeo codificado do servio one-seg pode atingir at 768 kbps. Convm que essa taxa mxima seja
suportada tanto pelos codificadores como pelos receptores one-seg.
Para o servio one-seg convm observar as restries no pacote PES conforme segue:
a) convm que PTS_DTS_flags do cabealho do pacote PES seja sempre 10;
c) convm que o pacote PES seja configurado por n partes do AU (n um inteiro 1 ou maior);
d) convm que diferena de PTS entre dois PES consecutivos seja inferior a 0,7 s.
Convm que as unidades de acesso IDR sejam inseridas dentro do fluxo de bits em intervalos de
aproximadamente 2 s, para encurtar o tempo requerido de reproduo. Entretanto, convm que eles sejam
inseridos em intervalos que no excedam 5 s, obedecendo aos critrios da ABNT NBR 15602-1.
Convm que cada IDR-AU seja um ponto de acesso no elementary stream descrito na ISO/IEC 13818-1 (ver
Figura 2).
Convm que o nmero e a ordem das unidades NAL para configurar o IDR-AU e no IDR-AU assumam os
valores da Tabela 11. Entretanto, outras unidades NAL diferente dos valores seguintes no podem ser operadas
(ver Tabelas 11 e 12).
Quantidade
Tipo e ordem da unidade NAL
IDR-AU No IDR-AU
Access unit delimiter 1 1
Sequence parameter set (SPS) 1 0
Picture parameter set (PPS) 1 0 ou 1
a
Supplemental enhancement information (SEI) 0 ou 1 0 ou 1 a
Coded slice of an IDR picture 1 e acima 0
Coded slice of a non-IDR picture 0 1 e acima
Filler data 0 ou 1 0 ou 1
End of sequence 0 ou 1 0 ou 1
a
A condio de insero da unidade SEI NAL est na Tabela 22.
As restries de flag na sintaxe so mostradas nas Tabelas 13 e 14. Entretanto, o ID do SPS (Sequence
Parameter Set) e o do PPS (Picture Parameter Set) podem ser configurados para operar com um valor fixo
indiferente s mudanas no contexto descrito nos parmetros.
EXEMPLO 2 Quando time_scale = 24 000, num_units_in_tick = 1 001, a unidade de cpb_removal_delay fica 1/23,9 s.
Tambm, uma vez que existam restries em 1 001/15 000 ou mais, a diferena de cpb_removal_delay fica 2 ou mais.
Restries no SEI (Supplemental Enhancement Information) so mostradas na Tabela 17. Buffering period, picture
timing, pan-scan, e a mensagem filler payload SEI somente podem ser inseridos no SEI
IDR-AU: o perodo de buffering na mensagem SEI, o tempo da imagem na mensagem SEI, o retngulo
pan-scan na mensagem SEI, e Filler payload na mensagem SEI podem ser inseridos em um AU relevante, e
inseridos se necessrios. Convm que a ordem de insero seja a seguinte:
no IDR-AU: somente o tempo da imagem na mensagem SEI e Filler payload pode ser inserido no AU
relevante. Convm que a ordem de insero empregada seja a seguinte:
O perodo de buffering da mensagem SEI est descrito na Tabela 17 e o tempo de imagem na mensagem SEI na
Tabela 18.
Os parmetros referentes ao retngulo de pan-scan da mensagem SEI esto descritos na Tabela 19.
Restries com relao insero do perodo de buffering na mensagem SEI e tempo de imagem na mensagem
SEI so mostrados na Tabela 20.
Tabela 20 Restries no perodo de buffering na mensagem SEI e tempo da imagem na mensagem SEI
Perodo de Tempo de
Configurao da AU
fixed_frame_rate_flag Tipo de AU buffering imagem
em 1 PES
Mensagem SEI Mensagem SEI
IDR Opcional Opcional
0
1 PES = 1 AU No IDR Proibido Opcional
operao fixa IDR Proibido Proibido
1
No IDR Proibido Proibido
IDR Obrigatrio Obrigatrio
1 PES= 1 AU 0
No IDR Proibido Obrigatrio
outra operao que no
a operao fixa IDR Proibido Proibido
1
No IDR Proibido Proibido
Quando o perodo de buffering na mensagem SEI e o tempo de imagem da mensagem so inseridos, convm que
pelo menos least_nal_hrd_parameters ou vcl_parameters_present_flag sejam 1.
Quando nem o perodo de buffering na mensagem SEI nem o tempo de imagem na mensagem SEI so inseridos,
convm que ambos o nal_hrd_parameters_present_flag e vcl_parameters_flag sejam 0.
EXEMPLO Quando time_scale = 30 000, num_units_in_tick = 1 001, a taxa de quadros 29,97/2 quadros/s.
As restries na insero do retngulo pan-scan na mensagem SEI esto na Tabela 21. Quando os parmetros de
pan-scan esto presentes, convm que sejam inseridos no IDR-AU.
Convm que o fluxo de bits de entrada no CPB seja configurado para ser decodificado dentro de 1,5 s.
As emissoras podem transmitir imagens 16:9, ainda que o formato da imagem seja somente QVGA. Quando as
imagens so 16:9, convm que pic_height_in_map_units_minus1 do fluxo de bits SPS H.264 seja 11.
Como uma regra, no convm modificar o pic_height_in_map_ units_minus1 para um programa; eles podem ser
operados em estado semi-fixo pelas emissoras. Entretanto, durante o perodo de transmisso simultneo com
espectro analgico, na presena de programas com razo de aspecto em 4:3 e 16:9, a indicao de razo de
aspecto pode mudar a cada programa.
possvel no exibir bordas dependendo do ngulo da imagem no receptor atravs da configurao dos seguintes
parmetros de pan-scan quando entregues por uma relao de aspecto diferente da imagem de origem como
pilarboxes e letterboxes:
quando exibindo a parte de uma imagem original (320 x 180) em tela cheia, em um monitor 16:9, e quando o
formato de imagem entregue QVGA 4:3 (320 x 240) e a imagem original 16:9 (letterbox);
quando exibindo a parte de uma imagem original (240 x 180) em tela cheia, em um monitor 4:3, e quando o
formato entregue QVGA 16:9 (320x 180) e a imagem original 4:3 (pilarbox).
Convm enviar o centro do formato da imagem entregue e o centro da imagem fonte correspondente em ambas
as direes vertical e horizontal.
O valor de cada parmetro indicado na Figura 3, quando esta operao for executada.
a) Pilarbox b) Letterbox
As restries para cada parmetro durante a operao do pan-scan so apresentadas na Tabela 24.
Pan-scan pode ser ligado/desligado pela unidade de seqncia de vdeo codificada, e quando a operao de pan-
scan acima no executada, a codificao do retngulo pan-scan da mensagem SEI no deve ser efetuada
(quando a operao pan-scan efetuada, o retngulo pan-scan do SEI sempre includo no IDR-AU).
As freqncias de amostragem AAC recomendadas so 24 kHz, 22,05 kHz ou 16 kHz uma vez que o emprego de
SBR obrigatrio de acordo com a ABNT NBR 15602-2. Portanto, as freqncias do udio decodificado so,
respectivamente, 48 kHz, 44,1 kHz e 32 kHz.
Convm que todos os receptores para o servio one-seg compatveis com ABNT NBR 15602-2 sejam capazes de
interpretar e decodificar adequadamente o estreo paramtrico (PS) na decodifcao de sinais estreo.
Com respeito faixa de taxas de codificao de udio (com amostragem de 48 kHz), convm utilizar os valores a
seguir como guia:
monaural: 24 kbit/s a 48 kbit/s;
Com respeito faixa de taxas de codificao de udio (com amostragem de 44,1 kHz), convm utilizar os valores
a seguir como guia:
monaural: 24 kbit/s a 40 kbit/s;
Com respeito faixa de taxas de codificao de udio (com amostragem de 32 kHz), convm utilizar os valores a
seguir como guia:
monaural: 24 kbit/s a 32 kbit/s;
No pode ser usado no servio one-seg, conforme definido pela ABNT NBR 15602-2.
8.1 Random_access_indicator
Na codificao, convm que o random_access_indicator seja sempre setado na ocorrncia de um RAP de acordo
com a definio de RAP dada na ITU Recommendation H.264:2005, subsees 3.1 e 5.5.5.
Na decodificao, o bit de random_access_indicator pode ser ignorado pelo receptor. Contudo, esse pode se
beneficiar da utilizao conjunta com o elementary_stream_priority_indicator para a identificao de um RAP.
8.2 Elementray_stream_priority_indicator
Na codificao, convm que o bit do elementary_stream_priority_indicator seja setado somente quando uma
unidade de acesso contendo uma imagem I ou IDR (slice_type 0x02 ou 0x07) estiver presente no fluxo de vdeo.
Analogamente, convm que o elementary_stream_priority_indicator seja configurado no cabealho do pacote de
transporte que contm a primeira fatia (slice) codificada dessa imagem I ou IDR. Esse cabealho pode estar no
pacote de transporte imediatamente depois do pacote contendo um random_acess_indicator.
Na decodificao, o bit referente ao elementary_stream_priority_indicator pode ser ignorado pelo receptor, porm
esse pode ser til para suportar modos de operao complexos.
Embora a ITU-T Recommendation H.264 permita que mltiplos vdeos sejam transmitidos em um mesmo pacote
PES, no convm utilizar essa funo nos codificadores.
Quando um pacote PES contm mltiplas unidades de acesso, para qualquer unidade seguindo a primeira
unidade de acesso no mesmo pacote PES, os elementos sintticos num_units_in_tick, time _scale e pic_struct
(quando presente), e o valor das variveis TopFieldOrderCnt e BottomFieldOrderCnt da unidade de acesso podem
derivar os valores de PTS e DTS da unidade de acesso.
Na decodificao, se o PTS estiver definvel e o DTS no estiver na primeira unidade de acesso em um pacote
PES, convm que o decodificador ajuste o valor do DTS igual ao valor do PTS. Convm que o PTS e o DTS de
qualquer unidade de acesso que se segue primeira unidade de acesso em um pacote PES seja derivado
utilizando os elementos sintticos num_units_in_tick, time_scale e pic_struct (quando presente), e os valores das
variveis TopFieldOrderCnt e BottomFieldOrderCnt.
Convm aplicar todas as regras de transmisso e recepo das Tabelas PSI definidas na ARIB TR-B14:2006,
volume 2, seo 30.
a) convm que as funes de seleo bsicas no sejam interrompidas na presena de erros nas informaes
de servio. Convm selecionar o servio desejado utilizando as tabelas PSI e a NIT. No convm que um erro
nas informaes de servio interrompa a seleo de canal utilizando somente o PSI. Essa possibilidade de
seleo implica que os usurios possam selecionar pelo menos os servios, incluindo a troca de TS e que os
componentes-padro possam estar presentes no servio. O SI no sempre transmitido na mesma camada
que o servio e, portanto, partes do SI podem no ser recebidas mesmo que o servio seja. Alm disso, a
movimentao de um terminal porttil ou mvel pode causar perdas na informao de SI;
b) convm que a informao transmitida no seja utilizada para um propsito diferente da inteno da
transmisso. Cada informao presente no SI tem um propsito. Contudo, uma vez que a apresentao das
informaes de SI livre, a forma de manipul-la para sua apresentao aos usurios depende do fabricante
do receptor;
c) no convm que um erro seja observado quando algum campo de PSI atualmente reservado para extenses
futuras for utilizado. Essa regra visa garantir a extenso gradual das especificaes do PSI/SI. Para obedecer
a essa regra convm que o receptor ignore campos de ISO_639_language_code, reserved ou reserved for
future use que no conseguir processar. desejvel que o receptor tambm julgue como invlidos campos
em que dados outros que no os valores dentro dos ranges especificados forem informados. Nesses campos
convm que os valores sejam informados segundo as regras de transmisso atuais e possvel que novas
regras sejam estabelecidas no futuro. Ou seja, se esses campos tiverem seu uso estendido, assumido que
receptores anteriores mudana no so capazes de processar essa extenso.
Com relao as sees PSI/SI recebidas, convm que os cabealhos das sees sejam interpretados
corretamente. Por ocasio do recebimento do correto recebimento do cabealho de seo, o processo de anlise
da seo interna pode ser iniciado.
Na presena de erros na recepo do cabealho convm observar as regras da ARIB TR-B14:2006, volume 2,
seo 5.