Sie sind auf Seite 1von 39

Capítulo 01

A tecnologia de comunicação sem fio mudou fundamentalmente a maneira como nos


comunicamos. O horário em que telefones, computadores e conexões com a Internet estavam
fadados a ser conectados e usado apenas em locais predefinidos já passou. Atualmente, esses
serviços de comunicação são acessíveis sem fio em quase todos os lugares da Terra, graças à
implantação de redes de longa distância (por exemplo, baseadas nos padrões GSM1, UMTS2 e
LTE3), redes locais (com base em diferentes versões do padrão WiFi IEEE 802.11 ) e serviços de
satélite. A conectividade sem fio tornou-se uma parte essencial da sociedade - tão vital quanto
a eletricidade - e, como tal, a própria tecnologia estimula novos aplicativos e serviços. Já
testemunhamos a revolução da mídia de streaming, em que música e vídeo são entregues sob
demanda pela Internet. Os primeiros passos em direção a uma sociedade totalmente em rede
com aplicações de realidade aumentada, casas e carros conectados e comunicações máquina a
máquina também foram tomadas. Olhando para 15 anos no futuro, encontraremos novos
serviços sem fio inovadores que não podemos prever hoje.

A quantidade de comunicações de voz e dados sem fio cresceu em um ritmo exponencial por
muitas décadas. Essa tendência é referida como a lei de Cooper porque o pesquisador sem fio
Martin Cooper [91] percebeu na década de 1990 que o número de conexões de voz e dados
dobrou a cada dois anos e meio, desde as primeiras transmissões sem fio de Guglielmo
Marconi em 1895. Isso corresponde a uma taxa de crescimento anual de 32%. Olhando para o
futuro, o Ericsson Mobility Report prevê uma taxa de crescimento anual composta de 42% no
tráfego de dados móveis de 2016 a 2022 [109], o que é ainda mais rápido do que a lei de
Cooper. A demanda por conectividade de dados sem fio continuará definitivamente
aumentando no futuro previsível; por exemplo, uma vez que a fidelidade do vídeo está em
constante crescimento, uma vez que é provável que surjam novos serviços obrigatórios e
porque estamos nos movendo para uma sociedade em rede, onde todos os dispositivos
eletrônicos se conectam à Internet. Uma questão importante é como evoluir as atuais
tecnologias de comunicações sem fio para atender à demanda continuamente crescente e,
assim, evitar uma iminente crise no tráfego de dados. Uma questão igualmente importante é
como satisfazer as expectativas crescentes de qualidade de serviço. Os clientes esperam que os
serviços sem fio funcionem igualmente bem em qualquer lugar e a qualquer momento, assim
como esperam que a rede elétrica seja robusta e esteja constantemente disponível. Para
acompanhar uma taxa de crescimento exponencial do tráfego e, ao mesmo tempo, fornecer
conectividade onipresente, os pesquisadores industriais e acadêmicos precisam transformar
cada pedação para projetar novas tecnologias revolucionárias de rede sem fio. Esta monografia
explica o que é a tecnologia MIMO (Multiple-Input Multiple-Output) e por que ela é uma
solução promissora para lidar com um volume de tráfego de dados 4 sem fio de várias ordens de
magnitude maior do que as tecnologias atuais.

O conceito de celular para redes de comunicação sem fio é definido na Seção 1.1, que também
discute como evoluir a tecnologia de rede atual para acomodar mais tráfego. A seção 1.2
define a noção de eficiência espectral (SE) e fornece resultados teóricos de informações básicas
que servirão de base para uma análise posterior. Diferentes maneiras de melhorar o SE são
comparadas na Seção 1.3, o que motiva o design do MIMO Massivo. Os pontos-chave estão
resumidos na Seção 1.4.
1.1 Redes Celulares

A comunicação sem fio é baseada em rádio, o que significa que as ondas eletromagnéticas
(EM) são projetadas para transportar informações de um transmissor para um ou vários
receptores. Como as ondas EM se propagam em todas as direções possíveis a partir do
transmissor, a energia do sinal se espalha e menos energia atinge o receptor desejado à
medida que a distância aumenta. Para fornecer serviços sem fio com energia de sinal recebido
suficientemente alta em áreas de ampla cobertura, os pesquisadores da Bell Labs postularam
em 1947 que uma topologia de rede celular é necessária [277]. De acordo com essa idéia, a
área de cobertura é dividida em células que operam individualmente usando uma estação base
de localização fixa; isto é, um equipamento de rede que facilita a comunicação sem fio entre
um dispositivo e a rede. O conceito celular foi desenvolvido e analisado nas décadas
subsequentes [291, 116, 204, 364] e posteriormente implantado na prática. Sem dúvida, o
conceito de celular foi um grande avanço e tem sido o principal impulsionador para fornecer
serviços sem fio nos últimos quarenta anos (desde que a “primeira geração” de sistemas de
telefonia móvel surgiu na década de 80). Nesta monografia, uma rede celular é definida da
seguinte forma.

Definição 1.1 (rede celular). Uma rede celular consiste de um conjunto de estações base (BSs) e
um conjunto de equipamentos de usuário (UEs) (5). Cada UE está conectado a um dos BSs, que
fornece serviço a ele. A ligação descendente (DL- downlink) refere-se a sinais enviados das BSs
para os seus respectivos UEs, enquanto a ligação ascendente (UL- uplink) refere-se a
transmissões dos UEs para os respectivos BSs (6). Embora essa definição especifique a
configuração que estudaremos, ela não cobre todos os aspectos das redes celulares; por
exemplo, para permitir uma transferência eficiente entre células, um UE pode
momentaneamente ser conectado a múltiplos BSs.
(5) Os termos BS e UE provêm dos padrões GSM e LTE, respectivamente, mas são usados nesta monografia
sem qualquer referência a padrões específicos.

(6) Em uma rede celular totalmente cooperativa, chamada de rede MIMO [126] ou sistema sem célula
[240], todas as BSs são conectadas a um site de processamento central e são usadas para servir
conjuntamente a todos os UEs na rede. Neste caso, o DL (UL) refere-se a sinais transmitidos de (para)
todos os BSs para (de) cada UE. Essa rede celular não é o foco desta monografia, mas os sistemas livres de
células são brevemente descritos na Seção 7.4.3 na p. 509

Figura 1.1: Uma rede celular básica, onde cada BS cobre uma área geográfica distinta e fornece serviço a todos os
UEs dentro dela. A área é chamada de “célula” e é ilustrada com uma cor distinta. A célula pode consistir em todas
as localizações geográficas onde esta BS fornece o sinal DL mais forte.
Uma ilustração de uma rede celular é fornecida na Figura (1.1). Essa monografia enfoca os links
de comunicação sem fio entre BSs e UEs, enquanto a infraestrutura de rede restante (por
exemplo, fronthaul, backhaul e core core) é assumida como funcionando perfeitamente.
Existem vários ramos de tecnologias sem fio atualmente em uso, como a família IEEE 802.11
para redes locais sem fio WiFi (WLANs), a família 3GPP (3rd Generation Partnership Project)
com GSM / UMTS / LTE para comunicações móveis [128], e a família 3GPP2 concorrente com
IS-95 / CDMA2000 / EV-DO. Alguns padrões dentro dessas famílias são evoluções uns dos
outros, otimizados para o mesmo caso de uso, enquanto outros são projetados para diferentes
casos de uso. Juntos, eles formam uma rede heterogênea composta de duas camadas
principais:

1. Camada de cobertura: Consiste em BSs celulares externos que fornecem cobertura de área
ampla, suporte de mobilidade e são compartilhados entre muitos UEs;

2. Camada de Hotspot: Consiste em (principalmente) BSs internos que oferecem alto


rendimento em pequenas áreas locais para alguns UEs.

O termo “heterogêneo” implica que esses dois níveis coexistem na mesma área. Em particular,
os BSs de hotspot são implantados para criar pequenas células (SCs) dentro da área de
cobertura das BSs celulares, conforme ilustrado na Figura 1.2. Os dois níveis podem utilizar o
mesmo espectro de freqüência, mas, na prática, é comum usar espectro diferente para evitar a
coordenação entre níveis; por exemplo, a camada de cobertura pode usar LTE e operar na faixa
de 2,1 GHz, enquanto a camada de ponto de acesso pode usar WiFi na faixa de 5 GHz.

Figura 1.2: As redes sem fio atuais são heterogêneas, já que uma camada de SCs é implantada para descarregar o
tráfego da camada de cobertura. BSs na camada de cobertura e na camada de hotspot são representados de forma
diferente, conforme mostrado na figura. Para melhorar o rendimento da área do nível de cobertura, é
particularmente importante aumentar o SE, porque a densificação e o uso de largura de banda adicional em
freqüências mais altas degradariam o suporte e a cobertura da mobilidade.
As redes celulares foram originalmente projetadas para comunicações de voz sem fio, mas são
as transmissões de dados sem fio que dominam hoje em dia [109]. O vídeo sob demanda
representa a maior parte do tráfego em redes sem fio e também é o principal impulsionador
do aumento previsto na demanda de tráfego [86]. A taxa de transferência de área é, portanto,
uma métrica de desempenho altamente relevante de redes celulares atuais e futuras. É
medido em bit / s / km 2 e pode ser modelado usando a seguinte fórmula de alto nível: Taxa de

transferência de área [bit / s / km2] =

onde B é a largura de banda, D é a densidade celular média e SE é o SE por célula. O SE é a


quantidade de informação que pode ser transferida por segundo em um Hz de largura de
banda, e posteriormente é definida em detalhes na Seção 1.2.

Esses são os três principais componentes que determinam a taxa de transferência da área, e
que precisam ser aumentados para alcançar uma maior taxa de transferência de área nas
futuras redes celulares. Esse princípio se aplica ao nível de cobertura, bem como ao nível do
ponto de acesso. Com base em (1.1), pode-se pensar na taxa de transferência da área como
sendo o volume de uma caixa retangular com os lados B, D e SE; veja a Figura 1.3. Há uma
dependência inerente entre esses três componentes no sentido de que a escolha da faixa de
freqüência e da densidade celular afeta as condições de propagação; por exemplo, a
probabilidade de ter um canal de linha de visão (LoS) entre o transmissor e o receptor (e entre
os interferentes fora da célula e o receptor), as perdas médias de propagação, etc. No entanto,
pode-se tratar esses três componentes independentes como uma aproximação de primeira
ordem para obter informações básicas. Consequentemente, existem três maneiras principais
de melhorar a taxa de transferência de área das redes celulares:

1. Aloque mais largura de banda;

2. Densificar a rede, implantando mais BSs;

3. Melhore o SE por célula.

O principal objetivo desta seção é demonstrar como podemos alcançar grandes melhorias no
SE. Essas percepções são então utilizadas na Seção 2, p. 216 para definir a tecnologia Massive
MIMO.
Figura 1.3: A taxa de transferência da área pode ser calculada de acordo com (1.1) como o volume de uma caixa
retangular onde a largura de banda, densidade média da célula e SE são o comprimento de cada lado.

1.1.1 Redes celulares em evolução para maior taxa de transferência de área

Suponha, por questão de argumentação, que queremos projetar uma nova rede de celular que
melhore o rendimento da área por um fator de 1000 em relação às redes existentes; isto é,
para resolver “o desafio de dados de 1000 ×” apresentado pela Qualcomm [271]. Observe que
essa rede pode lidar com o aumento de três ordens de magnitude no tráfego de dados sem fio
que ocorrerá nos próximos 15 a 20 anos, se a taxa de crescimento anual do tráfego continuar
na faixa de 41% a 59%. Como podemos lidar com um crescimento de tráfego tão grande de
acordo com a fórmula em (1.1)?

Uma solução potencial seria aumentar a largura de banda B em 1000 ×. As redes celulares
atuais utilizam coletivamente mais de 1 GHz de largura de banda na faixa de freqüência abaixo
de 6 GHz. Por exemplo, as operadoras de telecomunicações na Suécia têm licenças para mais
de 1GHz de espectro [65], enquanto o número correspondente nos EUA é de cerca de 650MHz
[30]. Um espectro adicional de 500MHz está disponível para WiFi [65]. Isso significa que um
aumento de 1000 × corresponde ao uso de mais de 1 THz de largura de banda no futuro. Isso é
fisicamente impraticável, já que o espectro de freqüência é um recurso global que é
compartilhado entre muitos serviços diferentes e também porque envolve o uso de bandas de
frequência muito mais altas do que no passado, o que limita fisicamente a confiabilidade do
intervalo e do serviço. Há, no entanto, larguras de banda substanciais nas bandas de
comprimento de onda milimétrico (mmWave) (por exemplo, na faixa de 30 a 300 GHz) que
podem ser usadas para aplicações de curto alcance. Essas bandas de mmWave são atraentes
na camada de hotspot, mas menos na camada de cobertura, pois os sinais nessas freqüências
são facilmente bloqueados por objetos e corpos humanos e, portanto, não podem fornecer
uma cobertura robusta.

Outra solução potencial seria adensar a rede celular implantando 1.000 × mais BSs por km 2. As
distâncias inter-BS no nível de cobertura atualmente são de algumas centenas de metros em
áreas urbanas e os BSs são implantados em locais elevados para evitar serem sombreados por
objetos e edifícios grandes. Isso limita o número de locais onde BSs podem ser implantados na
camada de cobertura. É difícil densificar sem mover BSs para mais perto dos UEs, o que leva a
maiores riscos de estar em sombras profundas, reduzindo assim a cobertura. A implantação de
pontos de acesso adicionais é uma solução mais viável. Embora o Wi-Fi esteja disponível em
quase toda parte nas áreas urbanas, a distância média inter-BS no nível do hotspot pode
certamente diminuir para dezenas de metros no futuro. Reutilizar o espectro da camada de
cobertura ou usar as bandas mmWave nesses SCs também pode trazer melhorias substanciais
na taxa de transferência da área [197]. No entanto, esta solução está associada a altos custos
de implantação, problemas de interferência entre células [19] e não é adequada para UEs
móveis, que teriam que trocar de BS com muita frequência. Observe que mesmo sob uma
densificação substancial do nível do ponto de acesso (hotspot), o nível de cobertura ainda é
necessário para suportar a mobilidade e evitar furos de cobertura.

A maior densidade de células e maior largura de banda têm historicamente dominado a


evolução do nível de cobertura, o que explica por que estamos nos aproximando de um ponto
de saturação em que melhorias adicionais são cada vez mais complicadas e caras. No entanto,
pode ser possível melhorar drasticamente o SE das futuras redes celulares. Isso é
particularmente importante para os BSs no nível de cobertura que, conforme explicado acima,
não podem usar as bandas do mmWave, nem dependem da densificação da rede. Aumentar o
SE corresponde ao uso das BSs e da largura de banda que já estão instaladas de forma mais
eficiente em virtude das novas técnicas de modulação e multiplexação. O objetivo principal é
selecionar uma caixa retangular, conforme ilustrado na Figura 1.4, em que cada lado
representa a melhoria multiplicativa em B, D ou SE. Como mostrado na figura, existem
diferentes maneiras de escolher esses fatores para atingir uma taxa de transferência de área de
1.000 × mais alta. Uma abordagem pragmática é investigar em primeiro lugar o quanto o SE
pode ser melhorado em relação ao objetivo de 1000 × e, em seguida, aumentar em conjunto B
e D para cuidar da parte restante do ambicioso objetivo final. Seção 4 na p. 275 mostra porque
o Massive MIMO é considerado a tecnologia mais promissora para melhorar o SE em redes
celulares futuras.

Figura 1.4: Exemplos de maneiras diferentes de alcançar uma melhoria de 1.000 × no rendimento da área. Cada lado da caixa
retangular representa um fator de melhoria em B, D ou SE em (1.1), e sua multiplicação (ou seja, o volume) é igual a 1000 ×.

Observação 1.1 (MIMO massivo versus SCs em bandas mmWave). Esta monografia se
concentra no nível de cobertura, que continuará sendo o nível mais desafiador no futuro, uma
vez que deve fornecer cobertura onipresente, oferecer suporte à mobilidade e,
simultaneamente, fornecer uma qualidade de serviço uniforme dentro de cada célula. Tudo
isso deve ser alcançado sem qualquer densificação substancial ou uso do espectro da
mmWave, porque isso inevitavelmente resultaria em uma cobertura desigual. É por isso que
grandes melhorias no SE são necessárias. Vamos demonstrar que o Massive MIMO pode
entregar isso. Em contraste, o principal objetivo do nível do ponto de acesso é reduzir a
pressão no nível de cobertura ao descarregar uma grande parte do tráfego dos UEs de baixa
mobilidade. Uma vez que apenas as comunicações de melhor esforço de curto alcance devem
ser suportadas, essa camada pode ser aprimorada por densificação direta de células e pelo uso
de larguras de banda grandes disponíveis nas bandas mmWave. O uso de MIMO Massive em
bandas mmWave será discutido na Seção 7.5 na p. 522, enquanto a combinação de MIMO
Massivo e SCs é considerada na Seção 7.6 na p. 527.

1.2 Definição de eficiência espectral

Agora, fornecemos uma definição de SE para um canal de comunicação com uma largura de
banda de B Hz. O teorema de amostragem de Nyquist-Shannon implica que o sinal de
comunicação limitado pela banda que é enviado através deste canal é completamente
determinado por amostras de 2B de valor igual espaçadas por segundo [298]. Ao considerar a
representação de banda-base complexa do sinal, as amostras com valor de complexo B por
segundo são a quantidade mais natural [314]. Essas amostras B são os graus de liberdade
disponíveis para projetar o sinal de comunicação. O SE é a quantidade de informação que pode
ser transferida de forma confiável por amostra de valor complexo.

Definição 1.2 (eficiência espectral). O SE de um esquema de codificação / decodificação é o


número médio de bits de informação, por amostra de valor complexo, que pode transmitir de
forma confiável através do canal em consideração.

A partir dessa definição, fica claro que o SE é um número determinístico que pode ser medido
em bit por amostra de valor complexo. Como há amostras B por segundo, uma unidade
equivalente do SE é bit por segundo por Hertz, geralmente escrita em formato abreviado como
bit / s / Hz. Para canais de desvanecimento, que mudam com o tempo, o SE pode ser visto
como o número médio de bit / s / Hz sobre as realizações de desvanecimento, como será
definido abaixo. Nesta monografia, muitas vezes consideramos o SE de um canal entre um UE e
um BS, que, por simplicidade, nos referimos como “SE do UE”. Uma métrica relacionada é a
taxa de informação [bit / s], que é definida como o produto do SE e da largura de banda B.
Além disso, geralmente consideramos a soma SE dos canais de todos os UEs em uma célula
para a respectiva BS. que é medido em bit / s / Hz / cell.

O canal entre um transmissor e um receptor em determinados locais pode suportar muitos SEs
diferentes (dependendo do esquema de codificação / decodificação escolhido), mas o maior SE
alcançável é de fundamental importância ao projetar sistemas de comunicação. O SE máximo é
determinado pela capacidade do canal, que foi definida por Claude Shannon em seu artigo
seminal [297] de 1948. O teorema a seguir fornece a capacidade para o canal ilustrado na
Figura 1.5.

Figure 1.5: A general discrete memoryless channel with input x and output y.

Teorema 1.1 (capacidade do canal). Considere um canal discreto sem memória com entrada x e
saída y, que são duas variáveis aleatórias. Qualquer SE menor ou igual à capacidade do canal é
alcançável com probabilidade de erro arbitrariamente baixa, enquanto valores maiores não
podem ser alcançados. O supremo é tomado em relação a todas as distribuições de entrada
possíveis f (x), enquanto H (y) é a entropia diferencial da saída e H (y | x) é a entropia
diferencial condicional da saída dada a entrada.

A terminologia de canais discretos sem memória e entropia é definido no Apêndice B.5, na p.


572. Referimo-nos a [297] e manuais sobre teoria da informação, como [94], para a prova do
Teorema 1.1. O conjunto de distribuições de entradas possíveis depende da aplicação, mas é
comum considerar todas as distribuições que satisfazem uma restrição na potência de entrada.
Em comunicações sem fio, estamos particularmente interessados em canais onde o sinal
recebido é a superposição de uma versão em escala do sinal desejado e ruído Gaussiano
aditivo. Esses canais são comumente chamados de canais de ruído branco gaussiano aditivo
(AWGN). A capacidade do canal no Teorema 1.1 pode ser computada de forma fechada no
seguinte caso canônico de [298], que também é ilustrado na Figura 1.6.

Figura 1.6: Um canal discreto sem memória com entrada x e saída y = hx + n, onde h é a resposta do canal e n é
ruído gaussiano independente.

Corolário 1.2. Considere um canal discreto sem memória com entrada e saída dada
por: y=hx +n (1.3)

onde é ruído independente. A distribuição de entrada é limitada em energia como


e a resposta do canal é conhecida na saída. Se h é determinístico, então a
capacidade do canal é

e é alcançado pela distribuição de entrada Se h é uma realização de uma


variável aleatória H que é independente do sinal e do ruído, então a capacidade do canal
ergodico7 é

onde a expectativa é em relação a h. Isso é chamado de canal de desvanecimento e a


capacidade é obtida pela distribuição de entrada

Prova. A prova está disponível no Apêndice C.1.1 na p. 579

O canal considerado no Corolário 1.2 é chamado de canal de entrada única de entrada única
(SISO) porque um sinal de entrada é enviado e resulta em um sinal de saída. Uma restrição de
poder média é assumida no corolário e ao longo desta monografia, mas outras restrições
também existem na prática; veja a observação 7.1 na pág. 460 para uma discussão mais
aprofundada. O significado prático da capacidade do canal pode ser descrito considerando-se a
transmissão de uma sequência de informação com N entradas escalares, geradas por um
processo estocástico ergódico, sobre o canal discreto sem memória no Corolário 1.2. Se a
entrada escalar tiver um SE menor ou igual à capacidade, a sequência de informação pode ser
codificada de tal forma que o receptor possa decodificá-la com uma probabilidade de erro
arbitrariamente baixa como N → ∞ . Em outras palavras, um retardo de decodificação
infinito é necessário para atingir a capacidade. O trabalho seminal em [267] quantifica quão
próxima a capacidade pode ser abordada em um comprimento finito da seqüência de
informações. O SE é geralmente uma métrica de bom desempenho sempre que blocos de
dados de milhares de bits são transmitidos [50].
7A capacidade de um canal de desvanecimento requer que a transmissão abranja assintoticamente
muitas realizações da variável aleatória que descreve o canal. Isto é referido como a capacidade ergódica,
uma vez que um processo de desvanecimento aleatório ergódico estacionário é necessário se as
propriedades estatísticas forem dedutíveis de uma única sequência de realizações de canal. Cada
realização de canal é usada para um número predeterminado e finito de sinais de entrada, então uma
nova realização é retirada do processo aleatório.

As expressões de capacidade em (1.4) e (1.5) têm uma forma que é típica para comunicações:
o logaritmo de base dois de um mais a expressão parecida com relação sinal-ruído (SNR)

Potência do sinal recebido

Potência de ruído

Este é o SNR mensurável real para uma resposta de canal determinístico h, enquanto é o SNR
instantâneo para uma dada realização de canal quando h é aleatório. Como o SNR flutua no
último caso, é mais conveniente considerar o SNR médio ao descrever a qualidade de um canal
de comunicação. Nós definimos o SNR médio como

onde a expectativa é calculada em relação às realizações de canal. Chamamos E {| h | 2} o


ganho médio do canal, já que é a escala média da potência do sinal incorrida pelo canal.

As transmissões em redes celulares são em geral corrompidas pela interferência de


transmissões simultâneas na mesma e em outras células. Adicionando essa interferência ao
canal na Figura 1.6, obtemos o canal de interferência discreto sem memória na Figura 1.7. A
interferência não é necessariamente independente da entrada x e do canal h. A capacidade
exata do canal dos canais de interferência é geralmente desconhecida, mas limites inferiores
convenientes podem ser obtidos. Inspirado por [36, 214], o seguinte corolário fornece os
limites de capacidade mais baixos que serão usados repetidamente nesta monografia.

Figura 1.7: Um canal de interferência discreto sem memória com entrada xe saída y = hx + v + n, onde h é a resposta
do canal, n é ruído gaussiano independente e é a interferência, que não é correlacionada com a entrada e o canal.

Corolário 1.3 Considere um canal de interferência discreto sem memória com entrada e
saída dada por
onde é ruído independente, a resposta do canal é conhecida na
2
saída e é interferência aleatória. A entrada é limitada por energia como E {|x| ≤ p } .

Se h é determinístico e a interferência v tem média zero, uma variância conhecida ,


e não é correlacionada com a entrada (ou seja, ), então a capacidade do canal C
é limitada como:

onde o limite é alcançado usando a distribuição de entrada .

Suponha que seja uma realização da variável aleatória e que seja uma variável
aleatória com realização u que afeta a variância de interferência. As realizações dessas
variáveis aleatórias são conhecidas na saída. Se o ruído n é condicionalmente
independente de h e v , a interferência tem uma média condicional de zero (isto é,
) e variância condicional denotada por ,e a
interferência é condicionalmente não correlacionada com a entrada (ou seja,
), então a capacidade do canal ergódico (C) é limitada de baixo como onde
a expectativa é tomadas em relação aheu, e o limite é obtido usando a distribuição de entrada
.

8
Quando transmitir uma seqüência de informações sobre este canal de desvanecimento, uma sequência
de realizações de H e U é criada, formando processos aleatórios ergódicos estacionários. Cada conjunto de
realizações (h, u) é usado para um número predeterminado e finito de sinais de entrada, então um novo
conjunto de realizações é obtido dos processos aleatórios.

Note que no Corolário 1.3, usamos a notação abreviada para a expectativa


condicional .Por conveniência notacional, a partir de agora
omitiremos as variáveis aleatórias em expressões similares e apenas escreveremos as
realizações.

Os limites inferiores da capacidade do canal no Corolário 1.3 são obtidos tratando a


interferência como uma fonte adicional de ruído no decodificador, o que pode não ser o ideal
do ponto de vista da teoria da informação. Por exemplo, se um sinal de interferência for muito
forte, então é possível decodificá-lo e subtrair a interferência do sinal recebido, antes de
decodificar o sinal desejado. Isso é conceitualmente simples, mas mais difícil de realizar em
uma rede celular prática, onde os sinais interferentes mudam com o tempo e as células não
cooperam totalmente. Na verdade, não deve haver nenhum sinal fortemente interferente em
uma rede celular bem projetada. No regime de baixa interferência, é ideal (isto é, capacidade
de atingir) para tratar a interferência como ruído adicional, como mostrado em [230, 296, 20,
21, 295].

Utilizamos expressões SE do tipo no Corolário 1.3 ao longo desta monografia e enfatizamos que
estas podem não ser as SEs mais altas possíveis, mas SEs que podem ser alcançadas pelo
processamento de sinais de baixa complexidade no receptor, onde a interferência é tratada
como ruído. As expressões SE em (1.9) e (1.10) têm uma forma típica para comunicações sem
fio: o logaritmo de base um de dois mais a expressão que pode ser interpretada como a relação
sinal-interferência-mais-ruído (SINR). Formalmente, isso é apenas um SINR quando h e
pv são determinísticos; a expressão é aleatória. Para simplificar, nos referiremos a qualquer
termo a que aparece como em uma expressão SE como um SINR
instantâneo (com pequeno abuso de terminologia).

As expressões SE apresentadas nesta seção são os blocos de construção fundamentais para a


teoria desenvolvida em seções posteriores. Os resultados de capacidade consideram canais
discretos sem memória, que são diferentes dos canais sem fio contínuos práticos. No entanto,
a largura de banda B pode ser dividida em subcanais estreitos (por exemplo, usando OFDM
(orthogonal frequency division multiplexing)) que são essencialmente sem memória se o
tempo do símbolo for muito maior do que a propagação de atraso do ambiente de propagação
[314].

1.3 Maneiras de Melhorar a Eficiência Espectral

Existem diferentes maneiras de melhorar o SE por célula nas redes celulares. Nesta seção,
compararemos diferentes abordagens para demonstrar quais são as mais promissoras. Por
simplicidade, consideramos uma rede de duas células onde o ganho médio de canal entre uma
BS e cada UE em uma célula é idêntico, como ilustrado na Figura 1.8. Este é um modelo tratável
para estudar as propriedades básicas das comunicações celulares, devido ao pequeno número
de parâmetros do sistema. É uma instância do modelo de Wyner, proposta inicialmente por
Aaron Wyner em [353] e estudada para canais de desvanecimento em [304]. Tem sido
amplamente utilizado para estudar as propriedades fundamentais da informação teórica das
redes celulares; veja a monografia [303] e referências nela. Modelos de rede mais realistas,
mas menos tratáveis, serão considerados em seções posteriores.

No cenário UL mostrado na Figura 1.8, os UEs na célula 0 transmitem para sua BS de serviço,
enquanto os sinais UL dos UEs na célula 1 vazam para a célula 0 como interferência. O ganho
0
médio de canal de um UE na célula 0 para a sua porção BS é indicado por β 0 , enquanto os
0
sinais de interferência dos UE na célula 1 têm um ganho médio de canal de β 1 . Do mesmo
modo, o ganho médio de canal de um UE na célula 1 para a sua porção BS é indicado por
β 11 , enquanto os sinais de interferência dos UE na célula 0 têm um ganho médio de canal de
1
β 0 ,. Observe que o sobrescrito indica a célula da BS receptora e o subscrito indica a célula
na qual reside o UE transmissor. Os ganhos médios de canal são grandezas adimensionais
positivas que são frequentemente muito pequenas, pois a energia do sinal decai rapidamente
com a distância de propagação; valores na faixa de −70 dB a −120 dB são comuns dentro da
célula servidora, enquanto valores menores ainda aparecem para sinais de interferência. Como
mostrado mais adiante, não são os valores absolutos que são de importância principal ao
computar o SE, mas a força relativa da interferência em comparação com os sinais desejados.
0 1
Para simplificar, lembre-se de que os ganhos do canal intracelular são iguais (isto é, β 0=β 1 )
1 0
e que os ganhos do canal inter-células são igualmente iguais (isto é, β 0=β 1 )); isso é
comumente assumido no modelo de Wyner. Podemos, então, definir a razão β́ entre os
ganhos do canal intercelular e intracelular como

Figura 1.8: Ilustração da noção de sinais UL desejados e interferentes em uma rede de duas células. No modelo
0
Wyner, cada UE na célula 0 tem o mesmo valor do ganho médio de canal β0 da sua porção BS e do ganho
1 0
médio de canal β 0 para a outra célula BS, enquanto que cada UE na célula 1 tem o mesmo valor de β1 e
1
β 1 .

Essa relação será usada na análise de UL e DL. Tipicamente, temos 0 ≤ β́ ≤1 , em que


β́ ≈ 0 corresponde a uma interferência inter-células insignificantemente fraca e β́ ≈ 1
significa que a interferência entre células é tão forte quanto os sinais desejados (o que pode
acontecer para UEs na extremidade da célula). Usaremos esse modelo no restante da Seção 1
para discutir diferentes maneiras de melhorar o SE por célula.

1.3.1 Aumentar o poder de transmissão

O SE depende naturalmente da força do sinal desejado recebido, representado pela média do


SNR, definido em (1.7). Usando o modelo de Wyner descrito acima, o SNR médio de um UE na
célula 0 é

onde p denota a potência de transmissão do UE e σ 2 é a potência de ruído.


Essas quantidades de energia são medidas em Joule por intervalo de tempo. Qualquer tipo de
intervalo de tempo pode ser utilizado desde que seja o mesmo para o sinal e o ruído, mas as
escolhas comuns são "um segundo" ou "uma amostra". O parâmetro SNR 0 desempenha um
papel fundamental em muitas das expressões computadas nesta seção.

Suponha que haja um UE ativo por célula e que cada BS e UE esteja equipado com uma única
antena. Observe que com "antena" nos referimos a um componente com um tamanho menor
que o comprimento de onda (por exemplo, uma antena de patch) e não o tipo de antenas
grandes de alto ganho que são usadas nas BSs em redes celulares convencionais. Antenas e
matrizes de antenas são discutidas na Seção 7.4, p. 500

Concentrando-se em um canal sem fio flat-fading9, o sinal de banda base complexo samplado
em símbolo recebido na BS na célula 0 é
9 Nos canais de atenuação plana, a largura de banda de coerência do canal é maior do que a largura de
banda do sinal [314]. Portanto, todos os componentes de freqüência do sinal terão a mesma magnitude
de desvanecimento, resultando em uma resposta de canal escalar.

onde o ruído do receptor aditivo é modelado como .As linhas de choque


em (1.14) representam os sinais de informação 10 transmitidos pelos UEs
desejados e interferentes, respectivamente. Além disso, suas respostas de canal são denotadas
por ,respectivamente. As propriedades dessas respostas de canal
dependem do ambiente de propagação. Nesta seção, consideramos um modelo de propagação
de LoS e um modelo de propagação de NLoS (non-line-of-sight). Na propagação LoS de antena
0 0
única, h0 e h1 são escalares determinísticos correspondentes à raiz quadrada dos
ganhos (médios) do canal:

Em geral, a resposta do canal também terá uma rotação de fase, mas é negligenciada aqui, pois
0
não afeta o SE. O ganho de canal β i pode ser interpretado como o desvanecimento
macroscópico em grande escala na propagação de LoS, causado por perda de percurso
dependente da distância. O impacto do hardware do transceptor, incluindo os ganhos da
antena, também é absorvido nesse parâmetro. O parâmetro é constante se o transmissor e
receptor estiverem fixos, enquanto muda se o transmissor e / ou receptor se moverem.
Movimentos microscópicos (na ordem do comprimento de onda) podem ser modelados como
0
rotações de fase em hi , enquanto grandes movimentos (na ordem de metros) levam a
0
mudanças substanciais em β i . Consideramos um valor fixo de h0i para aplicar a
expressão SE no Corolário 1.3 para canais determinísticos.

Em ambientes de propagação de NLoS, as respostas de canal são variáveis aleatórias que


mudam ao longo do tempo e da frequência. Se houver dispersão suficiente entre os UEs e o BS,
0 0
então h0 e h1 são bem modelados como

conforme validado pelas medições do canal relatadas em [337, 177, 83, 365]. O sinal
transmitido alcança o receptor através de muitos caminhos diferentes e os sinais recebidos
sobrepostos podem reforçar ou cancelar um ao outro. Quando o número de caminhos é
grande, o teorema do limite central motiva o uso de uma distribuição gaussiana. Este
fenómeno é conhecido como desvanecimento em pequena escala e é um efeito microscópico
causado por pequenas variações no ambiente de propagação (por exemplo, movimento do
0
transmissor, receptor ou outros objetos). Em contraste, a variância β i é interpretada como
o desvanecimento macroscópico em grande escala, que inclui perda de trajetória dependente
da distância, sombreamento, ganhos de antena e perdas de penetração na propagação de
NLoS. O modelo de canal em (1.16) é chamado de desvanecimento de Rayleigh, porque a
0
magnitude ¿ hi ∨¿ é uma variável aleatória distribuída Rayleigh.

Observe que o ganho médio do canal é ,para i = 0, 1, em ambos os casos de


propagação, a fim de torná-los facilmente comparáveis. Canais práticos podem conter uma
mistura de um componente LoS determinístico e um componente NLoS aleatório, mas,
estudando as diferenças entre os dois casos extremos, podemos prever o que acontecerá
também nos casos mistos. O lema a seguir fornece expressões SE em formato fechado para os
casos LoS e NLoS.

Lema 1.4. Suponha que o BS na célula 0 conhece as respostas do canal. Um UL (11) alcançável
para o UE desejado no caso LoS é

com β́ e SNR0 dados por (1.12) e (1.13), respectivamente. No NLoS caso (com β́ ≠ 1 ),
um UL SE alcançável é

onde denota a integral exponencial e log e (·) denota o logaritmo


natural.

Prova. A prova está disponível no Apêndice C.1.3 na p. 582

Este lema mostra que o SE é totalmente caracterizado pelo SNR do sinal desejado, SNR 0, e a
força relativa da interferência entre células, β́ . Observe que a expressão NLoS de formato
fechado em (1.18) aplica-se apenas a β́ ≠ 1 . Lembre-se de que 0 ≤ β́ ≤1 é o intervalo
típico de β́ . O caso patológico β́=1 representa um cenário de borda celular onde os
sinais desejados e interferentes são igualmente fortes. Uma expressão alternativa pode ser
derivada para β́=1 usando a mesma metodologia da prova do Lema 1.4, mas ela não
fornece mais informações e, portanto, é omitida.

O SE é naturalmente uma função crescente do SNR, que é mais facilmente visto a partir da
expressão LoS em (1.17), onde o SE é o logaritmo da seguinte expressão SINR:
11 Chave que um SE é realizável se existir uma sequência de códigos tal que a probabilidade máxima
de erro na transmissão para qualquer mensagem de comprimento N converta para zero como
N → ∞ [94]. Qualquer SE menor ou igual à capacidade é assim possível

Figura 1.9: UL SE média como uma função do SNR para diferentes casos de força de interferência entre células,
β́ ∈ {−10,−30 }dB e diferentes modelos de canal.

Pode-se melhorar o SE aumentando a potência de transmissão p . No entanto, o SE não


aumentará indefinidamente com p . No caso LoS, temos

onde o limite é completamente determinado pela força da interferência. Isto deve-se ao facto
de o UE desejado e o UE interferente aumentarem as suas capacidades de transmissão, o que é
o caso do interesse nas redes celulares, uma vez que uma boa qualidade de serviço deve ser
garantida em todas as células. O limite correspondente no caso NLoS é

o que pode ser provado expandindo as integrais exponenciais em (1.18) usando a identidade
em [3, Eq. (5.1.11)] e depois tomando o limite p→ ∞

Para exemplificar esses comportamentos, a Figura 1.9 mostra o SE como uma função do SNR,
onde um aumento de SNR é interpretado como aumentando a potência de transmissão p.
Consideramos duas forças diferentes da interferência intercelular: β́=−10 dB e
β́=−30 dB . O SE converge rapidamente para o log de LoS log 2 (1+1/ β́) ≈ 3.46 bit / s /
Hz e o limite NLoS log 2 (1/ β́ )/(1− β́ )≈ 3.69 bit / s/ Hz no primeiro caso , uma vez que a
interferência é apenas 10 dB mais fraca que o sinal desejado. No caso de β́=−30 dB , a
convergência para o limite de LoS de 9,97 bit / s / Hz e limite NLoS de 9,98 bit / s / Hz é menos
visível na faixa de SNR considerada, uma vez que a interferência é mais fraca e o logaritmo
torna o SE cresce lentamente. No entanto, notamos que passar de SNR 0 = 10 dB para SNR0 = 30
dB apenas duplica o SE, embora 100 vezes mais energia de transmissão seja necessária. O caso
NLoS fornece um SE ligeiramente menor que o caso LoS para a maioria dos SNRs, devido às
2
flutuações aleatórias da magnitude quadrada |h00| do canal. No entanto, a aleatoriedade se
transforma em uma pequena vantagem em SNR alto, onde o limite é ligeiramente maior em
NLoS porque a interferência pode ser muito mais fraca do que o sinal para algumas realizações
de canal. Este comportamento é visto para β́=−10 dB na Figura 1.9, enquanto ocorre em
SNRs maiores para β́=−30 dB .

Em resumo, o aumento do SNR usando mais potência de transmissão melhora o SE, mas o
efeito positivo rapidamente leva a rede a um regime de interferência limitada, onde nenhum
SE extraordinário pode ser obtido. Isso é basicamente devido à falta de graus de liberdade na
BS, que não podem separar o sinal desejado da interferência de uma única observação(12)
Esse regime de interferência limitada é onde a camada de cobertura opera nas redes atuais,
enquanto a situação para a O nível de hotspot depende de como os BSs são implantados. Por
exemplo, os sinais nas frequências mmWave são bastante atenuados por paredes e outros
objetos. Um SC mmWave normalmente cobre uma área muito limitada, mas, por outro lado, a
célula pode ser limitada por ruído, uma vez que os sinais de interferência dos SCs em outras
salas também são atenuados pelas paredes. O intervalo de SE na Figura 1.9 é comparável ao
que as redes contemporâneas fornecem (por exemplo, 0-5 bit / s / Hz em LTE [144]). Portanto,
uma abordagem simples de escalonamento de poder não pode contribuir muito para alcançar
um maior SE nas redes celulares.
12 O esquema de transmissão considerado neste exemplo não é o ideal. Os UEs podem se revezar na
transmissão, alcançando assim um SE que cresce sem limite, mas com um fator pré-log de 1/2 se
cada UE estiver ativo em 50% do tempo. Mais geralmente, os métodos de alinhamento de
interferência podem ser usados para lidar com a interferência [70].

Observação 1.2 (Aumentando a densidade celular). Outra maneira de aumentar o SNR é


manter a potência de transmissão fixa e aumentar a densidade da célula D. É comumente
assumido na modelagem de canal que o ganho médio do canal é inversamente proporcional à
distância de propagação para algum expoente fixo de "caminho". Sob esse modelo básico de
propagação, a potência do sinal desejado recebido e a interferência entre células aumentam
aproximadamente no mesmo ritmo quando D é aumentado, uma vez que tanto a distância à BS
desejada quanto as BSs interferentes são reduzidas. Isto implica que o limite SE limitado por
interferência é obtido também quando D aumenta. Enquanto D não pode ser muito
aumentado na camada de cobertura, a densificação de células é uma maneira adequada de
melhorar a camada de hotspots [198]; a taxa de transferência da área em (1.1) aumenta
linearmente com D, desde que o modelo básico de propagação seja verdadeiro. Em algum
ponto, este modelo será, no entanto, inválido, já que o expoente de caminho perdido também
reduzirá com a distância e se aproximará do cenário de propagação do espaço livre com um
expoente de dois [19]. A densificação celular não é mais desejada neste cenário extremo de
curto alcance, pois a soma da potência dos sinais interferentes aumenta mais rápido que a
potência do sinal desejado.

1.3.2 Obter um ganho de matriz

Em vez de aumentar a potência de transmissão da UL, a BS pode implantar várias antenas de


recepção para coletar mais energia das ondas EM. Este conceito tem sido pelo menos desde a
década de 1930 [257, 117], com o foco particular em alcançar a diversidade espacial; isto é,
para combater o desvanecimento do canal na propagação de NLoS, implantando várias antenas
de recepção que observam diferentes realizações de desvanecimento. A idéia relacionada de
usar múltiplas antenas de transmissão para aumentar a potência do sinal recebido foi descrita
já em 1919 [10]. Ter múltiplas antenas de recepção também permite ao receptor distinguir
entre sinais com diferentes diretivas espaciais usando filtragem / processamento espacial
[324]. As implementações desses métodos foram referidas como antenas "adaptáveis" ou
"inteligentes" [16, 350]. Em geral, é mais conveniente equipar os BSs com múltiplas antenas do
que os UEs, porque estes são tipicamente produtos comerciais finais, compactos, alimentados
por baterias e que dependem de componentes de baixo custo.

Suponha que o BS na célula 0 esteja equipado com um array de M antenas. As respostas de


canal dos UEs desejados e interferentes podem então ser representadas pelos
, respectivamente. O m-ésimo elemento de cada vetor é a resposta do
canal observada na m-ésima antena BS, para m=1,. .. , M O escalar recebido sinal UL em
(1.14) é então estendido para um vetor recebido , modelado como:

onde é o ruído do receptor sobre o arranjo BS e os sinais de


transmissão s0 e s1 são definidos como em (1.14).

Para analisar o SE desse canal UL de entrada única de múltiplas saídas (SIMO) com
interferência intercelular, precisamos estender os modelos de propagação para o caso de
múltiplas antenas. No caso de LoS, consideramos um arranjo linear uniforme horizontal (ULA)
com espaçamento de antena dH ∈ ( 0, 0.5 ] , que é medido no número de comprimentos de
onda entre antenas adjacentes. Portanto, λ se denota o comprimento de onda na
freqüência portadora, o espaçamento da antena é medidores λdH Os modelos de canal
para outras geometrias de matriz são considerados na Seção 7.3 na página 482. Supomos
também que os UEs estão localizados em locais fixos no campo distante do arranjo BS, o que
leva aos seguintes determinísticos: resposta do canal [254]:

em que φi0 ∈¿ é o ângulo de azimute para o UE, relativo à perspectiva da matriz na BS na


i
célula 0, e β 0 descreve o desvanecimento macroscópico em grande escala. A resposta do
canal em (1.23) também pode ter uma rotação de fase comum de todos os elementos, mas é
negligenciada aqui, uma vez que não afeta o SE. O modelo de propagação de LoS é ilustrado na
Figura 1.10, onde uma onda plana alcança a matriz a partir de um ângulo de azimute genérico
φ . Ao comparar duas antenas adjacentes, uma delas observa um sinal que viajou
dH sin(φ) mais longo que o outro. Isto leva à resposta da matriz em (1.23) com rotações
de fase que são múltiplos de dH sin (φ) , como também ilustrado na Figura 1.10.
Figura 1.10: Propagação de LoS entre um UE de antena única de transmissão e um BS equipado com um ULA com
antenas M. O espaçamento da antena é de comprimentos de onda dH, o ângulo de azimute para o UE é φ , e o
UE está localizado no campo distante da matriz, de modo que uma onda plana a alcance. Observe que a
configuração é ilustrada acima.

No caso da NLoS, supomos por enquanto que a resposta do canal não é correlacionada sobre a
matriz. Isso produz

i
onde β 0 descreve o desvanecimento macroscópico em grande escala, enquanto a
aleatoriedade e a distribuição gaussiana são responsáveis pelo desvanecimento em pequena
escala. Este modelo de canal é chamado desvanecimento de Rayleigh não correlacionado ou
desvanecimento de Rayleigh independente e identicamente distribuído (i.i.d.), uma vez que os
i
elementos em h0 não são correlacionados (e também são independentes) e possuem
magnitudes distribuídas de Rayleigh. O desvanecimento Rayleigh não correlacionado é um
modelo tratável para condições de dispersão ricas, em que o arranjo BS é cercado por muitos
objetos de dispersão, em comparação com o número de antenas. Vamos usá-lo para descrever
as propriedades básicas desta seção, enquanto um modelo mais geral e realista é apresentado
na Seção 2.2, p. 222 e depois usado no restante da monografia. A modelagem de canais é
discutida mais adiante na Seção 7.3, p. 482. O modelo de propagação NLoS com
desvanecimento Rayleigh não correlacionado é ilustrado na Figura 1.11. Observe que o ganho
i
médio do canal β 0 é, por simplicidade, assumido como sendo o mesmo para todas as
antenas BS. Esta é uma aproximação razoável quando a distância entre o BS e o UE é muito
maior que a distância entre as antenas BS. No entanto, na prática, pode haver vários decibéis
de variações de ganho de canal entre as antenas [122]. Este fato é negligenciado nesta seção,
mas tem um forte impacto no SE quando M é grande; veja a Seção 4.4 na p. 335 para mais
detalhes.
Figura 1.11: Propagação de NLoS com desvanecimento de Rayleigh não correlacionado entre um UE de antena única
transmissora e um BS equipado com uma matriz de antenas M. O caminho LoS é bloqueado, mas o sinal encontra
vários outros caminhos através de projetos de dispersão. A BS está rodeada por muitos objetos de dispersão, de
modo que a localização do UE não tem impacto na diretividade espacial do sinal recebido.

Os benefícios de ter múltiplas antenas na BS aparecem quando a BS conhece a resposta do


canal do UE desejado. Este conhecimento permite que o BS combine coerentemente os sinais
recebidos de todas as antenas. A estimativa da resposta do canal é, portanto, um aspecto-
chave nos sistemas multiantenas e será discutida mais adiante na Seção 1.3.5 e,
posteriormente, analisada em detalhes na Seção 3, p. 244. Por enquanto, assumimos que as
respostas do canal são conhecidas na BS e podem ser usadas para selecionar um vetor de
combinação de recepção . Este vetor é multiplicado pelo sinal recebido em (1.22) para
obter

A combinação de recepção é uma projeção linear, que transforma o canal SIMO em um canal
SISO efetivo que pode suportar SEs mais altos do que no caso de antena única, se o vetor de
combinação for selecionado criteriosamente. Existem muitos esquemas de combinação
diferentes, mas um simples e popular é a combinação de taxa máxima (MR), definida como

Este é um vetor que maximiza a razão entre a potência do sinal desejado e a


norma quadrada do vetor de combinação [172, 68] .13 O seguinte lema dá expressões SE em
formato fechado para o caso de combinação de MR.

Lema 1.5. Suponha que o BS na célula 0 saiba as respostas do canal e aplique MR combinando
ao sinal recebido em (1.22). Um UL SE alcançável para o UE desejado no caso LoS é

onde a função g g(φ , ψ ) é definida como

Da mesma forma, um UL SE alcançável para o UE desejado no caso NLoS (com β́ ≠ 1 ) é


onde n! denota a função fatorial e denota a integral exponencial.

Prova. A prova está disponível no Apêndice C.1.4 na p. 583

Este lema mostra que o SE é caracterizado pela SNR do sinal desejado, SNR 0, a força da
interferência intercelular β́ , e o número de antenas BS, M. Observe que, tendo M
recebendo antenas, a matriz coleta M vezes mais energia dos sinais desejados e interferentes,
e também do ruído. No caso de LoS em (1.27), o ganho do sinal desejado é escalonado como
M. O escalonamento linear com o número de antenas é chamado ganho de matriz. Mostra que
MR combina coerentemente toda a energia recebida do sinal desejado, porque o vetor de
combinação é combinado com a resposta do canal do UE desejado. Em contraste, MR combina
o ruído e os componentes do sinal de interferência de maneira não coerente no array, já que v0
1 0 0
é independente de h0 e n0. Como conseqüência, o poder de interferência β́ g( φ0 , φ1 )
em (1.27) pode ser limitado em cima como

0 0
quando sin( φ0 )≠ sin(φ1) , que diminui como 1 / M quando mais antenas são adicionadas.
A razão básica pela qual a combinação MR rejeita o sinal de interferência é que as antenas M
fornecem BS com graus espaciais M de liberdade, que pode ser usado para separar o sinal
0 0
desejado do sinal interferente. Em particular, as direções das respostas do canal LoS h0 e h 1
e gradualmente se tornam ortogonais à medida que M aumenta. Esta propriedade é chamada
de propagação (assintoticamente) favorável [245 ], uma vez que os UEs com canais ortogonais
podem se comunicar com a BS simultaneamente sem causar interferência mútua, discutiremos
ainda mais essa propriedade na Seção 1.3.3 e também na Seção 2.5.2 na página 233.

A equação sin ( φ 00 )=sin(φ 01) , tem duas soluções exclusivas:


0 0
φ0 =φ1 e o reflexo do
0 0
espelho φ0 =π −φ 1 . Portanto, o ULA só pode resolver exclusivamente os ângulos, seja no
intervalo [−π /2, π /2] ou no intervalo [ π /2, 3 π /2] no outro lado da matriz. A
discussão acima não se aplica quando sin ( φ 00 )=sin(φ 01) , porque então g ( φ 00 , φ10 )=M
em vez disso. É natural que tanto o sinal desejado quanto o interferente escalem linearmente
com M neste caso, porque os dois sinais chegam exatamente do mesmo ângulo (ou de seu
reflexo no espelho). Isso provavelmente nunca acontecerá na prática, mas podemos inferir de
(1.28) que a interferência é mais forte quando os ângulos dos UEs são semelhantes entre si.
Por exemplo, podemos utilizar o fato de que sin(πz)≈ πz para∨z ∨¿ 0.2 para mostrar
que
se dHM ∨sin( φ)−sin(ψ )∨¿ 0,2 . O intervalo angular para o qual isso ocorre se torna
menor à medida que a abertura dHM do ULA aumenta, mas existe para qualquer matriz de
tamanho finito. Como é o dHM que determina a resolução angular, a interferência é reduzida
aumentando o número de antenas M e / ou usando um maior espaçamento de antena d H. Isto
está em contraste com o termo de sinal, que é proporcional apenas ao número de antenas.
Para uma dada abertura de matriz, é portanto benéfico ter muitas antenas em vez de antenas
amplamente separadas. Note que nós consideramos um modelo LoS bidimensional nesta
seção, onde apenas o ângulo de azimute pode diferir entre os UEs. Na prática, os UEs também
podem ter diferentes ângulos de elevação para o arranjo BS e isto pode ser explorado para
separar os UEs. Esses aspectos serão discutidos em mais detalhes na Seção 7.4.2, p. 503.

Para ilustrar esses comportamentos, a função g ( φ 00 , φ10 ) é mostrada na Figura 1.12 para um
0
UE desejado no ângulo fixo φ0 =30 ° , enquanto o ângulo do UE interferente é variado entre
-180° e 180°. O espaçamento da antena é dH = 1/2. No caso de antena única, temos
g ( φ 00 , φ10 )=1, independentemente dos ângulos, o que está de acordo com o Lema 1.4.
Quando o BS tem múltiplas antenas, g ( φ 00 , φ10 ) depende fortemente dos ângulos individuais
0
do UE. Há picos de interferência quando os dois UEs têm o mesmo ângulo (isto é, φ1 =30 ° )
e quando os ângulos são reflexos de espelho uns dos outros (isto é,
0
φ1 =180° −30 °=150 ° ). A função é igual a M nesses picos, porque o sinal de interferência
é coerentemente combinado pela combinação de MR (exatamente como o sinal desejado).
Quando o ULA pode resolver os UEs individuais, o nível de interferência diminui rapidamente
(observe a escala vertical logarítmica) e fica geralmente menor à medida que M aumenta.
Nesses casos, o nível de interferência oscila conforme o ângulo do UE interferente é variado,
mas é aproximadamente 1 / M vezes mais fraco que no caso de antena única. Assim, as
múltiplas antenas BS ajudam a suprimir a interferência, desde que os ângulos do UE sejam
suficientemente diferentes.
Figura 1.12: A função g ( φ 00 , φ10 ) em (1.28) que determina o nível de interferência em um cenário LoS. O UE

desejado está no ângulo fixo φ00 =30 ° e o UE interferente tem um ângulo variável
0
φ1 ∈[−180 ° ,180 ° ].
O SE no caso NLoS é mais difícil de interpretar já que a expressão de formato fechado em (1.29)
possui uma estrutura complicada com várias somas e funções especiais. Felizmente, podemos
obter o seguinte limite inferior conveniente que é muito apertado para M ≫ 1 (veja a
Figura 1.14 para uma comparação).

Corolário 1.6. Um limite inferior no UL SE em (1.29) para canais NLoS é

A expressão SE acima pode ser interpretada de forma semelhante à expressão LoS em (1.27); é
o logaritmo de um mais uma expressão SINR onde a potência do sinal aumenta como (M −1).
Um ganho de array linear é assim obtido para os canais LoS e NLoS. É a técnica de limite
inferior usada no Corolário 1.6 que fez a escala de sinal desejada como (M - 1), em vez de M,
que é o ganho de matriz natural obtido com a combinação de MR. No entanto, a diferença é
insignificante quando M é grande. A potência de interferência em (1.32) é independente de M,
em contraste com o caso LoS em (1.27) onde decai como 1 / M. Esse comportamento de
dimensionamento sugere que os canais NLoS fornecem uma propagação menos favorável do
que os canais LoS, mas a realidade é mais complicada. Para exemplificar isso, a Figura 1.13
mostra a função de distribuição cumulativa (CDF) do ganho de interferência relativo.

Figura 1.13: CDF do ganho de interferência relativo em (1,33), usando escala logarítmica no eixo horizontal. A
aleatoriedade no caso NLoS é devida ao desvanecimento de Rayleigh, enquanto é devido a ângulos aleatórios de UE
nos casos de LoS. As porcentagens de realizações quando LoS dá maior ganho de interferência do que NLoS são
indicadas.

que determina quão bem a interferência é suprimida pela combinação de MR.


Para canais NLoS, (1.33) pode ser mostrado para ter uma distribuição Exp (1),
independentemente do valor de M. Em contraste, (1.33) é igual a g ( φ 00 , φ10 ) em (1.28) para
canais LoS, que é uma função dos ângulos M e UE. A Figura 1.13 considera o caso LoS com M =
10 e M = 100 e mostra o CDF sobre diferentes ângulos UE uniformemente distribuídos entre 0
e 2π (com dH = 1/2). O CDF do desvanecimento em pequena escala com canais NLoS também é
mostrado. A Figura 1.13 mostra que os canais de LoS geralmente fornecem vários ganhos de
interferência menores de ordem de magnitude do que os canais de NLoS, mas isso se aplica
somente à maioria das realizações de ângulos aleatórios. Existe uma pequena probabilidade de
que o ganho de interferência seja maior em LoS do que em NLoS; Acontece em 18% das
realizações com M = 10 e 4% das realizações com M = 100. Isto corresponde aos casos quando
sin sin ( φ 00 ) ≈ sin(φ 01) para que o array não consiga resolver e separar os ângulos do UE.
Como discutido anteriormente, isso ocorre aproximadamente quando
d H M ∨sin(φ)−sin( ψ)∨¿ 0,2 . Isso acontece com menos frequência para ângulos
aleatórios, à medida que M aumenta (para d H fixo), uma vez que a abertura da matriz cresce e,
assim, obtém uma melhor resolução espacial. No entanto, para qualquer M finito, haverá um
0
pequeno intervalo angular em torno de ' φ0 , onde a interferência recebida será amplificada,
assim como o sinal desejado. Uma vez que a matriz é incapaz de separar UEs com diferenças de
ângulo tão pequenas, o agendamento de frequência de tempo pode ser necessário para
separá-los; veja a Seção 7.2.2 na p. 474 para mais orientações para o agendamento.

O conceito de propagação favorável fornece uma maneira de quantificar a capacidade de


0 0
separar canais de UE em uma BS com muitas antenas [245]. Diz-se que os canais hi e h k
fornecem propagação assintoticamente favorável se

Para canais de desvanecimento, diferentes tipos de convergência podem ser considerados em


(1.34). Aqui, consideramos convergência quase certa, também conhecida como convergência
com probabilidade um, mas a literatura também contém definições que se baseiam em tipos
mais fracos de convergência (por exemplo, convergência em probabilidade). A interpretação de
(1.34) é que as direções do canal tornam-se assintoticamente
ortogonais. A condição em (1.34) é satisfeita para canais LoS, bem como para canais NLoS com
desvanecimento Rayleigh não correlacionado [245]. Pode-se mostrar que a superposição de
componentes LoS e NLoS também satisfaz (1.34). Medições de canal com grandes matrizes de
BS também confirmaram que os canais do UE são correlacionados à medida que mais antenas
são adicionadas [120, 150]; veja a Seção 7.3.4 na p. 495 para mais detalhes sobre medições de
canal. Note que (1.34) não implica que as respostas do canal se tornem ortogonais, no sentido
de que . Mais tarde, fornecemos uma definição geral de propagação
assintoticamente favorável na Seção 2.5.2, p. 233.
Figura 1.14: Média do UL SE em função do número de antenas BS M para diferentes modelos de canais. O SNR é
SNR0 = 0 dB e a força da interferência entre as células é β́=−10 dB .

A Figura 1.14 mostra a média do SE como uma função do número de antenas BS quando o SNR
do UE desejado é fixado em SNR0 = 0 dB e a força da interferência entre células é ¯ = −10 dB. O
caso LoS considera um ULA com dH = 1/2 e os resultados são calculados sobre diferentes
ângulos independentes de UE, sendo todos uniformemente distribuídos de 0 a 2π. Apesar das
condições bastante ruins de SNR e interferência, a Figura 1.14 mostra que, indo de M = 1 para
M = 10 antenas, pode-se melhorar o SE de 0,8 bit / s / Hz para 3,3 bit / s / Hz. Isso é conseguido
graças ao ganho de matriz fornecido pela combinação de MR. Notamos que o limite inferior na
propagação SE com NLoS no Corolário 1.6 é muito apertado para M> 10. O SE é uma função
monotonicamente crescente de M e cresce sem limite como M → ∞ , em contraste com o
caso de escalonamento de forças analisado na Seção 1.3.2, onde a SE saturou no regime de alta
SNR. Isso é mais uma vez devido à combinação MR, que coleta seletivamente mais energia de
sinal da matriz, sem coletar mais energia de interferência. A diferença entre LoS e NLoS é
insignificante na Figura 1.14 porque o desvanecimento de canal tem um impacto
gradativamente menor na informação mútua entre o sinal transmitido e recebido à medida
que mais antenas são adicionadas [142]. Isso é atribuído à diversidade espacial de ter várias
antenas de recepção que observam realizações de desvanecimento independentes, que
provavelmente não serão quase zero simultaneamente. Este fenômeno é conhecido há muito
tempo; de fato, os primeiros trabalhos [257, 117] sobre a recepção multi antenna focaram no
combate ao desvanecimento do canal. O termo endurecimento de canal foi usado em [142]
para descrever um canal de desvanecimento que se comporta quase deterministicamente
devido à diversidade espacial.
0
Na literatura MIMO Massive [243], um canal hi é dito para fornecer endurecimento de
canal assintótico se

quase certamente como M → ∞ . A essência deste resultado é que as variações de canal


reduzem à medida que mais antenas são adicionadas, no sentido de que o ganho de canal
instantâneo normalizado converge para o ganho médio de canal determinístico. Não é surpresa
que os canais LoS determinísticos forneçam o endurecimento do canal. Mais importante, na
propagação de NLoS,
quase certamente como M → ∞ . Este é um exemplo da lei forte de grandes números (veja
2
o Lema B.12 na p. 564) e pode ser interpretado como as variações de ||h || / M
0
i se
tornando cada vez mais concentradas em torno de seu valor médio à
2
medida que mais antenas são adicionadas. Isso não significa que ||h ||
0
i se torne
determinista; de fato, seu desvio padrão cresce como √ M , enquanto o desvio padrão de
2
kh0 ||h || / M
0
i vai assintoticamente para zero como 1/ √ M ,. O endurecimento de canal
assintótico também pode ser provado para outras distribuições de canal, como será discutido
mais adiante na Seção 2.5.1, p. 231.

O efeito de endurecimento do canal para o canal M-dimensional h~ é ilustrado na


Figura 1.15. O valor médio do ganho de canal instantâneo normalizado e os
percentis de 10% e 90% são mostrados para diferentes números de antenas. Uma realização
aleatória também é mostrada. Como esperado, temos quando M é grande. A
convergência para este limite é gradual, mas a aproximação é razoavelmente apertada para
M ≥ 50.
Em resumo, aumentar o número de antenas BS melhora o SE, que cresce mesmo sem limite
quando M → ∞ . Isso ocorre porque o BS pode processar seu sinal recebido através do
array para aumentar seletivamente o ganho do sinal sem coletar mais interferência. Em
contraste, aumentar a potência de transmissão aumentará o sinal e a interferência igualmente
e dará um limite superior de SE. No entanto, o SE cresce apenas logaritmicamente com o
número de antenas, como log2(M), que não fornece escalabilidade suficiente para alcançar
qualquer melhoria de ordem de magnitude no SE em redes celulares futuras

Figura 1.15: Ilustração do fenômeno de endurecimento do canal para um canal Mdimensional h~ O


ganho de canal instantâneo normalizado se aproxima de seu valor médio 1 e os desvios padrão se
reduzem como 1/ √ M .

Observação 1.3 (limites físicos de grandes matrizes). O comportamento de escala obtido pela
análise assintótica acima foi validado experimentalmente para números práticos de antenas
[120, 150]. No entanto, é importante notar que a física nos impede de deixar o tamanho da
matriz crescer indefinidamente como M → ∞ , uma vez que o ambiente de propagação é
cercado por um volume finito [281]. Idealmente, podemos cobrir a superfície deste volume
com antenas e negligenciar qualquer absorção, para coletar toda a energia do sinal, mas nunca
podemos coletar mais energia do que foi transmitida. Isso não é um problema quando lidamos
com centenas ou milhares de antenas, já que um ganho “grande” de canal de -60 dB nas
comunicações celulares implica que precisamos de um milhão de antenas para coletar toda a
energia transmitida. Em conclusão, o limite M → ∞ não é fisicamente alcançável, mas a
análise assintótica ainda pode ser adequada para investigar o comportamento do sistema em
números de antenas praticamente grandes. Outras distribuições de canal do que o
desvanecimento Rayleigh não correlacionado são, no entanto, necessárias para obter
resultados confiáveis; veja Seção 2.2, p. 222 e Seção 7.3, p. 482 para mais detalhes.

1.3.3 Acesso Múltiplo por Divisão de Espaço Uplink

Aumentar a potência de transmissão ou usar múltiplas antenas BS só pode trazer melhorias


modestas para o UL SE, conforme mostrado anteriormente. Isso ocorre porque esses métodos
melhoram o SINR, que aparece dentro do logaritmo da expressão SE, portanto, o SE aumenta
lentamente. Gostaríamos de identificar uma maneira que melhore o SE no exterior do
logaritmo. Uma vez que as expressões logarítmicas nos Lemmas 1.4 e 1.5 descrevem o SE do
canal entre um UE particular e o seu servidor BS, podemos potencialmente servir múltiplos
UEs, digamos K UEs, simultaneamente em cada célula e alcançar uma soma SE que é a soma de
K SE expressões dos tipos em Lemmas 1.4 e 1.5. Um gargalo óbvio de tal multiplexação de UEs
é a interferência do co-usuário que aumenta com K e agora aparece também dentro de cada
célula. A interferência intra-celular pode ser muito mais forte que a interferência inter-celular e
precisa ser suprimida se um aumento de K-fold na SE for realmente alcançado.

O acesso múltiplo por divisão espacial (SDMA) foi concebido no final da década de 80 e início
dos anos 90 [349, 308, 17, 280, 125, 373] para lidar com a interferência co-usuário em uma
célula usando múltiplas antenas na BS para rejeitar a interferência de processamento espacial.
Múltiplos ensaios de campo foram realizados na década de 1990, usando (pelo menos) até dez
antenas [15, 96, 16]. A capacidade de informação teórica (14) desses sistemas foi caracterizada
no início dos anos 2000 e descrita em [74, 129, 335, 342, 366, 127] para sistemas de células
individuais, onde a terminologia “multiusuário MIMO” foi utilizada. Note que os K UEs são as
múltiplas entradas e as M BS antenas são as múltiplas saídas, assim a terminologia MIMO é
usada independentemente de quantas antenas cada UE está equipado. (15). Extensões de
MIMO multiusuário para redes celulares foram desenvolvidas e pesquisadas em documentos
como [276, 33, 294, 46, 126, 208], mas a capacidade exata é difícil de obter neste caso.
14Quando existem K UE na rede, a noção de capacidade unidimensional convencional generaliza para
uma região de capacidade dimensional K que representa o conjunto de capacidades que os K UEs
podem alcançar simultaneamente. A soma da capacidade representa um ponto nessa região e ganhou
uma tração particular, pois é a métrica unidimensional que descreve a capacidade agregada da rede.
Este e outros pontos de operação estão descritos na Seção 7.1, p. 452
15 A terminologia “multiusuário SIMO” foi usada na década de 1990 para o caso do SDMA com UEs de
antena única [254], mas hoje em dia a terminologia MIMO multiusuário de informação teórica domina
e é adotada nesta monografia.
Vamos agora analisar uma rede celular com transmissão UL SDMA, assumindo que existem K
UE ativos em cada célula, como ilustrado anteriormente na Figura 1.8. A resposta do canal
entre o kth desejado UE na célula 0 e o serviço BS é denotada por para k =1,.. . , K
, enquanto as respostas de canal dos UEs interferentes na célula 1 para a BS na célula 0 são
designadas por para i=1,. .. K Observe que o subscrito ainda indica a identidade
do UE, enquanto o sobrescrito é o índice da BS receptora. O sinal UL multianteno recebido em
(1.22) é então generalizado para

onde é o sinal transmitido pelo k-ésima UE na célula j e o ruído do receptor


é o mesmo de antes.
Consideramos os mesmos modelos de propagação de LoS e NLoS como antes. Mais
precisamente, a resposta do canal LoS para o UE k na célula j é

0
onde φ jk ∈¿ é o ângulo de azimute relativo à orientação da matriz BS na célula 0. No caso
NLoS, a resposta de canal correspondente entre UE k na célula j e a BS na célula 0 é definida
como

e assumido como estatisticamente independente entre os UEs. Lembre-se de que usamos o


0
modelo de Wyner em que, por simplicidade, o ganho médio de canal β j é assumido como
sendo o mesmo para todos os UEs na célula j .
Uma vez que a BS na célula 0 recebe uma sobreposição dos sinais transmitidos pelos seus Ks
desejados, ela precisa processar o sinal recebido em (1.37) para separar os UEs no domínio
espacial - falando simplesmente, direcionando sua audição para a localização de cada UE
desejado. A separação dos UEs é mais exigente no SDMA do que na multiplexação de tempo-
frequência convencional dos UEs, porque requer que o BS tenha conhecimento das respostas
do canal [127]. Por exemplo, a BS na célula 0 pode usar o conhecimento da sua resposta do
canal k-ésima UE para adaptar um vetor de combinação de recepção a este canal UE.
Este vetor é multiplicado com o sinal recebido em (1.37) para obter

A finalidade da combinação de recebimento é tornar o sinal desejado muito mais forte do que
a soma de sinais interferentes e ruído. MR combinado com

é uma escolha suboptimal popular, pois maximiza a potência relativa do sinal


desejado, mas não é a melhor escolha quando há sinais de interferência [28, 348, 349]. O
design de combinação de recepção para MIMO multiusuário é analiticamente semelhante à
detecção multiusuário em acesso múltiplo por divisão de código (CDMA) [202, 205, 106] e os
métodos principais foram desenvolvidos aproximadamente ao mesmo tempo. Na Seção 4.1, p.
275, mostraremos que é o vetor de combinação de médias quadráticas mínimas multicelulares
(M-MMSE)
que maximiza o UL SE nas redes celulares. Este esquema de combinação recebeu seu nome do
fato de que ele também minimiza o erro quadrático médio (MSE) entre o
H
sinal desejado s0k e o sinal combinado de recepção v 0 k y 0 , onde a expectativa é com
relação a os sinais de transmissão (enquanto os canais são considerados determinísticos). Os
sinais interferentes de todas as células são considerados na combinação M-MMSE e o inverso
da matriz em (1.42) tem um papel semelhante ao de um filtro de branqueamento no
processamento de sinal clássico [175]. A combinação M-MMSE maximiza o SINR, encontrando
o melhor equilíbrio entre amplificar o sinal desejado e suprimir a interferência no domínio
espacial. O preço a pagar é o aumento da complexidade computacional de inverter uma matriz
e a necessidade de aprender a matriz que está invertida em (1.42).
O próximo lema fornece expressões SE em formato fechado para o caso de combinação de MR.
A combinação M-MMSE será estudada por simulações.

Lema 1.7. Se a BS na célula 0 conhece as respostas de canal de todos os UEs e aplica MR


combinando para detectar os sinais de cada um dos seus Ks desejados, então uma soma de UL
alcançável [bit / s / Hz / célula] no caso de LoS é

com g (·, ·) sendo definido em (1.28).


Com canais NLoS, uma soma de UL alcançável [bit / s / Hz / célula] e um limite inferior de
forma fechada são

Prova. A prova está disponível no Apêndice C.1.6 na p. 587


A soma das expressões SE no Lema 1.7 tem formas semelhantes às do Lema 1.5 e Corolário
1.6, mas são mais complicadas devido à adição de interferência intracelular e à maior
quantidade de interferência inter-celular. No caso LoS, o SDMA resulta na soma das expressões
K SE, uma por UE desejada. Os ganhos de sinal desejados dentro dos logaritmos aumentam
linearmente com M e, assim, cada UE experimenta o ganho total do array quando utiliza a
combinação MR. A desvantagem do SDMA é vista a partir do denominador, onde os termos de
interferência contêm contribuições de K−1 UEs intracelulares e UEs intercelulares K. Cada
termo de interferência tem a mesma forma que no caso de usuário único no Lema 1.5,
portanto, pode-se esperar que a interferência seja a menor quando os UEs tiverem ângulos
bem separados (para evitar os piores casos ilustrados na Figura 1.12). Lembre-se de (1.30) que
a função g(φ , ψ ) diminui como 1 / M para qualquer sin(φ) ≉ sin(ψ ) . Em conjunto
com o ganho da matriz do sinal desejado, podemos assim servir vários UE e ainda manter
aproximadamente o mesmo SINR por UE se M for aumentado proporcionalmente a √ K
para contrariar a interferência aumentada (16).

O caso NLoS no Lema 1.7 generaliza o limite inferior no Corolário 1.6 para K ≥1 e o limite é
apertado para M ≫ 1. Uma expressão de forma fechada exata semelhante a (1.29)
também pode ser obtida, mas contém muitas somas e é omitida, uma vez que não fornece
uma percepção adicional. O ganho do SDMA é facilmente visto a partir de (1,44); há um fator K
na frente do logaritmo que mostra que a soma SE aumenta proporcionalmente ao número de
UEs. Esse fator multiplicativo é conhecido como o ganho de multiplexação e alcançar esse
ganho é o ponto principal com o SDMA. Dentro do logaritmo, a potência do sinal desejado
aumenta linearmente com M, enquanto a potência de interferência intracelular K-1 e a
potência de interferência inter-celular K β́ aumentam linearmente com K. Isso significa
que, à medida que adicionamos mais UEs, podemos neutralizar a interferência crescente,
adicionando uma quantidade proporcional de antenas BS adicionais; mais precisamente,
podemos manter aproximadamente o mesmo SINR por UE, aumentando M em conjunto com K
para manter a relação M / K da antena-UE fixa. Curiosamente, isso significa que mais antenas
são necessárias para suprimir a interferência com MR combinada no caso NLoS do que no caso
LoS, onde M precisa apenas aumentar como √ K . A explicação é que todos os UEs
interferentes causam uma interferência substancial no caso NLoS, enquanto apenas aqueles
com ângulos suficientemente similares ao UE desejado fazem isso no caso LoS (e o intervalo
angular onde isso acontece diminui com M).

Para exemplificar esses comportamentos, a Figura 1.16 mostra a soma média do SE como uma
função do número de UEs por célula, para M = 10 ou M = 100 antenas. A soma SE com MR
combinando é mostrada na Figura 1.16a baseada nas fórmulas analíticas do Lema 1.7,
enquanto as simulações de Monte-Carlo são usadas para M-MMSE combinando na Figura
1.16b. Em ambos os casos, o SNR é fixado em SNR0 = 0 dB e a força da interferência entre as
células é β́=−10 dB . O espaçamento da antena é dH = 1/2 no caso LoS e os resultados são
calculados sobre diferentes ângulos UE independentes, sendo todos uniformemente
distribuídos de 0 a 2 π .
Figura 1.16: Soma UL média em função do número de UEs por célula para esquemas de combinação diferentes,
modelos de canais diferentes e M = 10 ou M = 100 antenas BS. O SNR é SNR0 = 0 dB e a força da interferência entre
as células é β́=−10 dB . A soma SE cresce linearmente com K, desde que M / K permaneça grande. O M-
MMSE rejeita a interferência mais eficientemente do que o MR.

A Figura 1.16 mostra que a soma SE é uma função lentamente crescente de K no caso de M =
10, porque a BS não possui graus de liberdade espacial suficientes para separar os UEs - nem
por MR nem por combinação M-MMSE. O comportamento é completamente diferente quando
M = 100 antenas são usadas, pois a resposta do canal de cada UE é um vetor de 100
dimensões, mas existem apenas 20 UEs por célula, de forma que os canais do UE abrangem
apenas uma pequena porção das dimensões espaciais que o BS pode resolver.
Consequentemente, a soma SE aumenta quase linearmente com o número de UEs e podemos
alcançar uma melhoria de aproximadamente K vezes na soma SE sobre um cenário de usuário
único. Por exemplo, alcançamos um SE de 3,3 bit / s / Hz / célula com (M, K) = (10, 1) usando
MR / MMMSE combinando e podemos aumentá-lo para 71,6 bit / s / Hz / célula com MR e 101
bit / s / Hz / célula com M-MMSE para (M, K) = (100, 20). Isso corresponde a 21 × e 31 × ganhos
em SE, respectivamente. Esses números foram selecionados nas curvas LoS, porque o caso
NLoS mostra alguns comportamentos interessantes que merecem discussão adicional. A soma
SE é consideravelmente menor com NLoS do que com LoS ao usar MR combinando, enquanto
obtemos o resultado oposto ao usar a combinação M-MMSE. A razão para isto é que cada UE é
afectado pela interferência de muitos UEs no caso NLoS, enquanto apenas alguns UE com
ângulos semelhantes causam forte interferência no caso LoS. Se a interferência for ignorada,
como na combinação MR, o SE é menor no caso NLoS devido à maior potência de interferência
de soma. No entanto, é mais fácil para a combinação M-MMSE rejeitar a interferência em NLoS
do que em LoS, onde pode haver alguns UEs com canais que são quase paralelos ao canal do
UE desejado. É por isso que o SE é maior no NLoS ao usar o M-MMSE.

Consideramos agora casos em que M é aumentado proporcionalmente a K, para suprimir a


interferência inter-usuário que aumenta com K. A constante de proporcionalidade M / K é
chamada de relação antena-UE. A Figura 1.17 mostra a soma SE obtida pela combinação de M-
MMSE, em função de K para diferentes proporções de antena-UE : M / K ∈ {1, 2, 4,8 }. O SE
cresce quase linearmente com K nos quatro casos, como esperado no Lema 1.7. A inclinação
das curvas aumenta à medida que M / K aumenta, uma vez que se torna mais fácil suprimir a
interferência quando M ≫ K . Olhando para o caso NLoS com K = 10, a primeira duplicação
do número de antenas (de M / K = 1 para M / K = 2) dá um ganho de 94% em SE, enquanto a
segunda duplicação dá outro 51% ganho e a terceira duplicação dá ainda outro ganho de 29%.
Já que as melhorias relativas estão decaindo, dizemos que M /K ≥ 4 é o regime
operacional preferido para MIMO multiusuário.17 Os casos LoS e NLoS mais uma vez fornecem
resultados comparáveis.

Figura 1.17: Média UL soma SE com M-MMSE combinando como uma função do número de UEs por célula, quando
o número de antenas aumenta com K com diferentes proporções de antena fixa UE M / K. O SNR é SNR0 = 0 dB e a
força da interferência entre as células é β́ = −10 dB. A soma SE cresce à medida que M / K aumenta.

M-MMSE é o esquema de combinação de recepção linear que maximiza o SE. A característica


básica dos esquemas lineares é que eles tratam a interferência como ruído colorido
espacialmente. Do ponto de vista da capacidade do canal, isso só é ideal quando a
interferência entre cada par de UEs é suficientemente pequena [230, 296, 20, 21, 295]. A teoria
da informação para canais de interferência prova que fontes de interferência fortes devem ser
canceladas usando esquemas de processamento de receptores não lineares, tais como
cancelamento sucessivo de interferência, antes que os sinais desejados sejam decodificados
[314]. No entanto, esses esquemas são pouco práticos, pois é necessário armazenar grandes
blocos de sinais recebidos e decodificar os dados dos UEs sequencialmente, levando a alta
complexidade, grandes requisitos de memória e problemas de latência. Se nos limitarmos a
esquemas de processamento de receptores lineares, quão grande é a perda de desempenho?
Figura 1.18: Relação entre a média da soma UL obtida com a combinação M-MMSE e com o processamento
receptor não linear, em função do número de UEs por célula. O número de antenas M aumenta com K para
diferentes proporções de antena fixa UE: M / K 2 {1, 2, 4, 8}. O SNR é SNR0 = 0 dB e a força da interferência entre as
células é β́=−10 dB .

A Figura 1.18 quantifica a perda de desempenho do processamento do receptor linear em


comparação com o processamento do receptor não linear, como uma função do número de
UEs. A figura mostra a relação entre a soma média da UL obtida pela combinação de M-MMSE
e por cancelamento sucessivo de interferência, em que os sinais intracelulares são
decodificados sequencialmente enquanto se trata a interferência inter-celular como ruído
[314]. A configuração é a mesma da figura anterior, mas consideramos apenas a propagação de
NLoS por simplicidade. O esquema não linear tem um desempenho muito melhor para M / K =
1, caso em que o M-MMSE atinge apenas 70% -80% da sua soma SE. A diferença de
desempenho diminui rapidamente à medida que M / K aumenta. Para M / K = 4 e M / K = 8,
perdemos apenas algumas percentagens na soma SE usando M-MMSE em vez do esquema não
linear, mesmo que haja até 20 UEs. A interpretação é que a propagação favorável, conseguida
por ter muitas antenas BS, faz com que a interferência entre cada par de UEs seja
suficientemente pequena para tornar o processamento receptor linear quase óptimo. Quando
existem muitos UEs ativos, a interferência total causada a um UE pode de fato ser grande, mas,
mesmo assim, o processamento linear tem um bom desempenho, já que a interferência entre
cada par de UEs é pequena. Observações semelhantes foram feitas nos artigos gerais [50,
209,210].

Em resumo, a transmissão UL SDMA pode aumentar a soma SE por célula em mais de uma
ordem de grandeza. Isto é conseguido servindo K UEs simultaneamente e aumentando o
número de antenas BS para alcançar um ganho de matriz que neutraliza o aumento da
interferência. Isto leva a um regime operacional com a relação antena-UE M /K ≥ c , para
alguns valores preferencialmente grandes c, onde podemos fornecer ganhos de dobra-K na
soma SE. Esse é o tipo de melhorias de escalabilidade altamente escalonáveis que são
necessárias para lidar com volumes de dados muito maiores na camada de cobertura das redes
de celular futuras. Note-se que o SE por UE não é drasticamente alterado, pelo que a utilização
de mais espectro ainda é essencial para melhorar a taxa de transferência por UE. Os ganhos da
soma SE são alcançáveis com os canais LoS e NLoS, usando a combinação MR que maximiza o
ganho da matriz ou a combinação M-MMSE que também suprime a interferência para
maximizar o SE. Os esquemas de processamento não linear podem trazer apenas pequenas
melhorias de desempenho no regime operacional preferível e, portanto, não são considerados
no restante desta monografia.
Observação 1.4 (Multianten UEs). Mostramos acima que a transmissão SDMA com muitos UEs
de antena única e um número ainda maior de antenas BS atinge um valor alto SE. O que
aconteceria se os UEs também estivessem equipados com múltiplas antenas? O custo,
tamanho e complexidade de cada UE irão certamente aumentar. O efeito positivo é que um UE
com antenas NUE pode transmitir até N UE fluxos de dados simultâneos para sua BS de serviço.
Do ponto de vista da BS, cada fluxo pode ser tratado como um sinal de um UE “virtual”
separado e o sinal só pode ser distinguido se tiver uma diretividade espacial diferente dos
outros sinais. Isto significa que o vetor que descreve a resposta do canal da BS à enésima
antena de um determinado UE deve ser quase ortogonal às respostas do canal das outras
antenas (para n = 1, ..., NUE). Na propagação de NLoS, isto é conseguido quando as antenas de
UE observam realizações de canal aleatório quase não correlacionadas, o que é possível em um
ambiente de dispersão rico com um espaçamento de antena adequado. A ortogonalidade do
canal é muito mais difícil de conseguir na propagação de LoS, uma vez que o ângulo entre a BS
e um UE no campo distante é aproximadamente o mesmo para todas as antenas no UE;
lembre-se de (1.28) que o produto interno g(φ , ψ ) entre as respostas do canal LoS com
ângulos φ e ψ é grande sempre que φ ≈ ψ . Assim, o benefício de enviar múltiplos
sinais de dados não pode ser explorado em ambientes de propagação com apenas um caminho
LoS dominante. O UE pode, no entanto, obter um ganho de matriz adicional proporcional ao
NUE combinando coerentemente os sinais sobre as antenas NUE, se conhecer as respostas do
canal. Esta monografia se concentra em UEs de antena única, mas os resultados podem ser
facilmente aplicados a UEs de antena N UE, visualizando-os como UEs virtuais NUE que
transmitem NUE sinais separados, representando diferentes fluxos de dados. O documento
[194] considera UEs multiantena e mostra que o SE é maximizado quando um número
particular de fluxos de dados é recebido / transmitido por célula (ver Secção 7.2.2 na p. 474
¿
para uma discussão adicional). Suponha que este número de fluxos seja K Stream e que cada
UE seja alocado como muitos fluxos como tem antenas. A análise em [194] indica que
aproximadamente a mesma soma SE é obtida quando se tem K UEs que estão equipados com
antenas NUE e quando têm UEs de antena única N UEK. Assim, a vantagem distinta de ter
¿
múltiplas antenas de UE ocorre com baixa carga de usuário, K < K Stream , onde a única
maneira de enviar todos os fluxos K ¿Stream é atribuir múltiplos fluxos por UE.

1.3.4 Acesso Múltiplo por Divisão de Espaço Downlink

Esta seção concentrou-se até agora no UL, onde identificamos o SDMA como uma maneira
adequada de melhorar o SE em uma ordem de magnitude ou mais. Vamos agora descrever
como o SDMA é aplicado no DL. Continuamos a usar o modelo de Wyner, que é ilustrado na
Figura 1.19 para o DL. A principal diferença do UL na Figura 1.8 é que os sinais são transmitidos
de BSs em vez de UEs. Existem Ks activos de K em cada célula e a BS de serviço envia um sinal
separado para cada um deles utilizando a pré-codificação de transmissão linear a partir de um
conjunto de antenas M. Pré-codificação significa que cada sinal de dados é enviado de todas as
antenas, mas com amplitude e fase diferentes para direcionar o sinal espacialmente. Isso
também é chamado de beamforming, mas evitamos usar essa terminologia, pois ela pode dar
a impressão errônea de que um feixe de sinal é sempre formado em uma direção angular
específica e que os deslocadores de fase analógicos são usados. Em contraste, pré-codificação
significa que o sinal de transmissão de cada antena é gerado separadamente na banda base
digital, o que dá total flexibilidade na geração de sinal.18 Feixes angulares são um caso especial
de pré-codificação que é útil na propagação de LoS, mas para canais NLoS o sinal transmitido
pode não ter uma diretividade angular distinta, mas ainda pode ser pré-codificada de tal modo
que os componentes do multipercurso sejam recebidos coerentemente no UE.

Figura 1.19: Ilustração da noção de sinais DL desejados e interferentes em uma rede de duas células. No modelo de
Wyner, cada UE na célula 0 tem o mesmo valor dos ganhos médios de canal β 00 e β10 , enquanto que cada UE na
1 1
célula 1 tem o mesmo valor de β eβ
0 1 .

Semelhante ao UL, a resposta do canal DL entre a BS na célula 0 e o seu kesima desejado UE é


H
denotada por (h 00 k ) para k =1,.. . K A resposta do canal DL entre a BS na célula 1 e o
H
kth UE na célula 0 é denotada por (h 10 k ) . A transposição representa o fato de que agora
estamos olhando para o canal da direção oposta, enquanto o conjugado complexo é
adicionado por conveniência notacional. Não existe tal conjugação na prática, mas simplifica a
notação e não altera o SE.

O sinal DL recebido no UE k na célula 0 é modelado como

onde é o sinal transmitido ao quinto UE na célula j e é o vetor de pré-


codificação da norma unitária correspondente (isto é, ¿|w jk|∨¿ 1 ) que determina a
diretividade espacial do sinal. O ruído do receptor neste UE é indicado por ).

Consideramos os mesmos modelos de propagação de LoS e NLoS como antes. No caso LoS,
temos a resposta do canal MISO (multiple-input single-output)

l
entre UE k na célula j e BS na célula l, em que φ jk ∈¿ é o ângulo de azimute relativo à
orientação da matriz BS transmissora. No caso NLoS, a resposta do canal correspondente é

e é assumido como independente entre os UEs. Lembre-se de (1.12) que usamos a mesma
1 0
notação, β́=β 0 / β 0 , para a força relativa da interferência inter-celular na DL como na UL.
Os vetores de pré-codificação w jk, para k =1,.. . , K e j = 0, 1, podem ser selecionados de
várias formas. Como visto a partir do sinal recebido em (1.45), cada UE é afectado por todos os
vectores de pré-codificação; o próprio vetor de pré-codificação é multiplicado com a resposta
do canal da BS de serviço, enquanto os outros causam interferência e são multiplicados com a
resposta do canal a partir das BSs de transmissão correspondentes. Assim, os vetores de pré-
codificação devem ser selecionados cuidadosamente no DL, com base no conhecimento das
respostas do canal. Estudaremos isso em detalhes na Seção 4.3, p. 316, mas por enquanto nós
consideramos MR precoding com

Este vetor de pré-codificação foca o sinal DL no UE desejado para alcançar o ganho máximo de
2
matriz, similar à combinação de RM no UL. Note que ||w jk|| =1 , o que implica que a
potência total de transmissão da BS é constante, independentemente do número de antenas.
Consequentemente, a potência de transmissão por antena BS diminui aproximadamente como
1 / M. O lema a seguir fornece expressões SE para a pré-codificação MR.

Lema 1.8. Se os BSs usarem a pré-codificação MR e os UEs na célula 0 conhecerem seus


H
respectivos canais efetivos (h 00 k ) w0k e a variância de interferência, então uma soma DL
alcançável SE [bit / s / Hz / célula] no caso LoS é.

Com canais NLoS, uma soma DL SE [bit / s / Hz / célula] e um limite inferior de forma fechada
são

Prova. A prova está disponível no Apêndice C.1.7, pág. 588

A soma de DL de SE neste lema é muito semelhante à soma de UL no Lema 1.7. O caso NLoS só
M −1
difere no termo multiplicativo extra no denominador de (1.50), que é quase um para
M
o caso grande M. O LoS só difere nos ângulos que aparecem em cada expressão, todos os
ângulos no UL são de UEs para o BS na célula 0, enquanto o DL inclui tanto os ângulos do UE
desejado para todos os BSs transmissores e os ângulos dos outros UEs para os quais estes BSs
estão transmitindo (representando a diretividade de cada sinal DL). Algumas das similaridades
são induzidas pelo modelo de Wyner, uma vez que assumimos que a interferência intercelular
1 0
é igualmente forte no UL e DL (isto é, β 0=β 1 ); em geral, também há diferenças nos ganhos
médios do canal, conforme elaboramos na Seção 4.3.2, p. 320. No entanto, ao usar o modelo
Wyner, as simulações de UL nas Figuras 1.16–1.17 são representativas para o desempenho de
DL também - nenhuma simulação adicional é necessária para descobrir os comportamentos
básicos.

O ganho da matriz é M com processamento MR em UL e DL, mas é obtido de forma diferente.


Na UL, a BS faz observações M do sinal desejado sobre suas antenas de recepção M, cada uma
sendo corrompida por um termo de ruído independente. Combinando coerentemente os
componentes do sinal M, a potência do sinal cresce proporcionalmente a M, enquanto as
realizações de ruído são adicionadas de forma incoerente, de modo que a variação de ruído
não é alterada. No DL, as antenas de transmissão M têm canais diferentes para o UE receptor.
Como a potência total de transmissão é fixa, a potência do sinal por antena é reduzida como
1 / M e a amplitude do sinal como 1 / √ M . Com a pré-codificação que faz com que os
componentes do sinal transmitido M sejam adicionados coerentemente no UE, a amplitude do
sinal recebido cresce como M / √ M = √ M e a potência do sinal recebido cresce assim
como M.

1.3.5 Adquirindo informações do estado do canal


j
As respostas do canal, h jk , são utilizadas pela BSj para processar os sinais UL e DL.
Presumimos até agora que as respostas do canal são conhecidas perfeitamente, mas na prática,
esses vetores precisam ser estimados regularmente. Mais precisamente, as respostas do canal
são tipicamente constantes apenas por alguns milissegundos e por uma largura de banda de
algumas centenas de kHz. Uma distribuição aleatória é comumente usada para modelar as
variações do canal. O conjunto atual de realizações de resposta de canal é chamado de estado
de canal e o conhecimento que os BSs têm deles é chamado de informação de estado de canal
(CSI). Supõe-se que o CSI estatístico completo relativo às distribuições19 de variáveis aleatórias
esteja disponível em qualquer ponto da rede, enquanto o CSI instantâneo relativo às
realizações de canal atuais precisa ser adquirido no mesmo ritmo que os canais mudam. O
principal método para a aquisição do CSI é a sinalização piloto, onde um sinal piloto pré-
definido é transmitido de uma antena. Como ilustrado na Figura 1.20, qualquer outra antena
na rede pode receber simultaneamente a transmissão e compará-la com o sinal piloto
conhecido para estimar o canal a partir da antena transmissora. Se, em vez disso, precisarmos
estimar a resposta do canal de duas antenas transmissoras, geralmente são necessários dois
sinais pilotos ortogonais para separar os sinais das duas antenas [182, 195, 38]. A
ortogonalidade é alcançada através da utilização de duas amostras na transmissão, conforme
explicado na Seção 3.1, p. 244. O número de sinais piloto ortogonais é proporcional ao número
de antenas de transmissão, enquanto qualquer número de antenas de recepção pode “ouvir”
os pilotos simultaneamente e estimar seus canais individuais para os transmissores.

Figura 1.20: Quando uma antena está transmitindo um sinal piloto, qualquer número de antenas de recepção pode
receber simultaneamente o sinal piloto e usá-lo para estimar seus respectivos canais ao transmissor.
Cada sinal piloto transmitido pode ter sido um sinal que transporta dados de carga útil,
portanto, queremos minimizar essa sobrecarga causada pela sinalização do piloto. No SDMA,
existem diferenças importantes entre o UL e o DL em termos da sobrecarga para a aquisição de
canais. Existem K UEs de antena única por célula e, portanto, são necessários K sinais piloto
para estimar os canais no UL. Da mesma forma, existem M antenas na BS e, portanto, M sinais
piloto são necessários para estimar os canais na DL. Uma vez que ter uma relação de antena-
UE M /K ≥ 4 é o regime operacional preferível no SDMA, a sobrecarga do envio de pilotos
DL é tipicamente muito maior do que a dos pilotos da UL. Uma antena BS só é útil se
soubermos a resposta do canal, o que limita o número de antenas BS que podemos utilizar na
prática, a menos que possamos encontrar uma solução alternativa.

O UL e DL podem ser separados em qualquer momento ou frequência; veja a Figura 1.21. Se o


UL e DL estiverem separados no tempo, usando um protocolo duplex de divisão de tempo
(TDD), então as respostas do canal são recíprocas.

Figura 1.21: Ilustração de duas maneiras de dividir um bloco de recursos de tempo / freqüência entre UL e DL. Cada
caixa sólida representa um bloco de frequência de tempo em que as respostas do canal são constantes e precisam
ser estimadas.

Isso significa que a resposta do canal é a mesma em ambas as direções e pode ser estimada na
BS usando apenas os pilotos da K UL. Apenas o BS na célula j precisa saber a resposta completa
j
do canal h jk ao seu k esimo UE, enquanto o correspondente UE precisa apenas conhecer o
H
canal escalar efetivo g jk =( h jjk ) w jk que é obtido após a pré-codificação. Como o valor de
gjk é constante desde que os canais sejam constantes, ele pode ser estimado cegamente a
partir dos sinais de dados de carga útil DL, independentemente da distribuição do canal [243] .
21 Por exemplo, o BS pode usar seu CSI para ajustar a fase de w jk para que a fase de gjk se torne
(quase) determinística, assim principalmente a magnitude | g jk | precisa ser estimado. O
endurecimento do canal melhora a qualidade da estimativa, pois as variações relativas em
ficam menores. Consequentemente, um protocolo TDD requer apenas K pilotos,
independentemente do número de antenas, M.
Figura 1.22: Ilustração dos pontos de operação (M, K) que são suportados usando τ p =20 pilotos , para os
protocolos TDD e FDD. A área sombreada corresponde aos pontos de operação preferíveis para sistemas SDMA. O
protocolo TDD é escalonável em relação ao número de antenas e o número de UEs que podem ser suportados é
limitado apenas por τp .

Se o UL e o DL forem separados em frequência, usando um protocolo duplex de divisão de


frequência (FDD), então os canais UL e DL são sempre diferentes e não podemos confiar na
reciprocidade. Por isso, precisamos enviar pilotos tanto no UL quanto no DL. Além disso, as
estimativas das respostas do canal DL precisam ser realimentadas para o BS, para permitir a
computação de pré-codificação DL. O overhead de feedback é aproximadamente o mesmo que
H
o envio de sinais piloto UL adicionais (M, K). Os canais pré-codificados g jk =( h jjk ) w jk
podem ser estimados a partir dos sinais DL, como descrito acima para TDD. Assim, um
protocolo FDD tem uma sobrecarga de piloto / feedback que é equivalente ao envio de pilotos
M + K nos pilotos UL e M no DL. Para comparar isso com o TDD, suponha que os recursos de
freqüência no FDD sejam divididos igualmente entre o UL e o DL. A sobrecarga média do piloto

do protocolo FDD é
( M + K + max ( M , K ) ) .
2
Vamos agora ilustrar a diferença importante na dimensionalidade piloto entre a operação de
TDD e FDD. Considere um sistema SDMA que possa suportar τ p pilotos. Este valor
determina as combinações de M e K que podem ser suportadas. O protocolo TDD suporta até
K=τ p UEs e um arbitrário M. O protocolo FDD suporta qualquer M e K tal que
( M + K + max ( M , K ) )
≤ τ p .. Os pontos de operação suportados por esses protocolos são
2
ilustrados na Figura 1.22 para τ p =20 . A área sombreada indica M≥4K, que são os pontos de
operação atrativos para o SDMA, conforme discutido na Seção 1.3.3 (veja, por exemplo, os
resultados na Figura 1.17). A compensação entre antenas e UEs causada pelo protocolo FDD
leva a uma intersecção muito limitada com a área sombreada. Em contraste, o protocolo TDD é
totalmente escalável em relação a M e o número de pilotos limita apenas quantos UEs podem
ser suportados. Qualquer número de antenas pode ser usado, mas de preferência nós
selecionamos um dos muitos pontos operacionais que estão na área sombreada.

Em resumo, os sistemas SDMA devem idealmente ser combinados com TDD, explorando a
reciprocidade entre os canais UL e DL. Isso ocorre porque a sobrecarga de aquisição de canal
( M+ K + max ( M , K ) )
necessária em TDD é K, enquanto é em FDD. A sobrecarga de FDD é
2
cerca de 50% maior quando M ≈ K , embora seja muito maior para M ≫ k , que é o
regime operacional preferível para SDMA. Note que é a aquisição de canal necessária para a
pré-codificação DL que difere entre TDD e FDD, enquanto a UL funciona essencialmente da
mesma forma.

Comentário 1.5 (parametrizações do canal). Em alguns cenários de propagação, o conjunto de


possíveis respostas de canal M-dimensionais pode ser parametrizado usando muito menos que
os parâmetros M. Um exemplo chave é a propagação de LoS, onde o modelo que usamos em
0
(1.38) depende principalmente do ângulo φ jk entre o BS e o UE. Em vez de transmitir os
pilotos M DL, podemos, no caso LoS, selecionar um conjunto de ângulos igualmente espaçados
entre 0 e π e enviar sinais piloto DL pré-codificados somente nessas direções. Se o número
de tais ângulos for muito menor que M, então este método pode permitir a operação de FDD
com sobrecarga de piloto reduzida e ainda pode fornecer uma boa qualidade de estimativa
[50]. No entanto, as parametrizações do canal LoS exigem que a geometria do array seja pré-
definida e que as antenas sejam calibradas por fase, no sentido de que os desvios de fase
incorridos pelo hardware de radiofreqüência (RF) são conhecidos e podem ser compensados.
Em particular, o modelo em (1.38) é válido apenas para ULAs calibrados por fase. Existem
várias desvantagens na construção de um sistema que depende estritamente de
parametrizações de canal. Uma é que, mesmo que alguns canais UE possam ser
parametrizados eficientemente, pode não existir um único modelo de parametrização de baixa
dimensão que se aplique a todos os canais - é suficiente que uma parte da célula forneça
desbotamento Rayleigh aproximadamente não correlacionado para desencorajar o uso de
parametrização de canal para estimativa DL simplificada. Outra desvantagem é que canais
práticos não são obrigados a seguir um modelo de canal específico. Os canais NLoS podem
consistir em vários componentes de múltiplos caminhos que chegam de diferentes ângulos e
com diferentes rotações de fase, enquanto canais LoS práticos contêm reflexões aleatórias e
espalhamento, além do caminho de LoS determinístico. A operação TDD é geralmente
preferida porque queremos projetar uma rede que possa operar eficientemente em qualquer
tipo de ambiente de propagação, com qualquer geometria de matriz e sem calibração de fase
entre antenas. No entanto, o TDD também tem seus próprios desafios específicos: i) o SNR é
um pouco menor do que no FDD, já que o amplificador de potência é ativado apenas uma
parte do tempo; ii) o hardware do transmissor e do receptor de uma antena deve ser calibrado
para manter a reciprocidade do canal (consulte a Seção 6.4.4 na p. 445 para uma discussão
mais detalhada).

Das könnte Ihnen auch gefallen