Beruflich Dokumente
Kultur Dokumente
A quantidade de comunicações de voz e dados sem fio cresceu em um ritmo exponencial por
muitas décadas. Essa tendência é referida como a lei de Cooper porque o pesquisador sem fio
Martin Cooper [91] percebeu na década de 1990 que o número de conexões de voz e dados
dobrou a cada dois anos e meio, desde as primeiras transmissões sem fio de Guglielmo
Marconi em 1895. Isso corresponde a uma taxa de crescimento anual de 32%. Olhando para o
futuro, o Ericsson Mobility Report prevê uma taxa de crescimento anual composta de 42% no
tráfego de dados móveis de 2016 a 2022 [109], o que é ainda mais rápido do que a lei de
Cooper. A demanda por conectividade de dados sem fio continuará definitivamente
aumentando no futuro previsível; por exemplo, uma vez que a fidelidade do vídeo está em
constante crescimento, uma vez que é provável que surjam novos serviços obrigatórios e
porque estamos nos movendo para uma sociedade em rede, onde todos os dispositivos
eletrônicos se conectam à Internet. Uma questão importante é como evoluir as atuais
tecnologias de comunicações sem fio para atender à demanda continuamente crescente e,
assim, evitar uma iminente crise no tráfego de dados. Uma questão igualmente importante é
como satisfazer as expectativas crescentes de qualidade de serviço. Os clientes esperam que os
serviços sem fio funcionem igualmente bem em qualquer lugar e a qualquer momento, assim
como esperam que a rede elétrica seja robusta e esteja constantemente disponível. Para
acompanhar uma taxa de crescimento exponencial do tráfego e, ao mesmo tempo, fornecer
conectividade onipresente, os pesquisadores industriais e acadêmicos precisam transformar
cada pedação para projetar novas tecnologias revolucionárias de rede sem fio. Esta monografia
explica o que é a tecnologia MIMO (Multiple-Input Multiple-Output) e por que ela é uma
solução promissora para lidar com um volume de tráfego de dados 4 sem fio de várias ordens de
magnitude maior do que as tecnologias atuais.
O conceito de celular para redes de comunicação sem fio é definido na Seção 1.1, que também
discute como evoluir a tecnologia de rede atual para acomodar mais tráfego. A seção 1.2
define a noção de eficiência espectral (SE) e fornece resultados teóricos de informações básicas
que servirão de base para uma análise posterior. Diferentes maneiras de melhorar o SE são
comparadas na Seção 1.3, o que motiva o design do MIMO Massivo. Os pontos-chave estão
resumidos na Seção 1.4.
1.1 Redes Celulares
A comunicação sem fio é baseada em rádio, o que significa que as ondas eletromagnéticas
(EM) são projetadas para transportar informações de um transmissor para um ou vários
receptores. Como as ondas EM se propagam em todas as direções possíveis a partir do
transmissor, a energia do sinal se espalha e menos energia atinge o receptor desejado à
medida que a distância aumenta. Para fornecer serviços sem fio com energia de sinal recebido
suficientemente alta em áreas de ampla cobertura, os pesquisadores da Bell Labs postularam
em 1947 que uma topologia de rede celular é necessária [277]. De acordo com essa idéia, a
área de cobertura é dividida em células que operam individualmente usando uma estação base
de localização fixa; isto é, um equipamento de rede que facilita a comunicação sem fio entre
um dispositivo e a rede. O conceito celular foi desenvolvido e analisado nas décadas
subsequentes [291, 116, 204, 364] e posteriormente implantado na prática. Sem dúvida, o
conceito de celular foi um grande avanço e tem sido o principal impulsionador para fornecer
serviços sem fio nos últimos quarenta anos (desde que a “primeira geração” de sistemas de
telefonia móvel surgiu na década de 80). Nesta monografia, uma rede celular é definida da
seguinte forma.
Definição 1.1 (rede celular). Uma rede celular consiste de um conjunto de estações base (BSs) e
um conjunto de equipamentos de usuário (UEs) (5). Cada UE está conectado a um dos BSs, que
fornece serviço a ele. A ligação descendente (DL- downlink) refere-se a sinais enviados das BSs
para os seus respectivos UEs, enquanto a ligação ascendente (UL- uplink) refere-se a
transmissões dos UEs para os respectivos BSs (6). Embora essa definição especifique a
configuração que estudaremos, ela não cobre todos os aspectos das redes celulares; por
exemplo, para permitir uma transferência eficiente entre células, um UE pode
momentaneamente ser conectado a múltiplos BSs.
(5) Os termos BS e UE provêm dos padrões GSM e LTE, respectivamente, mas são usados nesta monografia
sem qualquer referência a padrões específicos.
(6) Em uma rede celular totalmente cooperativa, chamada de rede MIMO [126] ou sistema sem célula
[240], todas as BSs são conectadas a um site de processamento central e são usadas para servir
conjuntamente a todos os UEs na rede. Neste caso, o DL (UL) refere-se a sinais transmitidos de (para)
todos os BSs para (de) cada UE. Essa rede celular não é o foco desta monografia, mas os sistemas livres de
células são brevemente descritos na Seção 7.4.3 na p. 509
Figura 1.1: Uma rede celular básica, onde cada BS cobre uma área geográfica distinta e fornece serviço a todos os
UEs dentro dela. A área é chamada de “célula” e é ilustrada com uma cor distinta. A célula pode consistir em todas
as localizações geográficas onde esta BS fornece o sinal DL mais forte.
Uma ilustração de uma rede celular é fornecida na Figura (1.1). Essa monografia enfoca os links
de comunicação sem fio entre BSs e UEs, enquanto a infraestrutura de rede restante (por
exemplo, fronthaul, backhaul e core core) é assumida como funcionando perfeitamente.
Existem vários ramos de tecnologias sem fio atualmente em uso, como a família IEEE 802.11
para redes locais sem fio WiFi (WLANs), a família 3GPP (3rd Generation Partnership Project)
com GSM / UMTS / LTE para comunicações móveis [128], e a família 3GPP2 concorrente com
IS-95 / CDMA2000 / EV-DO. Alguns padrões dentro dessas famílias são evoluções uns dos
outros, otimizados para o mesmo caso de uso, enquanto outros são projetados para diferentes
casos de uso. Juntos, eles formam uma rede heterogênea composta de duas camadas
principais:
1. Camada de cobertura: Consiste em BSs celulares externos que fornecem cobertura de área
ampla, suporte de mobilidade e são compartilhados entre muitos UEs;
O termo “heterogêneo” implica que esses dois níveis coexistem na mesma área. Em particular,
os BSs de hotspot são implantados para criar pequenas células (SCs) dentro da área de
cobertura das BSs celulares, conforme ilustrado na Figura 1.2. Os dois níveis podem utilizar o
mesmo espectro de freqüência, mas, na prática, é comum usar espectro diferente para evitar a
coordenação entre níveis; por exemplo, a camada de cobertura pode usar LTE e operar na faixa
de 2,1 GHz, enquanto a camada de ponto de acesso pode usar WiFi na faixa de 5 GHz.
Figura 1.2: As redes sem fio atuais são heterogêneas, já que uma camada de SCs é implantada para descarregar o
tráfego da camada de cobertura. BSs na camada de cobertura e na camada de hotspot são representados de forma
diferente, conforme mostrado na figura. Para melhorar o rendimento da área do nível de cobertura, é
particularmente importante aumentar o SE, porque a densificação e o uso de largura de banda adicional em
freqüências mais altas degradariam o suporte e a cobertura da mobilidade.
As redes celulares foram originalmente projetadas para comunicações de voz sem fio, mas são
as transmissões de dados sem fio que dominam hoje em dia [109]. O vídeo sob demanda
representa a maior parte do tráfego em redes sem fio e também é o principal impulsionador
do aumento previsto na demanda de tráfego [86]. A taxa de transferência de área é, portanto,
uma métrica de desempenho altamente relevante de redes celulares atuais e futuras. É
medido em bit / s / km 2 e pode ser modelado usando a seguinte fórmula de alto nível: Taxa de
Esses são os três principais componentes que determinam a taxa de transferência da área, e
que precisam ser aumentados para alcançar uma maior taxa de transferência de área nas
futuras redes celulares. Esse princípio se aplica ao nível de cobertura, bem como ao nível do
ponto de acesso. Com base em (1.1), pode-se pensar na taxa de transferência da área como
sendo o volume de uma caixa retangular com os lados B, D e SE; veja a Figura 1.3. Há uma
dependência inerente entre esses três componentes no sentido de que a escolha da faixa de
freqüência e da densidade celular afeta as condições de propagação; por exemplo, a
probabilidade de ter um canal de linha de visão (LoS) entre o transmissor e o receptor (e entre
os interferentes fora da célula e o receptor), as perdas médias de propagação, etc. No entanto,
pode-se tratar esses três componentes independentes como uma aproximação de primeira
ordem para obter informações básicas. Consequentemente, existem três maneiras principais
de melhorar a taxa de transferência de área das redes celulares:
O principal objetivo desta seção é demonstrar como podemos alcançar grandes melhorias no
SE. Essas percepções são então utilizadas na Seção 2, p. 216 para definir a tecnologia Massive
MIMO.
Figura 1.3: A taxa de transferência da área pode ser calculada de acordo com (1.1) como o volume de uma caixa
retangular onde a largura de banda, densidade média da célula e SE são o comprimento de cada lado.
Suponha, por questão de argumentação, que queremos projetar uma nova rede de celular que
melhore o rendimento da área por um fator de 1000 em relação às redes existentes; isto é,
para resolver “o desafio de dados de 1000 ×” apresentado pela Qualcomm [271]. Observe que
essa rede pode lidar com o aumento de três ordens de magnitude no tráfego de dados sem fio
que ocorrerá nos próximos 15 a 20 anos, se a taxa de crescimento anual do tráfego continuar
na faixa de 41% a 59%. Como podemos lidar com um crescimento de tráfego tão grande de
acordo com a fórmula em (1.1)?
Uma solução potencial seria aumentar a largura de banda B em 1000 ×. As redes celulares
atuais utilizam coletivamente mais de 1 GHz de largura de banda na faixa de freqüência abaixo
de 6 GHz. Por exemplo, as operadoras de telecomunicações na Suécia têm licenças para mais
de 1GHz de espectro [65], enquanto o número correspondente nos EUA é de cerca de 650MHz
[30]. Um espectro adicional de 500MHz está disponível para WiFi [65]. Isso significa que um
aumento de 1000 × corresponde ao uso de mais de 1 THz de largura de banda no futuro. Isso é
fisicamente impraticável, já que o espectro de freqüência é um recurso global que é
compartilhado entre muitos serviços diferentes e também porque envolve o uso de bandas de
frequência muito mais altas do que no passado, o que limita fisicamente a confiabilidade do
intervalo e do serviço. Há, no entanto, larguras de banda substanciais nas bandas de
comprimento de onda milimétrico (mmWave) (por exemplo, na faixa de 30 a 300 GHz) que
podem ser usadas para aplicações de curto alcance. Essas bandas de mmWave são atraentes
na camada de hotspot, mas menos na camada de cobertura, pois os sinais nessas freqüências
são facilmente bloqueados por objetos e corpos humanos e, portanto, não podem fornecer
uma cobertura robusta.
Outra solução potencial seria adensar a rede celular implantando 1.000 × mais BSs por km 2. As
distâncias inter-BS no nível de cobertura atualmente são de algumas centenas de metros em
áreas urbanas e os BSs são implantados em locais elevados para evitar serem sombreados por
objetos e edifícios grandes. Isso limita o número de locais onde BSs podem ser implantados na
camada de cobertura. É difícil densificar sem mover BSs para mais perto dos UEs, o que leva a
maiores riscos de estar em sombras profundas, reduzindo assim a cobertura. A implantação de
pontos de acesso adicionais é uma solução mais viável. Embora o Wi-Fi esteja disponível em
quase toda parte nas áreas urbanas, a distância média inter-BS no nível do hotspot pode
certamente diminuir para dezenas de metros no futuro. Reutilizar o espectro da camada de
cobertura ou usar as bandas mmWave nesses SCs também pode trazer melhorias substanciais
na taxa de transferência da área [197]. No entanto, esta solução está associada a altos custos
de implantação, problemas de interferência entre células [19] e não é adequada para UEs
móveis, que teriam que trocar de BS com muita frequência. Observe que mesmo sob uma
densificação substancial do nível do ponto de acesso (hotspot), o nível de cobertura ainda é
necessário para suportar a mobilidade e evitar furos de cobertura.
Figura 1.4: Exemplos de maneiras diferentes de alcançar uma melhoria de 1.000 × no rendimento da área. Cada lado da caixa
retangular representa um fator de melhoria em B, D ou SE em (1.1), e sua multiplicação (ou seja, o volume) é igual a 1000 ×.
Observação 1.1 (MIMO massivo versus SCs em bandas mmWave). Esta monografia se
concentra no nível de cobertura, que continuará sendo o nível mais desafiador no futuro, uma
vez que deve fornecer cobertura onipresente, oferecer suporte à mobilidade e,
simultaneamente, fornecer uma qualidade de serviço uniforme dentro de cada célula. Tudo
isso deve ser alcançado sem qualquer densificação substancial ou uso do espectro da
mmWave, porque isso inevitavelmente resultaria em uma cobertura desigual. É por isso que
grandes melhorias no SE são necessárias. Vamos demonstrar que o Massive MIMO pode
entregar isso. Em contraste, o principal objetivo do nível do ponto de acesso é reduzir a
pressão no nível de cobertura ao descarregar uma grande parte do tráfego dos UEs de baixa
mobilidade. Uma vez que apenas as comunicações de melhor esforço de curto alcance devem
ser suportadas, essa camada pode ser aprimorada por densificação direta de células e pelo uso
de larguras de banda grandes disponíveis nas bandas mmWave. O uso de MIMO Massive em
bandas mmWave será discutido na Seção 7.5 na p. 522, enquanto a combinação de MIMO
Massivo e SCs é considerada na Seção 7.6 na p. 527.
Agora, fornecemos uma definição de SE para um canal de comunicação com uma largura de
banda de B Hz. O teorema de amostragem de Nyquist-Shannon implica que o sinal de
comunicação limitado pela banda que é enviado através deste canal é completamente
determinado por amostras de 2B de valor igual espaçadas por segundo [298]. Ao considerar a
representação de banda-base complexa do sinal, as amostras com valor de complexo B por
segundo são a quantidade mais natural [314]. Essas amostras B são os graus de liberdade
disponíveis para projetar o sinal de comunicação. O SE é a quantidade de informação que pode
ser transferida de forma confiável por amostra de valor complexo.
A partir dessa definição, fica claro que o SE é um número determinístico que pode ser medido
em bit por amostra de valor complexo. Como há amostras B por segundo, uma unidade
equivalente do SE é bit por segundo por Hertz, geralmente escrita em formato abreviado como
bit / s / Hz. Para canais de desvanecimento, que mudam com o tempo, o SE pode ser visto
como o número médio de bit / s / Hz sobre as realizações de desvanecimento, como será
definido abaixo. Nesta monografia, muitas vezes consideramos o SE de um canal entre um UE e
um BS, que, por simplicidade, nos referimos como “SE do UE”. Uma métrica relacionada é a
taxa de informação [bit / s], que é definida como o produto do SE e da largura de banda B.
Além disso, geralmente consideramos a soma SE dos canais de todos os UEs em uma célula
para a respectiva BS. que é medido em bit / s / Hz / cell.
O canal entre um transmissor e um receptor em determinados locais pode suportar muitos SEs
diferentes (dependendo do esquema de codificação / decodificação escolhido), mas o maior SE
alcançável é de fundamental importância ao projetar sistemas de comunicação. O SE máximo é
determinado pela capacidade do canal, que foi definida por Claude Shannon em seu artigo
seminal [297] de 1948. O teorema a seguir fornece a capacidade para o canal ilustrado na
Figura 1.5.
Figure 1.5: A general discrete memoryless channel with input x and output y.
Teorema 1.1 (capacidade do canal). Considere um canal discreto sem memória com entrada x e
saída y, que são duas variáveis aleatórias. Qualquer SE menor ou igual à capacidade do canal é
alcançável com probabilidade de erro arbitrariamente baixa, enquanto valores maiores não
podem ser alcançados. O supremo é tomado em relação a todas as distribuições de entrada
possíveis f (x), enquanto H (y) é a entropia diferencial da saída e H (y | x) é a entropia
diferencial condicional da saída dada a entrada.
Figura 1.6: Um canal discreto sem memória com entrada x e saída y = hx + n, onde h é a resposta do canal e n é
ruído gaussiano independente.
Corolário 1.2. Considere um canal discreto sem memória com entrada e saída dada
por: y=hx +n (1.3)
O canal considerado no Corolário 1.2 é chamado de canal de entrada única de entrada única
(SISO) porque um sinal de entrada é enviado e resulta em um sinal de saída. Uma restrição de
poder média é assumida no corolário e ao longo desta monografia, mas outras restrições
também existem na prática; veja a observação 7.1 na pág. 460 para uma discussão mais
aprofundada. O significado prático da capacidade do canal pode ser descrito considerando-se a
transmissão de uma sequência de informação com N entradas escalares, geradas por um
processo estocástico ergódico, sobre o canal discreto sem memória no Corolário 1.2. Se a
entrada escalar tiver um SE menor ou igual à capacidade, a sequência de informação pode ser
codificada de tal forma que o receptor possa decodificá-la com uma probabilidade de erro
arbitrariamente baixa como N → ∞ . Em outras palavras, um retardo de decodificação
infinito é necessário para atingir a capacidade. O trabalho seminal em [267] quantifica quão
próxima a capacidade pode ser abordada em um comprimento finito da seqüência de
informações. O SE é geralmente uma métrica de bom desempenho sempre que blocos de
dados de milhares de bits são transmitidos [50].
7A capacidade de um canal de desvanecimento requer que a transmissão abranja assintoticamente
muitas realizações da variável aleatória que descreve o canal. Isto é referido como a capacidade ergódica,
uma vez que um processo de desvanecimento aleatório ergódico estacionário é necessário se as
propriedades estatísticas forem dedutíveis de uma única sequência de realizações de canal. Cada
realização de canal é usada para um número predeterminado e finito de sinais de entrada, então uma
nova realização é retirada do processo aleatório.
As expressões de capacidade em (1.4) e (1.5) têm uma forma que é típica para comunicações:
o logaritmo de base dois de um mais a expressão parecida com relação sinal-ruído (SNR)
Potência de ruído
Este é o SNR mensurável real para uma resposta de canal determinístico h, enquanto é o SNR
instantâneo para uma dada realização de canal quando h é aleatório. Como o SNR flutua no
último caso, é mais conveniente considerar o SNR médio ao descrever a qualidade de um canal
de comunicação. Nós definimos o SNR médio como
Figura 1.7: Um canal de interferência discreto sem memória com entrada xe saída y = hx + v + n, onde h é a resposta
do canal, n é ruído gaussiano independente e é a interferência, que não é correlacionada com a entrada e o canal.
Corolário 1.3 Considere um canal de interferência discreto sem memória com entrada e
saída dada por
onde é ruído independente, a resposta do canal é conhecida na
2
saída e é interferência aleatória. A entrada é limitada por energia como E {|x| ≤ p } .
Suponha que seja uma realização da variável aleatória e que seja uma variável
aleatória com realização u que afeta a variância de interferência. As realizações dessas
variáveis aleatórias são conhecidas na saída. Se o ruído n é condicionalmente
independente de h e v , a interferência tem uma média condicional de zero (isto é,
) e variância condicional denotada por ,e a
interferência é condicionalmente não correlacionada com a entrada (ou seja,
), então a capacidade do canal ergódico (C) é limitada de baixo como onde
a expectativa é tomadas em relação aheu, e o limite é obtido usando a distribuição de entrada
.
8
Quando transmitir uma seqüência de informações sobre este canal de desvanecimento, uma sequência
de realizações de H e U é criada, formando processos aleatórios ergódicos estacionários. Cada conjunto de
realizações (h, u) é usado para um número predeterminado e finito de sinais de entrada, então um novo
conjunto de realizações é obtido dos processos aleatórios.
Utilizamos expressões SE do tipo no Corolário 1.3 ao longo desta monografia e enfatizamos que
estas podem não ser as SEs mais altas possíveis, mas SEs que podem ser alcançadas pelo
processamento de sinais de baixa complexidade no receptor, onde a interferência é tratada
como ruído. As expressões SE em (1.9) e (1.10) têm uma forma típica para comunicações sem
fio: o logaritmo de base um de dois mais a expressão que pode ser interpretada como a relação
sinal-interferência-mais-ruído (SINR). Formalmente, isso é apenas um SINR quando h e
pv são determinísticos; a expressão é aleatória. Para simplificar, nos referiremos a qualquer
termo a que aparece como em uma expressão SE como um SINR
instantâneo (com pequeno abuso de terminologia).
Existem diferentes maneiras de melhorar o SE por célula nas redes celulares. Nesta seção,
compararemos diferentes abordagens para demonstrar quais são as mais promissoras. Por
simplicidade, consideramos uma rede de duas células onde o ganho médio de canal entre uma
BS e cada UE em uma célula é idêntico, como ilustrado na Figura 1.8. Este é um modelo tratável
para estudar as propriedades básicas das comunicações celulares, devido ao pequeno número
de parâmetros do sistema. É uma instância do modelo de Wyner, proposta inicialmente por
Aaron Wyner em [353] e estudada para canais de desvanecimento em [304]. Tem sido
amplamente utilizado para estudar as propriedades fundamentais da informação teórica das
redes celulares; veja a monografia [303] e referências nela. Modelos de rede mais realistas,
mas menos tratáveis, serão considerados em seções posteriores.
No cenário UL mostrado na Figura 1.8, os UEs na célula 0 transmitem para sua BS de serviço,
enquanto os sinais UL dos UEs na célula 1 vazam para a célula 0 como interferência. O ganho
0
médio de canal de um UE na célula 0 para a sua porção BS é indicado por β 0 , enquanto os
0
sinais de interferência dos UE na célula 1 têm um ganho médio de canal de β 1 . Do mesmo
modo, o ganho médio de canal de um UE na célula 1 para a sua porção BS é indicado por
β 11 , enquanto os sinais de interferência dos UE na célula 0 têm um ganho médio de canal de
1
β 0 ,. Observe que o sobrescrito indica a célula da BS receptora e o subscrito indica a célula
na qual reside o UE transmissor. Os ganhos médios de canal são grandezas adimensionais
positivas que são frequentemente muito pequenas, pois a energia do sinal decai rapidamente
com a distância de propagação; valores na faixa de −70 dB a −120 dB são comuns dentro da
célula servidora, enquanto valores menores ainda aparecem para sinais de interferência. Como
mostrado mais adiante, não são os valores absolutos que são de importância principal ao
computar o SE, mas a força relativa da interferência em comparação com os sinais desejados.
0 1
Para simplificar, lembre-se de que os ganhos do canal intracelular são iguais (isto é, β 0=β 1 )
1 0
e que os ganhos do canal inter-células são igualmente iguais (isto é, β 0=β 1 )); isso é
comumente assumido no modelo de Wyner. Podemos, então, definir a razão β́ entre os
ganhos do canal intercelular e intracelular como
Figura 1.8: Ilustração da noção de sinais UL desejados e interferentes em uma rede de duas células. No modelo
0
Wyner, cada UE na célula 0 tem o mesmo valor do ganho médio de canal β0 da sua porção BS e do ganho
1 0
médio de canal β 0 para a outra célula BS, enquanto que cada UE na célula 1 tem o mesmo valor de β1 e
1
β 1 .
Suponha que haja um UE ativo por célula e que cada BS e UE esteja equipado com uma única
antena. Observe que com "antena" nos referimos a um componente com um tamanho menor
que o comprimento de onda (por exemplo, uma antena de patch) e não o tipo de antenas
grandes de alto ganho que são usadas nas BSs em redes celulares convencionais. Antenas e
matrizes de antenas são discutidas na Seção 7.4, p. 500
Concentrando-se em um canal sem fio flat-fading9, o sinal de banda base complexo samplado
em símbolo recebido na BS na célula 0 é
9 Nos canais de atenuação plana, a largura de banda de coerência do canal é maior do que a largura de
banda do sinal [314]. Portanto, todos os componentes de freqüência do sinal terão a mesma magnitude
de desvanecimento, resultando em uma resposta de canal escalar.
Em geral, a resposta do canal também terá uma rotação de fase, mas é negligenciada aqui, pois
0
não afeta o SE. O ganho de canal β i pode ser interpretado como o desvanecimento
macroscópico em grande escala na propagação de LoS, causado por perda de percurso
dependente da distância. O impacto do hardware do transceptor, incluindo os ganhos da
antena, também é absorvido nesse parâmetro. O parâmetro é constante se o transmissor e
receptor estiverem fixos, enquanto muda se o transmissor e / ou receptor se moverem.
Movimentos microscópicos (na ordem do comprimento de onda) podem ser modelados como
0
rotações de fase em hi , enquanto grandes movimentos (na ordem de metros) levam a
0
mudanças substanciais em β i . Consideramos um valor fixo de h0i para aplicar a
expressão SE no Corolário 1.3 para canais determinísticos.
conforme validado pelas medições do canal relatadas em [337, 177, 83, 365]. O sinal
transmitido alcança o receptor através de muitos caminhos diferentes e os sinais recebidos
sobrepostos podem reforçar ou cancelar um ao outro. Quando o número de caminhos é
grande, o teorema do limite central motiva o uso de uma distribuição gaussiana. Este
fenómeno é conhecido como desvanecimento em pequena escala e é um efeito microscópico
causado por pequenas variações no ambiente de propagação (por exemplo, movimento do
0
transmissor, receptor ou outros objetos). Em contraste, a variância β i é interpretada como
o desvanecimento macroscópico em grande escala, que inclui perda de trajetória dependente
da distância, sombreamento, ganhos de antena e perdas de penetração na propagação de
NLoS. O modelo de canal em (1.16) é chamado de desvanecimento de Rayleigh, porque a
0
magnitude ¿ hi ∨¿ é uma variável aleatória distribuída Rayleigh.
Lema 1.4. Suponha que o BS na célula 0 conhece as respostas do canal. Um UL (11) alcançável
para o UE desejado no caso LoS é
com β́ e SNR0 dados por (1.12) e (1.13), respectivamente. No NLoS caso (com β́ ≠ 1 ),
um UL SE alcançável é
Este lema mostra que o SE é totalmente caracterizado pelo SNR do sinal desejado, SNR 0, e a
força relativa da interferência entre células, β́ . Observe que a expressão NLoS de formato
fechado em (1.18) aplica-se apenas a β́ ≠ 1 . Lembre-se de que 0 ≤ β́ ≤1 é o intervalo
típico de β́ . O caso patológico β́=1 representa um cenário de borda celular onde os
sinais desejados e interferentes são igualmente fortes. Uma expressão alternativa pode ser
derivada para β́=1 usando a mesma metodologia da prova do Lema 1.4, mas ela não
fornece mais informações e, portanto, é omitida.
O SE é naturalmente uma função crescente do SNR, que é mais facilmente visto a partir da
expressão LoS em (1.17), onde o SE é o logaritmo da seguinte expressão SINR:
11 Chave que um SE é realizável se existir uma sequência de códigos tal que a probabilidade máxima
de erro na transmissão para qualquer mensagem de comprimento N converta para zero como
N → ∞ [94]. Qualquer SE menor ou igual à capacidade é assim possível
Figura 1.9: UL SE média como uma função do SNR para diferentes casos de força de interferência entre células,
β́ ∈ {−10,−30 }dB e diferentes modelos de canal.
onde o limite é completamente determinado pela força da interferência. Isto deve-se ao facto
de o UE desejado e o UE interferente aumentarem as suas capacidades de transmissão, o que é
o caso do interesse nas redes celulares, uma vez que uma boa qualidade de serviço deve ser
garantida em todas as células. O limite correspondente no caso NLoS é
o que pode ser provado expandindo as integrais exponenciais em (1.18) usando a identidade
em [3, Eq. (5.1.11)] e depois tomando o limite p→ ∞
Para exemplificar esses comportamentos, a Figura 1.9 mostra o SE como uma função do SNR,
onde um aumento de SNR é interpretado como aumentando a potência de transmissão p.
Consideramos duas forças diferentes da interferência intercelular: β́=−10 dB e
β́=−30 dB . O SE converge rapidamente para o log de LoS log 2 (1+1/ β́) ≈ 3.46 bit / s /
Hz e o limite NLoS log 2 (1/ β́ )/(1− β́ )≈ 3.69 bit / s/ Hz no primeiro caso , uma vez que a
interferência é apenas 10 dB mais fraca que o sinal desejado. No caso de β́=−30 dB , a
convergência para o limite de LoS de 9,97 bit / s / Hz e limite NLoS de 9,98 bit / s / Hz é menos
visível na faixa de SNR considerada, uma vez que a interferência é mais fraca e o logaritmo
torna o SE cresce lentamente. No entanto, notamos que passar de SNR 0 = 10 dB para SNR0 = 30
dB apenas duplica o SE, embora 100 vezes mais energia de transmissão seja necessária. O caso
NLoS fornece um SE ligeiramente menor que o caso LoS para a maioria dos SNRs, devido às
2
flutuações aleatórias da magnitude quadrada |h00| do canal. No entanto, a aleatoriedade se
transforma em uma pequena vantagem em SNR alto, onde o limite é ligeiramente maior em
NLoS porque a interferência pode ser muito mais fraca do que o sinal para algumas realizações
de canal. Este comportamento é visto para β́=−10 dB na Figura 1.9, enquanto ocorre em
SNRs maiores para β́=−30 dB .
Em resumo, o aumento do SNR usando mais potência de transmissão melhora o SE, mas o
efeito positivo rapidamente leva a rede a um regime de interferência limitada, onde nenhum
SE extraordinário pode ser obtido. Isso é basicamente devido à falta de graus de liberdade na
BS, que não podem separar o sinal desejado da interferência de uma única observação(12)
Esse regime de interferência limitada é onde a camada de cobertura opera nas redes atuais,
enquanto a situação para a O nível de hotspot depende de como os BSs são implantados. Por
exemplo, os sinais nas frequências mmWave são bastante atenuados por paredes e outros
objetos. Um SC mmWave normalmente cobre uma área muito limitada, mas, por outro lado, a
célula pode ser limitada por ruído, uma vez que os sinais de interferência dos SCs em outras
salas também são atenuados pelas paredes. O intervalo de SE na Figura 1.9 é comparável ao
que as redes contemporâneas fornecem (por exemplo, 0-5 bit / s / Hz em LTE [144]). Portanto,
uma abordagem simples de escalonamento de poder não pode contribuir muito para alcançar
um maior SE nas redes celulares.
12 O esquema de transmissão considerado neste exemplo não é o ideal. Os UEs podem se revezar na
transmissão, alcançando assim um SE que cresce sem limite, mas com um fator pré-log de 1/2 se
cada UE estiver ativo em 50% do tempo. Mais geralmente, os métodos de alinhamento de
interferência podem ser usados para lidar com a interferência [70].
Para analisar o SE desse canal UL de entrada única de múltiplas saídas (SIMO) com
interferência intercelular, precisamos estender os modelos de propagação para o caso de
múltiplas antenas. No caso de LoS, consideramos um arranjo linear uniforme horizontal (ULA)
com espaçamento de antena dH ∈ ( 0, 0.5 ] , que é medido no número de comprimentos de
onda entre antenas adjacentes. Portanto, λ se denota o comprimento de onda na
freqüência portadora, o espaçamento da antena é medidores λdH Os modelos de canal
para outras geometrias de matriz são considerados na Seção 7.3 na página 482. Supomos
também que os UEs estão localizados em locais fixos no campo distante do arranjo BS, o que
leva aos seguintes determinísticos: resposta do canal [254]:
No caso da NLoS, supomos por enquanto que a resposta do canal não é correlacionada sobre a
matriz. Isso produz
i
onde β 0 descreve o desvanecimento macroscópico em grande escala, enquanto a
aleatoriedade e a distribuição gaussiana são responsáveis pelo desvanecimento em pequena
escala. Este modelo de canal é chamado desvanecimento de Rayleigh não correlacionado ou
desvanecimento de Rayleigh independente e identicamente distribuído (i.i.d.), uma vez que os
i
elementos em h0 não são correlacionados (e também são independentes) e possuem
magnitudes distribuídas de Rayleigh. O desvanecimento Rayleigh não correlacionado é um
modelo tratável para condições de dispersão ricas, em que o arranjo BS é cercado por muitos
objetos de dispersão, em comparação com o número de antenas. Vamos usá-lo para descrever
as propriedades básicas desta seção, enquanto um modelo mais geral e realista é apresentado
na Seção 2.2, p. 222 e depois usado no restante da monografia. A modelagem de canais é
discutida mais adiante na Seção 7.3, p. 482. O modelo de propagação NLoS com
desvanecimento Rayleigh não correlacionado é ilustrado na Figura 1.11. Observe que o ganho
i
médio do canal β 0 é, por simplicidade, assumido como sendo o mesmo para todas as
antenas BS. Esta é uma aproximação razoável quando a distância entre o BS e o UE é muito
maior que a distância entre as antenas BS. No entanto, na prática, pode haver vários decibéis
de variações de ganho de canal entre as antenas [122]. Este fato é negligenciado nesta seção,
mas tem um forte impacto no SE quando M é grande; veja a Seção 4.4 na p. 335 para mais
detalhes.
Figura 1.11: Propagação de NLoS com desvanecimento de Rayleigh não correlacionado entre um UE de antena única
transmissora e um BS equipado com uma matriz de antenas M. O caminho LoS é bloqueado, mas o sinal encontra
vários outros caminhos através de projetos de dispersão. A BS está rodeada por muitos objetos de dispersão, de
modo que a localização do UE não tem impacto na diretividade espacial do sinal recebido.
A combinação de recepção é uma projeção linear, que transforma o canal SIMO em um canal
SISO efetivo que pode suportar SEs mais altos do que no caso de antena única, se o vetor de
combinação for selecionado criteriosamente. Existem muitos esquemas de combinação
diferentes, mas um simples e popular é a combinação de taxa máxima (MR), definida como
Lema 1.5. Suponha que o BS na célula 0 saiba as respostas do canal e aplique MR combinando
ao sinal recebido em (1.22). Um UL SE alcançável para o UE desejado no caso LoS é
Este lema mostra que o SE é caracterizado pela SNR do sinal desejado, SNR 0, a força da
interferência intercelular β́ , e o número de antenas BS, M. Observe que, tendo M
recebendo antenas, a matriz coleta M vezes mais energia dos sinais desejados e interferentes,
e também do ruído. No caso de LoS em (1.27), o ganho do sinal desejado é escalonado como
M. O escalonamento linear com o número de antenas é chamado ganho de matriz. Mostra que
MR combina coerentemente toda a energia recebida do sinal desejado, porque o vetor de
combinação é combinado com a resposta do canal do UE desejado. Em contraste, MR combina
o ruído e os componentes do sinal de interferência de maneira não coerente no array, já que v0
1 0 0
é independente de h0 e n0. Como conseqüência, o poder de interferência β́ g( φ0 , φ1 )
em (1.27) pode ser limitado em cima como
0 0
quando sin( φ0 )≠ sin(φ1) , que diminui como 1 / M quando mais antenas são adicionadas.
A razão básica pela qual a combinação MR rejeita o sinal de interferência é que as antenas M
fornecem BS com graus espaciais M de liberdade, que pode ser usado para separar o sinal
0 0
desejado do sinal interferente. Em particular, as direções das respostas do canal LoS h0 e h 1
e gradualmente se tornam ortogonais à medida que M aumenta. Esta propriedade é chamada
de propagação (assintoticamente) favorável [245 ], uma vez que os UEs com canais ortogonais
podem se comunicar com a BS simultaneamente sem causar interferência mútua, discutiremos
ainda mais essa propriedade na Seção 1.3.3 e também na Seção 2.5.2 na página 233.
Para ilustrar esses comportamentos, a função g ( φ 00 , φ10 ) é mostrada na Figura 1.12 para um
0
UE desejado no ângulo fixo φ0 =30 ° , enquanto o ângulo do UE interferente é variado entre
-180° e 180°. O espaçamento da antena é dH = 1/2. No caso de antena única, temos
g ( φ 00 , φ10 )=1, independentemente dos ângulos, o que está de acordo com o Lema 1.4.
Quando o BS tem múltiplas antenas, g ( φ 00 , φ10 ) depende fortemente dos ângulos individuais
0
do UE. Há picos de interferência quando os dois UEs têm o mesmo ângulo (isto é, φ1 =30 ° )
e quando os ângulos são reflexos de espelho uns dos outros (isto é,
0
φ1 =180° −30 °=150 ° ). A função é igual a M nesses picos, porque o sinal de interferência
é coerentemente combinado pela combinação de MR (exatamente como o sinal desejado).
Quando o ULA pode resolver os UEs individuais, o nível de interferência diminui rapidamente
(observe a escala vertical logarítmica) e fica geralmente menor à medida que M aumenta.
Nesses casos, o nível de interferência oscila conforme o ângulo do UE interferente é variado,
mas é aproximadamente 1 / M vezes mais fraco que no caso de antena única. Assim, as
múltiplas antenas BS ajudam a suprimir a interferência, desde que os ângulos do UE sejam
suficientemente diferentes.
Figura 1.12: A função g ( φ 00 , φ10 ) em (1.28) que determina o nível de interferência em um cenário LoS. O UE
desejado está no ângulo fixo φ00 =30 ° e o UE interferente tem um ângulo variável
0
φ1 ∈[−180 ° ,180 ° ].
O SE no caso NLoS é mais difícil de interpretar já que a expressão de formato fechado em (1.29)
possui uma estrutura complicada com várias somas e funções especiais. Felizmente, podemos
obter o seguinte limite inferior conveniente que é muito apertado para M ≫ 1 (veja a
Figura 1.14 para uma comparação).
A expressão SE acima pode ser interpretada de forma semelhante à expressão LoS em (1.27); é
o logaritmo de um mais uma expressão SINR onde a potência do sinal aumenta como (M −1).
Um ganho de array linear é assim obtido para os canais LoS e NLoS. É a técnica de limite
inferior usada no Corolário 1.6 que fez a escala de sinal desejada como (M - 1), em vez de M,
que é o ganho de matriz natural obtido com a combinação de MR. No entanto, a diferença é
insignificante quando M é grande. A potência de interferência em (1.32) é independente de M,
em contraste com o caso LoS em (1.27) onde decai como 1 / M. Esse comportamento de
dimensionamento sugere que os canais NLoS fornecem uma propagação menos favorável do
que os canais LoS, mas a realidade é mais complicada. Para exemplificar isso, a Figura 1.13
mostra a função de distribuição cumulativa (CDF) do ganho de interferência relativo.
Figura 1.13: CDF do ganho de interferência relativo em (1,33), usando escala logarítmica no eixo horizontal. A
aleatoriedade no caso NLoS é devida ao desvanecimento de Rayleigh, enquanto é devido a ângulos aleatórios de UE
nos casos de LoS. As porcentagens de realizações quando LoS dá maior ganho de interferência do que NLoS são
indicadas.
A Figura 1.14 mostra a média do SE como uma função do número de antenas BS quando o SNR
do UE desejado é fixado em SNR0 = 0 dB e a força da interferência entre células é ¯ = −10 dB. O
caso LoS considera um ULA com dH = 1/2 e os resultados são calculados sobre diferentes
ângulos independentes de UE, sendo todos uniformemente distribuídos de 0 a 2π. Apesar das
condições bastante ruins de SNR e interferência, a Figura 1.14 mostra que, indo de M = 1 para
M = 10 antenas, pode-se melhorar o SE de 0,8 bit / s / Hz para 3,3 bit / s / Hz. Isso é conseguido
graças ao ganho de matriz fornecido pela combinação de MR. Notamos que o limite inferior na
propagação SE com NLoS no Corolário 1.6 é muito apertado para M> 10. O SE é uma função
monotonicamente crescente de M e cresce sem limite como M → ∞ , em contraste com o
caso de escalonamento de forças analisado na Seção 1.3.2, onde a SE saturou no regime de alta
SNR. Isso é mais uma vez devido à combinação MR, que coleta seletivamente mais energia de
sinal da matriz, sem coletar mais energia de interferência. A diferença entre LoS e NLoS é
insignificante na Figura 1.14 porque o desvanecimento de canal tem um impacto
gradativamente menor na informação mútua entre o sinal transmitido e recebido à medida
que mais antenas são adicionadas [142]. Isso é atribuído à diversidade espacial de ter várias
antenas de recepção que observam realizações de desvanecimento independentes, que
provavelmente não serão quase zero simultaneamente. Este fenômeno é conhecido há muito
tempo; de fato, os primeiros trabalhos [257, 117] sobre a recepção multi antenna focaram no
combate ao desvanecimento do canal. O termo endurecimento de canal foi usado em [142]
para descrever um canal de desvanecimento que se comporta quase deterministicamente
devido à diversidade espacial.
0
Na literatura MIMO Massive [243], um canal hi é dito para fornecer endurecimento de
canal assintótico se
Observação 1.3 (limites físicos de grandes matrizes). O comportamento de escala obtido pela
análise assintótica acima foi validado experimentalmente para números práticos de antenas
[120, 150]. No entanto, é importante notar que a física nos impede de deixar o tamanho da
matriz crescer indefinidamente como M → ∞ , uma vez que o ambiente de propagação é
cercado por um volume finito [281]. Idealmente, podemos cobrir a superfície deste volume
com antenas e negligenciar qualquer absorção, para coletar toda a energia do sinal, mas nunca
podemos coletar mais energia do que foi transmitida. Isso não é um problema quando lidamos
com centenas ou milhares de antenas, já que um ganho “grande” de canal de -60 dB nas
comunicações celulares implica que precisamos de um milhão de antenas para coletar toda a
energia transmitida. Em conclusão, o limite M → ∞ não é fisicamente alcançável, mas a
análise assintótica ainda pode ser adequada para investigar o comportamento do sistema em
números de antenas praticamente grandes. Outras distribuições de canal do que o
desvanecimento Rayleigh não correlacionado são, no entanto, necessárias para obter
resultados confiáveis; veja Seção 2.2, p. 222 e Seção 7.3, p. 482 para mais detalhes.
O acesso múltiplo por divisão espacial (SDMA) foi concebido no final da década de 80 e início
dos anos 90 [349, 308, 17, 280, 125, 373] para lidar com a interferência co-usuário em uma
célula usando múltiplas antenas na BS para rejeitar a interferência de processamento espacial.
Múltiplos ensaios de campo foram realizados na década de 1990, usando (pelo menos) até dez
antenas [15, 96, 16]. A capacidade de informação teórica (14) desses sistemas foi caracterizada
no início dos anos 2000 e descrita em [74, 129, 335, 342, 366, 127] para sistemas de células
individuais, onde a terminologia “multiusuário MIMO” foi utilizada. Note que os K UEs são as
múltiplas entradas e as M BS antenas são as múltiplas saídas, assim a terminologia MIMO é
usada independentemente de quantas antenas cada UE está equipado. (15). Extensões de
MIMO multiusuário para redes celulares foram desenvolvidas e pesquisadas em documentos
como [276, 33, 294, 46, 126, 208], mas a capacidade exata é difícil de obter neste caso.
14Quando existem K UE na rede, a noção de capacidade unidimensional convencional generaliza para
uma região de capacidade dimensional K que representa o conjunto de capacidades que os K UEs
podem alcançar simultaneamente. A soma da capacidade representa um ponto nessa região e ganhou
uma tração particular, pois é a métrica unidimensional que descreve a capacidade agregada da rede.
Este e outros pontos de operação estão descritos na Seção 7.1, p. 452
15 A terminologia “multiusuário SIMO” foi usada na década de 1990 para o caso do SDMA com UEs de
antena única [254], mas hoje em dia a terminologia MIMO multiusuário de informação teórica domina
e é adotada nesta monografia.
Vamos agora analisar uma rede celular com transmissão UL SDMA, assumindo que existem K
UE ativos em cada célula, como ilustrado anteriormente na Figura 1.8. A resposta do canal
entre o kth desejado UE na célula 0 e o serviço BS é denotada por para k =1,.. . , K
, enquanto as respostas de canal dos UEs interferentes na célula 1 para a BS na célula 0 são
designadas por para i=1,. .. K Observe que o subscrito ainda indica a identidade
do UE, enquanto o sobrescrito é o índice da BS receptora. O sinal UL multianteno recebido em
(1.22) é então generalizado para
0
onde φ jk ∈¿ é o ângulo de azimute relativo à orientação da matriz BS na célula 0. No caso
NLoS, a resposta de canal correspondente entre UE k na célula j e a BS na célula 0 é definida
como
A finalidade da combinação de recebimento é tornar o sinal desejado muito mais forte do que
a soma de sinais interferentes e ruído. MR combinado com
O caso NLoS no Lema 1.7 generaliza o limite inferior no Corolário 1.6 para K ≥1 e o limite é
apertado para M ≫ 1. Uma expressão de forma fechada exata semelhante a (1.29)
também pode ser obtida, mas contém muitas somas e é omitida, uma vez que não fornece
uma percepção adicional. O ganho do SDMA é facilmente visto a partir de (1,44); há um fator K
na frente do logaritmo que mostra que a soma SE aumenta proporcionalmente ao número de
UEs. Esse fator multiplicativo é conhecido como o ganho de multiplexação e alcançar esse
ganho é o ponto principal com o SDMA. Dentro do logaritmo, a potência do sinal desejado
aumenta linearmente com M, enquanto a potência de interferência intracelular K-1 e a
potência de interferência inter-celular K β́ aumentam linearmente com K. Isso significa
que, à medida que adicionamos mais UEs, podemos neutralizar a interferência crescente,
adicionando uma quantidade proporcional de antenas BS adicionais; mais precisamente,
podemos manter aproximadamente o mesmo SINR por UE, aumentando M em conjunto com K
para manter a relação M / K da antena-UE fixa. Curiosamente, isso significa que mais antenas
são necessárias para suprimir a interferência com MR combinada no caso NLoS do que no caso
LoS, onde M precisa apenas aumentar como √ K . A explicação é que todos os UEs
interferentes causam uma interferência substancial no caso NLoS, enquanto apenas aqueles
com ângulos suficientemente similares ao UE desejado fazem isso no caso LoS (e o intervalo
angular onde isso acontece diminui com M).
Para exemplificar esses comportamentos, a Figura 1.16 mostra a soma média do SE como uma
função do número de UEs por célula, para M = 10 ou M = 100 antenas. A soma SE com MR
combinando é mostrada na Figura 1.16a baseada nas fórmulas analíticas do Lema 1.7,
enquanto as simulações de Monte-Carlo são usadas para M-MMSE combinando na Figura
1.16b. Em ambos os casos, o SNR é fixado em SNR0 = 0 dB e a força da interferência entre as
células é β́=−10 dB . O espaçamento da antena é dH = 1/2 no caso LoS e os resultados são
calculados sobre diferentes ângulos UE independentes, sendo todos uniformemente
distribuídos de 0 a 2 π .
Figura 1.16: Soma UL média em função do número de UEs por célula para esquemas de combinação diferentes,
modelos de canais diferentes e M = 10 ou M = 100 antenas BS. O SNR é SNR0 = 0 dB e a força da interferência entre
as células é β́=−10 dB . A soma SE cresce linearmente com K, desde que M / K permaneça grande. O M-
MMSE rejeita a interferência mais eficientemente do que o MR.
A Figura 1.16 mostra que a soma SE é uma função lentamente crescente de K no caso de M =
10, porque a BS não possui graus de liberdade espacial suficientes para separar os UEs - nem
por MR nem por combinação M-MMSE. O comportamento é completamente diferente quando
M = 100 antenas são usadas, pois a resposta do canal de cada UE é um vetor de 100
dimensões, mas existem apenas 20 UEs por célula, de forma que os canais do UE abrangem
apenas uma pequena porção das dimensões espaciais que o BS pode resolver.
Consequentemente, a soma SE aumenta quase linearmente com o número de UEs e podemos
alcançar uma melhoria de aproximadamente K vezes na soma SE sobre um cenário de usuário
único. Por exemplo, alcançamos um SE de 3,3 bit / s / Hz / célula com (M, K) = (10, 1) usando
MR / MMMSE combinando e podemos aumentá-lo para 71,6 bit / s / Hz / célula com MR e 101
bit / s / Hz / célula com M-MMSE para (M, K) = (100, 20). Isso corresponde a 21 × e 31 × ganhos
em SE, respectivamente. Esses números foram selecionados nas curvas LoS, porque o caso
NLoS mostra alguns comportamentos interessantes que merecem discussão adicional. A soma
SE é consideravelmente menor com NLoS do que com LoS ao usar MR combinando, enquanto
obtemos o resultado oposto ao usar a combinação M-MMSE. A razão para isto é que cada UE é
afectado pela interferência de muitos UEs no caso NLoS, enquanto apenas alguns UE com
ângulos semelhantes causam forte interferência no caso LoS. Se a interferência for ignorada,
como na combinação MR, o SE é menor no caso NLoS devido à maior potência de interferência
de soma. No entanto, é mais fácil para a combinação M-MMSE rejeitar a interferência em NLoS
do que em LoS, onde pode haver alguns UEs com canais que são quase paralelos ao canal do
UE desejado. É por isso que o SE é maior no NLoS ao usar o M-MMSE.
Figura 1.17: Média UL soma SE com M-MMSE combinando como uma função do número de UEs por célula, quando
o número de antenas aumenta com K com diferentes proporções de antena fixa UE M / K. O SNR é SNR0 = 0 dB e a
força da interferência entre as células é β́ = −10 dB. A soma SE cresce à medida que M / K aumenta.
Em resumo, a transmissão UL SDMA pode aumentar a soma SE por célula em mais de uma
ordem de grandeza. Isto é conseguido servindo K UEs simultaneamente e aumentando o
número de antenas BS para alcançar um ganho de matriz que neutraliza o aumento da
interferência. Isto leva a um regime operacional com a relação antena-UE M /K ≥ c , para
alguns valores preferencialmente grandes c, onde podemos fornecer ganhos de dobra-K na
soma SE. Esse é o tipo de melhorias de escalabilidade altamente escalonáveis que são
necessárias para lidar com volumes de dados muito maiores na camada de cobertura das redes
de celular futuras. Note-se que o SE por UE não é drasticamente alterado, pelo que a utilização
de mais espectro ainda é essencial para melhorar a taxa de transferência por UE. Os ganhos da
soma SE são alcançáveis com os canais LoS e NLoS, usando a combinação MR que maximiza o
ganho da matriz ou a combinação M-MMSE que também suprime a interferência para
maximizar o SE. Os esquemas de processamento não linear podem trazer apenas pequenas
melhorias de desempenho no regime operacional preferível e, portanto, não são considerados
no restante desta monografia.
Observação 1.4 (Multianten UEs). Mostramos acima que a transmissão SDMA com muitos UEs
de antena única e um número ainda maior de antenas BS atinge um valor alto SE. O que
aconteceria se os UEs também estivessem equipados com múltiplas antenas? O custo,
tamanho e complexidade de cada UE irão certamente aumentar. O efeito positivo é que um UE
com antenas NUE pode transmitir até N UE fluxos de dados simultâneos para sua BS de serviço.
Do ponto de vista da BS, cada fluxo pode ser tratado como um sinal de um UE “virtual”
separado e o sinal só pode ser distinguido se tiver uma diretividade espacial diferente dos
outros sinais. Isto significa que o vetor que descreve a resposta do canal da BS à enésima
antena de um determinado UE deve ser quase ortogonal às respostas do canal das outras
antenas (para n = 1, ..., NUE). Na propagação de NLoS, isto é conseguido quando as antenas de
UE observam realizações de canal aleatório quase não correlacionadas, o que é possível em um
ambiente de dispersão rico com um espaçamento de antena adequado. A ortogonalidade do
canal é muito mais difícil de conseguir na propagação de LoS, uma vez que o ângulo entre a BS
e um UE no campo distante é aproximadamente o mesmo para todas as antenas no UE;
lembre-se de (1.28) que o produto interno g(φ , ψ ) entre as respostas do canal LoS com
ângulos φ e ψ é grande sempre que φ ≈ ψ . Assim, o benefício de enviar múltiplos
sinais de dados não pode ser explorado em ambientes de propagação com apenas um caminho
LoS dominante. O UE pode, no entanto, obter um ganho de matriz adicional proporcional ao
NUE combinando coerentemente os sinais sobre as antenas NUE, se conhecer as respostas do
canal. Esta monografia se concentra em UEs de antena única, mas os resultados podem ser
facilmente aplicados a UEs de antena N UE, visualizando-os como UEs virtuais NUE que
transmitem NUE sinais separados, representando diferentes fluxos de dados. O documento
[194] considera UEs multiantena e mostra que o SE é maximizado quando um número
particular de fluxos de dados é recebido / transmitido por célula (ver Secção 7.2.2 na p. 474
¿
para uma discussão adicional). Suponha que este número de fluxos seja K Stream e que cada
UE seja alocado como muitos fluxos como tem antenas. A análise em [194] indica que
aproximadamente a mesma soma SE é obtida quando se tem K UEs que estão equipados com
antenas NUE e quando têm UEs de antena única N UEK. Assim, a vantagem distinta de ter
¿
múltiplas antenas de UE ocorre com baixa carga de usuário, K < K Stream , onde a única
maneira de enviar todos os fluxos K ¿Stream é atribuir múltiplos fluxos por UE.
Esta seção concentrou-se até agora no UL, onde identificamos o SDMA como uma maneira
adequada de melhorar o SE em uma ordem de magnitude ou mais. Vamos agora descrever
como o SDMA é aplicado no DL. Continuamos a usar o modelo de Wyner, que é ilustrado na
Figura 1.19 para o DL. A principal diferença do UL na Figura 1.8 é que os sinais são transmitidos
de BSs em vez de UEs. Existem Ks activos de K em cada célula e a BS de serviço envia um sinal
separado para cada um deles utilizando a pré-codificação de transmissão linear a partir de um
conjunto de antenas M. Pré-codificação significa que cada sinal de dados é enviado de todas as
antenas, mas com amplitude e fase diferentes para direcionar o sinal espacialmente. Isso
também é chamado de beamforming, mas evitamos usar essa terminologia, pois ela pode dar
a impressão errônea de que um feixe de sinal é sempre formado em uma direção angular
específica e que os deslocadores de fase analógicos são usados. Em contraste, pré-codificação
significa que o sinal de transmissão de cada antena é gerado separadamente na banda base
digital, o que dá total flexibilidade na geração de sinal.18 Feixes angulares são um caso especial
de pré-codificação que é útil na propagação de LoS, mas para canais NLoS o sinal transmitido
pode não ter uma diretividade angular distinta, mas ainda pode ser pré-codificada de tal modo
que os componentes do multipercurso sejam recebidos coerentemente no UE.
Figura 1.19: Ilustração da noção de sinais DL desejados e interferentes em uma rede de duas células. No modelo de
Wyner, cada UE na célula 0 tem o mesmo valor dos ganhos médios de canal β 00 e β10 , enquanto que cada UE na
1 1
célula 1 tem o mesmo valor de β eβ
0 1 .
Consideramos os mesmos modelos de propagação de LoS e NLoS como antes. No caso LoS,
temos a resposta do canal MISO (multiple-input single-output)
l
entre UE k na célula j e BS na célula l, em que φ jk ∈¿ é o ângulo de azimute relativo à
orientação da matriz BS transmissora. No caso NLoS, a resposta do canal correspondente é
e é assumido como independente entre os UEs. Lembre-se de (1.12) que usamos a mesma
1 0
notação, β́=β 0 / β 0 , para a força relativa da interferência inter-celular na DL como na UL.
Os vetores de pré-codificação w jk, para k =1,.. . , K e j = 0, 1, podem ser selecionados de
várias formas. Como visto a partir do sinal recebido em (1.45), cada UE é afectado por todos os
vectores de pré-codificação; o próprio vetor de pré-codificação é multiplicado com a resposta
do canal da BS de serviço, enquanto os outros causam interferência e são multiplicados com a
resposta do canal a partir das BSs de transmissão correspondentes. Assim, os vetores de pré-
codificação devem ser selecionados cuidadosamente no DL, com base no conhecimento das
respostas do canal. Estudaremos isso em detalhes na Seção 4.3, p. 316, mas por enquanto nós
consideramos MR precoding com
Este vetor de pré-codificação foca o sinal DL no UE desejado para alcançar o ganho máximo de
2
matriz, similar à combinação de RM no UL. Note que ||w jk|| =1 , o que implica que a
potência total de transmissão da BS é constante, independentemente do número de antenas.
Consequentemente, a potência de transmissão por antena BS diminui aproximadamente como
1 / M. O lema a seguir fornece expressões SE para a pré-codificação MR.
Com canais NLoS, uma soma DL SE [bit / s / Hz / célula] e um limite inferior de forma fechada
são
A soma de DL de SE neste lema é muito semelhante à soma de UL no Lema 1.7. O caso NLoS só
M −1
difere no termo multiplicativo extra no denominador de (1.50), que é quase um para
M
o caso grande M. O LoS só difere nos ângulos que aparecem em cada expressão, todos os
ângulos no UL são de UEs para o BS na célula 0, enquanto o DL inclui tanto os ângulos do UE
desejado para todos os BSs transmissores e os ângulos dos outros UEs para os quais estes BSs
estão transmitindo (representando a diretividade de cada sinal DL). Algumas das similaridades
são induzidas pelo modelo de Wyner, uma vez que assumimos que a interferência intercelular
1 0
é igualmente forte no UL e DL (isto é, β 0=β 1 ); em geral, também há diferenças nos ganhos
médios do canal, conforme elaboramos na Seção 4.3.2, p. 320. No entanto, ao usar o modelo
Wyner, as simulações de UL nas Figuras 1.16–1.17 são representativas para o desempenho de
DL também - nenhuma simulação adicional é necessária para descobrir os comportamentos
básicos.
Figura 1.20: Quando uma antena está transmitindo um sinal piloto, qualquer número de antenas de recepção pode
receber simultaneamente o sinal piloto e usá-lo para estimar seus respectivos canais ao transmissor.
Cada sinal piloto transmitido pode ter sido um sinal que transporta dados de carga útil,
portanto, queremos minimizar essa sobrecarga causada pela sinalização do piloto. No SDMA,
existem diferenças importantes entre o UL e o DL em termos da sobrecarga para a aquisição de
canais. Existem K UEs de antena única por célula e, portanto, são necessários K sinais piloto
para estimar os canais no UL. Da mesma forma, existem M antenas na BS e, portanto, M sinais
piloto são necessários para estimar os canais na DL. Uma vez que ter uma relação de antena-
UE M /K ≥ 4 é o regime operacional preferível no SDMA, a sobrecarga do envio de pilotos
DL é tipicamente muito maior do que a dos pilotos da UL. Uma antena BS só é útil se
soubermos a resposta do canal, o que limita o número de antenas BS que podemos utilizar na
prática, a menos que possamos encontrar uma solução alternativa.
Figura 1.21: Ilustração de duas maneiras de dividir um bloco de recursos de tempo / freqüência entre UL e DL. Cada
caixa sólida representa um bloco de frequência de tempo em que as respostas do canal são constantes e precisam
ser estimadas.
Isso significa que a resposta do canal é a mesma em ambas as direções e pode ser estimada na
BS usando apenas os pilotos da K UL. Apenas o BS na célula j precisa saber a resposta completa
j
do canal h jk ao seu k esimo UE, enquanto o correspondente UE precisa apenas conhecer o
H
canal escalar efetivo g jk =( h jjk ) w jk que é obtido após a pré-codificação. Como o valor de
gjk é constante desde que os canais sejam constantes, ele pode ser estimado cegamente a
partir dos sinais de dados de carga útil DL, independentemente da distribuição do canal [243] .
21 Por exemplo, o BS pode usar seu CSI para ajustar a fase de w jk para que a fase de gjk se torne
(quase) determinística, assim principalmente a magnitude | g jk | precisa ser estimado. O
endurecimento do canal melhora a qualidade da estimativa, pois as variações relativas em
ficam menores. Consequentemente, um protocolo TDD requer apenas K pilotos,
independentemente do número de antenas, M.
Figura 1.22: Ilustração dos pontos de operação (M, K) que são suportados usando τ p =20 pilotos , para os
protocolos TDD e FDD. A área sombreada corresponde aos pontos de operação preferíveis para sistemas SDMA. O
protocolo TDD é escalonável em relação ao número de antenas e o número de UEs que podem ser suportados é
limitado apenas por τp .
do protocolo FDD é
( M + K + max ( M , K ) ) .
2
Vamos agora ilustrar a diferença importante na dimensionalidade piloto entre a operação de
TDD e FDD. Considere um sistema SDMA que possa suportar τ p pilotos. Este valor
determina as combinações de M e K que podem ser suportadas. O protocolo TDD suporta até
K=τ p UEs e um arbitrário M. O protocolo FDD suporta qualquer M e K tal que
( M + K + max ( M , K ) )
≤ τ p .. Os pontos de operação suportados por esses protocolos são
2
ilustrados na Figura 1.22 para τ p =20 . A área sombreada indica M≥4K, que são os pontos de
operação atrativos para o SDMA, conforme discutido na Seção 1.3.3 (veja, por exemplo, os
resultados na Figura 1.17). A compensação entre antenas e UEs causada pelo protocolo FDD
leva a uma intersecção muito limitada com a área sombreada. Em contraste, o protocolo TDD é
totalmente escalável em relação a M e o número de pilotos limita apenas quantos UEs podem
ser suportados. Qualquer número de antenas pode ser usado, mas de preferência nós
selecionamos um dos muitos pontos operacionais que estão na área sombreada.
Em resumo, os sistemas SDMA devem idealmente ser combinados com TDD, explorando a
reciprocidade entre os canais UL e DL. Isso ocorre porque a sobrecarga de aquisição de canal
( M+ K + max ( M , K ) )
necessária em TDD é K, enquanto é em FDD. A sobrecarga de FDD é
2
cerca de 50% maior quando M ≈ K , embora seja muito maior para M ≫ k , que é o
regime operacional preferível para SDMA. Note que é a aquisição de canal necessária para a
pré-codificação DL que difere entre TDD e FDD, enquanto a UL funciona essencialmente da
mesma forma.