Sie sind auf Seite 1von 9

21-09-2011

AMD Fusion:

La microarquitectura que cambiar las reglas

AMD ha puesto toda la carne en el asador. El lanzamiento de la plataforma Fusion es, sin lugar
a dudas, el ms importante para la firma de Sunnyvale desde la presentacin en 2003 de los
primeros Athlon 64. Sin embargo, no es en absoluto una maniobra improvisada.

En realidad, las primeras APUs (Accelerated Processing Unit), o unidades de procesamiento


acelerado, empezaron a cocinarse hace la friolera de cinco aos, poco despus de la
adquisicin de ATI. El objetivo de los directivos de AMD cuando pergearon esta operacin no
fue nicamente entrar por la puerta grande en el mercado de los procesadores grficos, sino
tambin utilizar el extenso bagaje de los ingenieros de ATI para poner a punto una familia de
microprocesadores revolucionaria.

Por esta razn, pocas semanas despus de la compra de esta ltima compaa, los tcnicos de
ambas empresas comenzaron a trabajar juntos. Y el resultado de este esfuerzo conjunto, que
ha perdurado a lo largo de casi cinco aos, es la plataforma Fusion.

Un lanzamiento a lo grande

Las primeras APUs de AMD llegaron al mercado a principios de este ao, coincidiendo con la
celebracin de la ltima edicin del CES, en Las Vegas. Esos primeros chips han sido fabricados
utilizando fotolitografa de 40 nm y pertenecen a las series E y C de la plataforma Fusion. La
primera responde a las necesidades de los porttiles del segmento de entrada y de los equipos
Todo en Uno, y tiene un TDP (ndice de disipacin trmica) de 18 vatios.

Por otra parte, los chips de la serie C resultan idneos para los netbooks y los Mini-PCs
gracias a su reducido TDP, de tan solo 9 vatios. Pero ambas familias comparten la
incorporacin de una lgica grfica que ofrece un rendimiento muy superior al de los

1
procesadores grficos integrados disponibles hasta la fecha, y, sobre todo, lo que en AMD
llaman autonoma para todo el da, que no es otra cosa que la capacidad de los chips de esta
plataforma de facilitar la fabricacin de equipos capaces de alcanzar o, incluso, superar las 8
horas de disponibilidad continua con Windows 7 en modo de inactividad.

En cualquier caso, es evidente que las series C y E no han sido diseadas para abastecer a
todas las plataformas de ordenadores disponibles en el mercado. El as que AMD acaba de
arrojar sobre la mesa es, precisamente, la serie A perteneciente a la plataforma Fusion,
conocida por el nombre en cdigo Llano.

Estos microprocesadores estn siendo fabricados por GlobalFoundries, una compaa fruto de
la escisin en 2009 de la divisin de fabricacin de semiconductores de AMD, utilizando
tecnologa de integracin de 32 nm, y los primeros equipos que los incorporan llegarn a las
tiendas a lo largo del mes de junio. Los chips pertenecientes a la serie A han sido diseados
para gobernar PCs de sobremesa y ordenadores porttiles de alto rendimiento, por lo que
competirn con los microprocesadores Core i3 e i5 de Intel, y tambin con algunos Core i7.

Es evidente que el futuro a corto plazo de AMD est ligado al xito de la plataforma Fusion,
por lo que no es de extraar que la presentacin mundial de los nuevos procesadores se haya
llevado a cabo en la isla YAS de Abu Dhabi (Emiratos rabes Unidos), un marco excepcional al
que solo fueron invitados un puado de medios de comunicacin especializados entre los que
se encontraba PC Actual, la nica revista espaola presente en el evento.

APU = CPU + GPU + Northbridge

Una APU, o unidad de procesamiento acelerado, es un microprocesador que aglutina la lgica


de la CPU, la GPU y el northbridge. La reunin de estos tres elementos en un nico circuito
integrado fabricado con la tcnica de fotolitografa masiva ms sofisticada disponible
actualmente permite ahorrar mucho espacio y, sobre todo, reducir drsticamente el consumo.
Esto significa que el TDP de una APU es muy inferior a la suma de los TDPs de los tres chips a
los que equivale. Adems, dado que aglutina la funcionalidad de tres unidades diferentes en
una nica pieza de silicio, su coste es menor que el de la adicin de estas por separado.

2
Los procesadores pertenecientes a la nueva serie A incorporan un mximo de 4 ncleos x86 de
propsito general acompaados, cada uno de ellos, por una cach de nivel 2 de 1 Mbyte.
Aunque ms adelante profundizaremos con cierto detalle en las novedades introducidas en la
microarquitectura, nos viene bien tener presente que esta implementacin ofrece un
incremento apreciable en el nmero de instrucciones por ciclo de reloj (IPC), que AMD
cuantifica en algo ms del 6% si lo comparamos con la anterior generacin de ncleos x86.
Adems, la tecnologa Turbo Core adecua independientemente el TDP y la frecuencia de reloj
de cada uno de ellos a la carga de trabajo para reducir sensiblemente su consumo.

La solucin que han puesto a punto los ingenieros de AMD es muy similar a la diseada por los
tcnicos de Intel, por lo que evala en tiempo real el trabajo para someter a cada uno de los
ncleos a la carga apropiada. De esta forma, si uno o ms ncleos permanecen inactivos, los
activos pueden trabajar a una frecuencia superior a la nominal siempre que el TDP total del
microprocesador no supere el ndice mximo.

No obstante, el balanceo de la carga no se lleva a cabo monitorizando nicamente los ncleos


de la CPU, sino tambin la GPU. Esto significa que en un escenario en el que el procesador
grfico permanece ocioso o relativamente poco cargado, la CPU puede incrementar su
frecuencia de reloj y, as, beneficiarse de la porcin del TDP global que no est siendo
utilizada para materializar los grficos.

Para que todo esto funcione correctamente y el ndice de disipacin


trmica del procesador se mantenga siempre por debajo del umbral
que garantiza su correcto funcionamiento, los ingenieros de AMD
han recurrido a un monitor que suma de forma instantnea el TDP
de los ncleos de la CPU y el de la GPU para, despus, enviar esta
informacin a un gestor conocido como administrador del estado-P.
Este, a su vez, modula la frecuencia de reloj de cada ncleo para
adaptar su consumo a la carga de trabajo impuesta en un instante
determinado.

3
Este esquema de funcionamiento no parece, a priori, muy diferente al implementado en otras
soluciones de Intel y tambin de la propia AMD, sin embargo, difiere de estas en un apartado
esencial: el mdulo de gestin avanzada de la energa (APM o Advanced Power
Management) evala la temperatura y la corriente en el dominio digital. De esta forma, el
escalado de la frecuencia de reloj se lleva a cabo con ms precisin y la injerencia del entorno
y las interacciones entre ncleos es menor, lo que permite optimizar la siempre crucial relacin
rendimiento/vatio.

El consumo de las APUs de la serie A para ordenadores porttiles oscila entre 35 y 45 vatios,
mientras que el de las destinadas a los PCs de sobremesa flucta entre 65 y 100 vatios. Por
otra parte, la frecuencia de reloj de los ncleos de propsito general parte desde los 1,4 GHz
de los modelos ms econmicos hasta los 2,9 GHz de los chips tope de gama. En cambio, el
rango de velocidades de la lgica grfica integrada es ms comedido, pues oscila entre 400 y
600 MHz en todas las versiones de estos chips.

DirectX 11, 400 ncleos Radeon y mucho ms

El bagaje acumulado por los ingenieros que proceden de ATI y que han intervenido en el
diseo de la lgica grfica de los chips Llano es un capital fundamental para AMD. A diferencia
del motor grfico implementado en los procesadores Sandy Bridge de Intel, las soluciones de
la plataforma Fusion son totalmente compatibles con la API DirectX 11 y, por tanto, a priori
pueden enfrentarse a la ejecucin del motor grfico de cualquier juego de ltima generacin.

El objetivo de los ingenieros de AMD ha sido ofrecer con estos chips un rendimiento grfico
equiparable al de una tarjeta dedicada de gama de entrada o, incluso, media. Esta
productividad es ms que suficiente para la mayor parte de los usuarios, pero tambin resulta
muy atractiva para los jugones, pues pueden sumar a su PC de sobremesa equipado con una
APU de la serie A una tarjeta grfica Radeon HD dedicada y disfrutar de un subsistema grfico
dual constituido por la GPU de esta ltima y la lgica grfica de su CPU.

El rendimiento de la nueva APU de AMD en las operaciones que requieren un esfuerzo de


clculo intensivo es bueno, pero donde realmente destaca es en la prueba Multi-Media de
SiSoft Sandra 2011

4
Las APUs pertenecientes a la serie A pueden incorporar tres versiones distintas de un mismo
motor grfico. Las principales diferencias existentes entre la plataforma A8, el tope de gama,
la A6 y la A4, se manifiestan en el nmero de ncleos Radeon, unidades SIMD, unidades de
texturas y ROPs (unidades de renderizado).

El motor grfico de los chips A8 incorpora 400 ncleos Radeon (stream processors), 5
unidades SIMD, 20 unidades de texturas, 32 unidades de renderizado asociadas al clculo de
la profundidad (bfer Z) y a la matriz de renderizado (stencil buffer) y 8 unidades de
renderizado para el color.

Adems, la frecuencia de reloj de la GPU asciende a 444 MHz y la tasa de transferencia de la


memoria alcanza los 1,6 Gbps. Es fcil percatarse de que estas especificaciones son ms
ambiciosas que las de las lgicas grficas integradas que hemos disfrutado hasta ahora.

Las APUs de AMD son totalmente compatibles con DirectX 11

El nombre en cdigo del nuevo motor grfico es Sumo, que no es otra cosa que un derivado de
Redwood debidamente actualizado. Al igual que las dems unidades funcionales de los chips
que conforman la serie A, en su fabricacin se utiliza fotolitografa de 32 nm. Las principales
diferencias existentes entre este diseo y Redwood ataen a la interfaz que facilita la
comunicacin entre la memoria y el northbridge, as como al decodificador unificado de vdeo
(UVD), que en Llano es de tercera generacin.

Por otra parte, como hemos adelantado, esta lgica grfica es totalmente compatible con
DirectX 11 y, por tanto, permite la teselacin y la utilizacin de DirectCompute y el Shader
Model 5. Tambin satisface los requisitos estipulados por OpenGL 4.1.

Pero, sin duda, lo que ms llamar la atencin de los jugones son los modos de alta calidad que
posibilitan la eliminacin de los bordes dentados (antialiasing) y el filtrado de texturas. El
primero de estos algoritmos alcanza las 24 muestras en las modalidades MSAA, SSAA y MLAA,
mientras que el filtrado anisotrpico de texturas independiente del ngulo puede emplear
hasta 16 muestras.

5
Las mejoras introducidas por los ingenieros de AMD en el decodificador de vdeo tienen como
objetivo mejorar la capacidad de la CPU al reproducir y codificar vdeo en alta definicin en
cualquiera de los formatos que empleamos actualmente (H.264, MPEG-2, VC-1 y MPEG-4
parte 2), lo que hace posible abordar estos procesos sin penalizar el rendimiento de las dems
unidades funcionales del sistema.

Primera toma de contacto


Antes de entrar en materia nos gustara agradecer a los responsables de AMD en Espaa que
nos hayan permitido trabajar a nuestras anchas con una de las primeras, si no la nica,
plataformas de pruebas Fusion Serie A disponibles. No obstante, no se trata de un equipo
comercial como los que estn a punto de llegar a las tiendas, sino de un porttil ensamblado
por la propia AMD utilizando un chasis de marca blanca.

En cualquier caso, lo realmente importante es que su configuracin es muy similar a la de los


equipos que muy pronto podremos adquirir en el mercado. Incorpora una APU AMD A8-
3500M a 1,5 GHz con 4 ncleos (capaz de trabajar a un mximo de 2,4 GHz), lgica grfica
Radeon HD 6620G a 444 MHz y un TDP de 35 vatios; 4 Gbytes DDR3-1333, pantalla LCD LED de
14" (1.366 x 768 puntos), un disco duro Hitachi SATA300 de 250 Gbytes a 7.200 rpm, una
regrabadora de Blu-ray Disc y Windows 7 Home Premium 64 Bits.

6
Las APUs de mayor rendimiento incorporan 4 ncleos acompaados por 1 Mbyte de cach L2

El principal reto al que nos hemos enfrentado es la dificultad de comparar el rendimiento del
porttil de AMD con el de otros equipos similares. Un porttil es una plataforma cerrada que
apenas deja margen a la hora de manipular el hardware. Adems, los ordenadores que hemos
comparado poseen configuraciones heterogneas, por lo que el anlisis no puede llevarse a
cabo aislando los componentes que queremos estudiar, que normalmente es lo que hacemos.

Aun as, los grficos que ilustran este informe recogen buena parte de las propuestas que
podemos encontrar en el mercado, por lo que nos permiten entrever con claridad qu nos
ofrece la plataforma de AMD.

La APU que incorpora el equipo que hemos utilizado pertenece a la serie A8, el tope de gama,
por lo que debe medirse con los microprocesadores Core i5 e i7 de Intel. La capacidad de
clculo del chip de AMD es muy notable, de hecho, aunque en el grfico de SiSoft Sandra 2011
podis ver que ha sido superado por las tres propuestas de Intel, es necesario tener presente
que la frecuencia de reloj de estas ltimas es claramente superior.

Aun as, a igual velocidad es muy probable que los Core i5 e i7 se lleven el gato al agua. No
obstante, nos ha sorprendido gratamente el fantstico rendimiento que el A8-3500M ha

7
arrojado en las pruebas multimedia, en las que ha superado con claridad al Core i5 a pesar de
que la frecuencia de trabajo nominal de este ltimo es 900 MHz mayor.

Por otra parte, la productividad de la APU de AMD en las pruebas grficas es tremenda. En la
presentacin de Abu Dhabi los tcnicos de la compaa nos garantizaron que su rendimiento
es equiparable al ofrecido por una tarjeta grfica dedicada de gama media, e, incluso,
media/alta.

Y es cierto. En el exigente 3DMark 11 Professional, bajo DirectX 11, ha batido con claridad a
un porttil con Intel Core i7 2630QM y una GPU GeForce GT 540M de NVIDIA. Y en
3DMark06, que sigue siendo una prueba de referencia para sopesar la productividad de
cualquier mquina en DirectX 9, ha barrido a todos los porttiles que hemos analizado en
nuestra ltima comparativa.

La diferencia de rendimiento entre la APU de AMD y la lgica grfica Intel GMA HD es


abrumadora, pero lo ms importante es que, incluso, ha aventajado a equipos que incorporan
GPUs muy potentes, como las GeForce GT 310M y 330M de NVIDIA o la Radeon HD 5450 de la
propia AMD.

En 3DMark06 Professional la APU A8-3500M de AMD ha arrasado. Literalmente. Incluso, ha


superado el rendimiento de los equipos Intel Core i5 que incorporan GPUs GeForce GT de
NVIDIA

Y, por ltimo, el resultado que hemos obtenido en autonoma es tambin muy prometedor. Y
es que una hora y cincuenta y dos minutos en Battery Eater Pro equivale a casi cuatro horas de
trabajo ofimtico ininterrumpido. En cualquier caso, nos parece esencial matizar que los
resultados de este informe constituyen una primera toma de contacto con las APUs de la
nueva serie A de AMD, por lo que ampliaremos y afianzaremos nuestra valoracin a medida
que vayamos analizando los primeros equipos comerciales que lleguen al mercado.

8
Las claves de las APUs de AMD

Disipan menos calor y consumen menos que las combinaciones de CPU y GPU
dedicada (TDP <= 45 vatios en porttiles y <=100 vatios en PCs de sobremesa)
El rendimiento de la lgica grfica integrada es equiparable al de una tarjeta grfica
dedicada
Su autonoma, al menos en teora, es superior a la ofrecida por los porttiles que
incorporan una GPU dedicada
La lgica grfica es compatible con DirectX 11 y permite la reproduccin de contenidos
Blu-ray 3D y juegos 3D
La integracin de la GPU en el interior del procesador es total, por lo que tiene acceso
directo a los recursos hardware del chip
Los jugones pueden combinar la potencia grfica de la APU y de una tarjeta grfica
Radeon HD dedicada de una forma simple
Los modos de eliminacin de los bordes dentados (antialiasing) y filtrado de texturas
de las APUs garantizan unos grficos de gran calidad
Compatibilidad con USB 3.0
La asistencia por hardware al proceso de reproduccin de vdeo en HD asegura
imgenes de calidad

Das könnte Ihnen auch gefallen