Tal y como le ha pasado a NVIDIA, AMD va a tener que realizar por puras restricciones de la arquitectura actual un enfoque híbrido de la tecnología Ray Tracing, es decir, se tendrán que basar de nuevo en los procesadores de texturas para dar vida al trazado de rayos en tiempo real.
Los algoritmos BVH serán por tanto y una vez más claves para saber el rendimiento que la nueva arquitectura RDNA 2 va a ofrecer mediante unas unidades de función fija muy al estilo de NVIDIA. Aun así, no se puede decir que AMD esté copiando a los de Huang, ya que la implementación es distinta, pero el concepto es similar en cuanto a su forma.
Los Shaders serán claves para el rendimiento de las unidades fijas
En el caso de NVIDIA mucho hemos hablado de las unidades de función fija conocidas como RT Cores, así que AMD hará lo propio con las suyas, las cuales ha denominado como «fixed function ray intersection engine», algo así como un motor de intersección de rayos como función fija.
En realidad, y tras este nombre, lo que encontraremos será unas unidades de hardware que se especializan en los algoritmos BVH (por software como en Pascal ya hemos visto los resultados frente a Turing a misma potencia gráfica) pero que al mismo tiempo no son tan complejas como las opciones de NVIDIA.
La idea de AMD es reducir la dependencia del almacenamiento de los datos específicos del trazado de rayos, usando los búferes de memoria actuales del sistema de texturas. Esto tiene dos factores positivos: no se amplía el área del chip y al mismo tiempo es un diseño más simplista para la arquitectura.
Sin programador de hardware adicional, ¿es óptimo el enfoque de AMD para Ray Tracing?
De momento no está claro, hay rumores de una supuesta demostración de Cyberpunk 2077 en una supuesta GPU RDNA 2 frente a la RTX 2080 SUPER
En cualquier caso, todo parece indicar que el enfoque de AMD se basa en que los Shaders envíen los datos del trazado de rayos al pipeline de texturas para que los motores de intersección fija los procesen. ¿Qué implica sobre el papel esto? Que se procesen, en teoría, un mayor número de intersecciones por segundo y se necesiten menos ciclos de reloj para llevar a cabo dichos cálculos, aumentando el rendimiento.
Para ello, la arquitectura contará con una serie de unidades: Shaders, texture processors o TP, mayores cachés
Aprovecha la trama para realizar los cálculos que se almacenan en la misma caché y da la potestad al programador sobre qué unidades y rutas puede trabajar, optimizando con ello el rendimiento, bajando el consumo y no teniendo que crear chips de mayor tamaño.
Son dos enfoques híbridos que sobre el papel funcionan, habrá que esperar a que estén en el mercado tanto RDNA 2 como Ampere para ver que técnica es la más óptima.