Cuando Nvidia presentó su entonces insignia GeForce GTX 1080 en la primera mitad de 2016, nunca hubiéramos esperado esperar más de dos años para su próxima arquitectura de tarjeta gráfica.
La arquitectura "Pascal" detrás de las tarjetas gráficas GTX de la serie 10 ha envejecido muy bien, pero ha envejecido.
Finalmente es hora de que se haga a un lado: la GeForce RTX 2080 está aquí, impulsada por la nueva arquitectura "Turing".
Pusimos en nuestras manos la GeForce RTX 2080 Founders Edition de $ 799, así como su hermano más robusto, la GeForce RTX 2080 Ti Founders Edition, y las pusimos a prueba.
¿La línea de fondo? Esta tarjeta valió la pena la espera, y es un asesino para juegos 4K completos y con detalles, incluidos los juegos con monitores de juegos de alta frecuencia de actualización y en HDR.
Los primeros usuarios no se sentirán decepcionados, pero las dos características principales de la tarjeta, a las que llegaremos en un momento, son tecnologías en su infancia.
Siempre que no le importe pagar una prima por esa prueba de futuro, encontrará que esta tarjeta es una bestia y una alternativa práctica a la ya excelente GeForce GTX 1080 Ti.
Pero sepa que parte del precio que está pagando es una apuesta al futuro.
Conozca la GeForce RTX: ¿Qué hay de nuevo?
La mayor novedad de la GeForce RTX es su trazado de rayos acelerado por hardware, cortesía de los nuevos núcleos de procesamiento RT integrados en la propia tarjeta.
El trazado de rayos permite la iluminación fotorrealista y los efectos de sombras en los juegos.
Si bien no es un concepto nuevo, el trazado de rayos hasta ahora no ha sido práctico de usar en tiempo real debido a su enorme sobrecarga de rendimiento, pero la serie RTX 20 está diseñada para cambiar eso.
(Obtenga más información sobre el trazado de rayos en las tarjetas Nvidia RTX en el sitio hermano ExtremeTech).
La otra gran innovación tecnológica de la serie RTX 20 es su soporte para una tecnología conocida como Deep Learning Super-Sampling (DLSS).
Habilitado por los nuevos núcleos de procesamiento Tensor en la tarjeta gráfica, DLSS usa IA para suavizar los bordes de los objetos del juego de manera más eficiente que el enfoque tradicional, el suavizado.
Donde se emplea, Nvidia afirma que son posibles aumentos sustanciales del rendimiento con DLSS.
La parte más extraña de esta revisión es que no verá pruebas o puntos de referencia formales con el trazado de rayos o DLSS como un factor explícito.
¿El obstáculo? El simple hecho de que no había juegos o puntos de referencia disponibles al momento de escribir este artículo que respaldaran completamente cualquiera de las tecnologías.
Muchos juegos futuros ya se han anunciado con soporte, pero es poco probable que los juegos existentes reciban el mismo tratamiento.
Por lo tanto, la situación actual hace que sea un poco difícil juzgar el valor de las tarjetas de la serie GeForce RTX 20 en relación con las tarjetas actuales.
A $ 799, la RTX 2080 Founders Edition cuesta significativamente más dinero en efectivo que la GeForce GTX 1080 Founders Edition $ 549.00 en Nvidia que reemplaza en la línea de Nvidia.
Dicho esto, el valor de la serie RTX 20 no depende completamente de su compatibilidad con estas nuevas tecnologías.
La tarjeta también ofrece un rendimiento mucho mejor que la serie GTX 10 para todos los juegos y pruebas de rendimiento que probé, especialmente con una resolución de 4K.
Nvidia afirma que las nuevas tarjetas gráficas GeForce RTX 2080 ofrecen hasta el doble de rendimiento que su predecesora GTX 1080, pero eso asumiendo que el juego en cuestión es compatible con DLSS.
Llegaré a los puntos de referencia lo suficientemente pronto; Por ahora, únase a mí mientras profundizo en los antecedentes de la serie GeForce RTX 20 y por qué es tan importante.
Down Memory Lane: Turing y su linaje
Nvidia presentó Pascal, el predecesor arquitectónico de Turing, en la primera mitad de 2016.
Fue un hito para la empresa porque era la primera vez en cuatro años que reducía su proceso de fabricación.
Expresado en nanómetros, el proceso de fabricación es la distancia mínima entre transistores en un chip de computadora.
En pocas palabras, cuanto menor es la distancia, más transistores se pueden empaquetar en el mismo espacio.
La cantidad de transistores se correlaciona con la potencia de cálculo, por lo que cuanto más tenga de ellos, mejor, en igualdad de condiciones.
Esa es la premisa que sustenta la ley de Moore.
Pascal se basó en un proceso de 16 nm, considerablemente más pequeño que el proceso de 28 nm de las arquitecturas anteriores "Kepler" y "Maxwell" que reemplazó.
Eso solo le dio una enorme ventaja de rendimiento.
(Maxwell se introdujo en 2014, pero utilizó el mismo proceso de 28 nm que la arquitectura Kepler que Nvidia introdujo en 2012.) Avance rápido hasta la segunda mitad de 2018, y Turing reduce aún más el proceso de fabricación a 12 nm.
(Podría decirse que es un refinamiento del proceso actual de 16 nm, pero dejemos que los tecnicismos sean tecnicismos).
Eso ayudó al RTX 2080 revisado aquí a casi duplicar el número de transistores de la GTX 1080, a 13.6 mil millones desde 7.2 mil millones.
Aquí hay un vistazo a las arquitecturas de tarjetas gráficas de Nvidia, sus procesos de fabricación y su recuento de transistores a lo largo de los años ...
Las generaciones sucesivas acumularon innumerables mejoras técnicas, sin mencionar las nuevas tecnologías que se introdujeron en el camino.
(Me viene a la mente el soporte para Microsoft DirectX 12 y HDR como dos de los más recientes).
Por lo tanto, el recuento de transistores no cuenta la historia completa, pero tiene un papel importante en el objetivo de lograr más potencia computacional.
Es irónico que los mayores avances en la informática a menudo se hagan al hacer las cosas más pequeñas, pero es cierto, y por eso Turing es una gran noticia.
Cambio de núcleo: núcleos RT versus núcleos CUDA
Al igual que varias generaciones anteriores de tarjetas gráficas GeForce, la serie RTX 20 utiliza núcleos de procesamiento CUDA para el procesamiento 3D tradicional.
Lo nuevo en la serie GeForce RTX 20 es su adición de núcleos de trazado de rayos (o RT), que permiten el trazado de rayos acelerado por hardware.
La serie GTX 10 podría realizar operaciones de trazado de rayos, por lo que señalé que el trazado de rayos no es un concepto nuevo, pero tenía que hacerlo en software, que es demasiado lento para la aplicación en tiempo real.
Nvidia califica el rendimiento de trazado de rayos de la GTX 1080 a solo 0,89 gigarays por segundo, mientras que la nueva RTX 2080 hace 8 gigarays por segundo.
Eso es un aumento masivo, y debería hacer que sea práctico hacer el trazado de rayos en tiempo real.
(Una vez más, todavía no pude probar el trazado de rayos en acción; no había ningún software disponible.
Por lo tanto, todos tenemos solo lo que Nvidia dice para continuar).
Hablando de núcleos CUDA, la serie RTX 20 también trae mejoras allí.
Turing no solo tiene más núcleos CUDA para empezar, sino que Nvidia afirma que ofrecen aproximadamente un 50 por ciento más de rendimiento por núcleo que con la arquitectura Pascal.
Los multiprocesadores de transmisión (SM) en la tarjeta gráfica (es decir, donde residen los núcleos CUDA) se han rediseñado para Turing.
Gran parte del aumento del rendimiento del núcleo CUDA proviene de una segunda unidad de ejecución paralela que se encuentra junto a cada núcleo CUDA, lo que le permite procesar operaciones de punto flotante y enteros simultáneamente.
Además, Turing tiene una ruta de memoria SM rediseñada, que según Nvidia es buena para un ancho de banda de memoria efectivo 50 por ciento más alto que con Pascal.
Tens-ion dramático: los nuevos núcleos tensoriales
Los núcleos Tensor debutaron en 2017 en la arquitectura Volta de Nvidia, pero hasta ahora no se han introducido en las tarjetas gráficas GeForce centradas en los juegos de Nvidia.
Su uso se ilustra mejor en la función DLSS de Turing.
Si eres un jugador, probablemente hayas notado las "irregularidades" que pueden aparecer en los bordes de los objetos del juego.
Puede obtener una mejor experiencia visual si habilita el suavizado para suavizarlos, pero hacerlo conlleva una penalización significativa en el rendimiento.
El suavizado se puede realizar de varias formas; El método de referencia de Nvidia hasta ahora ha sido el suavizado temporal o TAA.
Funciona tomando varias escenas como entrada y masajeándolas en una sola imagen para obtener un resultado final con mejor apariencia.
Sin embargo, este proceso genera una gran sobrecarga porque la tarjeta gráfica debe representar todos los fotogramas de entrada a la resolución final.
(Por lo tanto, si está ejecutando un juego a 1080p, los fotogramas de entrada también deben ser de 1080p).
DLSS aborda esto de manera diferente.
Reduce la sobrecarga porque no requiere tantas muestras de entrada.
En cambio, utiliza las capacidades de IA de los núcleos Tensor para predecir cómo deberían haber sido las otras entradas, y genera una escena que es similar a lo que TAA lograría con aproximadamente la mitad de la sobrecarga.
Ese es solo el aspecto de rendimiento de DLSS.
También está diseñado para mejorar la calidad de la imagen "aprendiendo" cómo debe verse la imagen ideal.
TAA puede introducir una variedad de imperfecciones visuales, como borrosidad y pérdida general de detalles.
DLSS se puede entrenar haciendo que examine imágenes de muestra "renderizadas idealmente" para aproximar su salida con esas imágenes renderizadas idealmente, pero en tiempo real.
En resumen, DLSS puede adivinar con precisión cómo debería verse algo sin realizar la mayor parte del trabajo de procesamiento tradicional, mejorando el rendimiento.
Sin embargo, DLSS no es una tecnología de complemento para juegos existentes.
Numerosos juegos futuros deberían adoptar la tecnología, pero al momento de escribir este artículo, no hay nada con lo que probar.
Otras nuevas tecnologías
Resumiré brevemente otras tres mejoras de sombreado clave que la serie GeForce RTX 20 trae a la mesa del desarrollador.
El primero es el sombreado de tasa variable (VRS).
VRS permite a los desarrolladores sombrear partes de la pantalla de una manera más detallada que otras.
En un juego de carreras, por ejemplo, sombrear la carretera, que al principio parece un borrón, no es tan importante como sombrear el automóvil y el horizonte.
Esta tecnología permite aprovechar la potencia de procesamiento de la tarjeta gráfica de manera más selectiva y, por lo tanto, eficiente.
El siguiente es el sombreado del espacio de textura.
Esta táctica está diseñada para eliminar el trabajo de sombreado duplicado al sombrear objetos en un espacio de textura y luego guardarlos en la memoria, donde se pueden volver a muestrear o reutilizar.
El último es el renderizado de vistas múltiples (MVR).
La serie GeForce GTX 10 puede renderizar dos vistas en una sola pasada a través de su función estéreo de un solo paso, pero solo desde el mismo punto de vista (solo un desplazamiento X diferente).
MVR en la serie RTX 20 permite renderizar múltiples vistas que no tienen que comenzar en el mismo punto de vista.
Eso permite que MVR, en teoría, se active más a menudo, aumentando así la eficiencia.
Esas son las versiones condensadas de estas tres tecnologías, claro.
Como ya he señalado varias veces, la forma en que todo esto se desarrolle dependerá de lo que suceda una vez que PC Labs haya tenido la oportunidad de probar los juegos compatibles.
Para concluir las últimas secciones de charlas técnicas, aquí hay un vistazo al esquema de un SM en Turing.
Cada Turing SM incluye 64 núcleos CUDA, ocho núcleos Tensor y un motor de procesamiento de núcleos RT.
Soporte SLI: Conozca NVLink
La interfaz de enlace escalable, mucho más conocida como SLI, es el método de Nvidia para unir varias tarjetas gráficas para mejorar el rendimiento.
El...