banner

Blog

Jun 09, 2023

Manos

El embargo de revisiones finalmente terminó y podemos compartir lo que encontramos en la Nvidia Jetson TX2. Es rápido. Es muy rápido. Si bien el uso previsto para el TX2 puede ser un poco específico para alguien que construye prototipos únicos, aquí hay muchas promesas para algunas aplicaciones muy interesantes.

La semana pasada, Nvidia anunció el Jetson TX2, una computadora de placa única de alto rendimiento diseñada para ser el cerebro de automóviles autónomos, drones que se toman selfies, bots similares a Alexa para quienes se preocupan por la privacidad y otras aplicaciones que requieren mucha atención. procesamiento con un presupuesto de energía significativo.

Esta es la continuación de la Nvidia Jetson TX1. Desde el lanzamiento del TX1, Nvidia ha logrado grandes avances. Ahora tenemos GPU Pascal y nunca ha habido un mejor momento para comprar una tarjeta gráfica. El aprendizaje profundo es un tema candente en el que todo nuevo graduado de informática quiere abordar, y eso significa bastidores llenos de GPU y núcleos CUDA. Los Jetson TX1 y TX2 son el avance de Nvidia en el aprendizaje profundo integrado, o dispositivos que necesitan mucha potencia de procesamiento sin agotar las baterías.

Antes de profundizar en esta revisión, es un buen momento para colocar las ofertas integradas de Nvidia en un contexto histórico. La Nvidia TK1 fue la primera oferta, lanzada en abril de 2014. Si bien sigue siendo una computadora de placa única capaz, ahora hay opciones más baratas que son casi tan buenas. Si no necesita la GPU Kepler que se encuentra en el TK1, simplemente tome una Pi o Beaglebone.

La Nvidia TX1 se lanzó en noviembre de 2015. Esta placa fue una marcada desviación de la TK1. El TX1 es un módulo del tamaño de una tarjeta de crédito sujeto a un disipador de calor. En ese momento, el TX1 era el mejor dispositivo Linux integrado de alto rendimiento que se podía comprar. Con una potente CPU ARM Cortex-A57 de cuatro núcleos junto con una GPU Maxwell, el rendimiento fue excelente. Incluso hoy en día, la Nvidia TX1 tiene un rendimiento aceptable en comparación con su competencia.

Poco después de la presentación del TX1, Pine64, la “primera computadora de placa única de 64 bits del mundo”, se lanzó en Kickstarter. El lanzamiento fue un desastre y no puedo recomendar un Pine64. Unos meses después del Pine64, se lanzó la Raspberry Pi 3B, con un ARM Cortex A53 de cuatro núcleos. El Pi 3B es el primer Pi que se siente como una computadora de escritorio adecuada. Es lo suficientemente rápido para la informática general y lo suficientemente bueno para el levantamiento de objetos pesados ​​(ligeros).

En marzo de 2016, el Odroid C2 entró en escena. Al igual que el Pi 3B, lucía un quad A53. Nuevamente, es una computadora de escritorio aceptable que es lo suficientemente rápida para la informática general. A finales del año pasado, Orange Pi lanzó su cattywampus PC2, otra computadora de placa única A53 de cuatro núcleos. Todos estos son ordenadores de placa única aceptables cuyo rendimiento habría asombrado a la gente en el año 2000.

Durante aproximadamente 18 meses, el mundo vio el lanzamiento de docenas de computadoras de placa única basadas en ARM. Ahora prácticamente hemos alcanzado el límite de lo que puede hacer una placa ARM Linux pequeña y de bajo consumo. En una rara entrevista sobre el futuro de Raspberry Pi, [Eben Upton] dice que estamos estancados en chips de 40 nm por un tiempo. Hasta que estén disponibles (y baratos) chips más nuevos y más rápidos con nuevas arquitecturas, estas son las computadoras de placa única ARM/Linux más rápidas que puede comprar.

Estas computadoras de placa única son excelentes si todo lo que necesita es una computadora con capacidad suficiente para manejar algunos scripts, mostrar algunas páginas web o reproducir algunos videos de YouTube. Si su caso de uso involucra videojuegos, renderizado de video o aprendizaje automático, necesitará algo más poderoso. Es por eso que existen Nvidia Jetson TX1 y TX2. ¿Es tan rápido como una computadora de escritorio cargada con un i7 y una GTX 1080? No, pero ese no es el punto: una computadora de escritorio construida alrededor de un i7 6700K y una GTX 1080 consumirá al menos 300 vatios, mientras que el Jetson TX2 solo consume quince a pleno rendimiento.

El TX2 es una pequeña placa atornillada a un disipador de calor del tamaño de una tarjeta de crédito. Ese es el corazón del TX2, pero sospecho que muy pocas personas trabajarán alguna vez con un módulo TX2 simple. Ni siquiera sé si se puede comprar el módulo TX2 en cantidades de una unidad. En lugar de comenzar con el módulo en sí y los puntos de referencia que contiene, comenzaré con el kit de desarrollador TX2.

El Jetson TX2 Developer Kit es básicamente una placa base Mini-ITX. Es un excelente factor de forma para un kit de desarrollo y sigue los pasos del Jetson TX1. Muy poco ha cambiado entre los kits de desarrollador TX1 y TX2.

Para cualquiera que ya esté usando el Jetson TX1, el TX2 será un reemplazo directo. Además, Nvidia seguirá admitiendo el TX1, no está llegando al final de su vida útil del TX1 y habrá una reducción en el precio del TX1. Dependiendo de la reducción de precio que veamos, recomendaría encarecidamente el TX1 a cualquiera que necesite un sistema Linux rápido y de bajo consumo. Aparentemente, Nvidia está comprometida con el ecosistema Jetson, y si alguna vez necesita algo más rápido, le espera la promesa de "reemplazo directo" del TX2.

En cuanto a lo que obtienes con la placa base, aquí está tu lista de viñetas

No ha cambiado mucho, si es que ha cambiado algo, en la placa portadora desde el Jetson TX1. Dado que se trata de una placa base Mini-ITX, habría apreciado algo más que un conector cilíndrico y una fuente de alimentación de bloque. Un conector de alimentación ATX real de 20 o 24 pines habría sido excesivo, pero los conectores PCIe de 6 u 8 pines son lo suficientemente pequeños y hay espacio en algún lugar de la placa para uno. Quizás en unos años.

Aunque se trata de una placa del tamaño de Mini-ITX, sigue siendo enorme para cualquier aplicación en la que Jetson tenga sentido. No se puede colocar esta placa detrás de la unidad principal de un automóvil y es demasiado grande para un dron. Desde que se lanzó el Jetson TX1, al menos una empresa ha presentado un conjunto de placas portadoras para este módulo. Los tableros con el tema de los Supersónicos de Connecttech desglosan las partes más importantes de una solución integrada, aunque todavía tengo que verlos en la naturaleza.

En la parte inferior del TX2 hay un conector enorme, confuso y realmente reconocible. Si desea construir su propia placa de conexión para TX1 o TX2, todo lo que necesita hacer es ir a Samtec y darles el número de pieza SEAM-50-02.0-S-08-2-AK-TR. Esta pieza no debería costar más de $5,50 en la cantidad uno. Necesitarás una placa de cuatro capas para usarlo, puedes soldarlo a mano. Espero ansiosamente un adaptador Pi-top para Nvidia Jetson.

Ese es el kit de desarrollador, pero ¿qué pasa con el Jetson TX2 real?

En comparación con el Jetson TX1, el TX2 cuenta con el doble de RAM con más ancho de banda, el doble de Flash eMMC y puede codificar videos de 2k dos veces más rápido. La CPU es una Nvidia Denver 2.0 de doble núcleo y una ARM Cortex A57 de cuatro núcleos.

El Jetson TX1 tenía un ARM Cortex A57 y un A53 de cuatro núcleos en el troquel. Los núcleos A53 no estaban habilitados para Jetson. El TX2, por otro lado, es una verdadera CPU multinúcleo, con un A57 cuádruple que, según se informa, es bueno para aplicaciones multiproceso y un Denver 2 de doble núcleo destinado a aplicaciones de un solo subproceso de alto rendimiento.

El año pasado, Nvidia lanzó su última línea de GPU. No debería sorprendernos que el TX2 esté construido en torno a la arquitectura Pascal. Esto es fantástico: si quieres crear un clúster de GPU o jugar Counter Strike a ocho mil fotogramas por segundo, la mejor inversión es una GPU basada en Pascal.

El Jetson TX2 tiene dos modos de energía. La configuración 'Max Q' es la máxima eficiencia energética, que cuando se mide con un medidor es de aproximadamente 7,5 vatios. La configuración 'Max P' es para un rendimiento máximo y ronda los 15 vatios. En el modo Max P, el rendimiento supuestamente es el doble que el del Jetson TX1. Pude cambiar entre estos modos con un solo comando en la terminal.

Unas palabras sobre el gigantesco disipador de calor del módulo TX2: al ejecutar pruebas comparativas, el ventilador nunca se encendió. El disipador de calor apenas estaba caliente al tacto. Supongo que el TX2 está diseñado para estar en el compartimento del motor de un automóvil, en Florida, en agosto.

Por fin la parte que todos estabais esperando. ¿Qué tan rápido es el TX2 sobre la competencia? Es muy rápido.

La CPU del TX2 es una Nvidia Denver 2.0 de doble núcleo junto con un ARM Cortex A57 de cuatro núcleos. Como se indicó anteriormente, el Denver está diseñado para un rendimiento rápido de un solo núcleo, mientras que el A57 está diseñado para procesos paralelos, pero no tan paralelos como para que una GPU sea una mejor solución. Para eso está la GPU Pascal con 256 núcleos CUDA. En comparación con el TX1, el tamaño de la memoria y el ancho de banda se duplican.

Utilicé Unixbench para caracterizar la CPU en TX2 y Raspberry Pi 3 Modelo B. Los resultados se muestran a continuación:

¿Cuál es la conclusión de esto?En pruebas comparativas sintéticas que prueban la CPU, la Nvidia Jetson TX2 es aproximadamente cuatro veces más rápida que la Raspberry Pi 3. . Es muy rápido. Sinceramente, no puedo esperar a que alguien imprima en 3D una carcasa de Game Cube para esto.

Comparar el rendimiento del TX2 con el de otras computadoras de placa única es un poco más difícil. No confiaría en un coche autónomo controlado por una Raspberry Pi; el rendimiento simplemente no está ahí. Probar un vehículo autónomo propulsado por el Jetson TX2 también está fuera de discusión.

Darle una idea del rendimiento del TX2 cuando realiza tareas con muchas imágenes es bastante difícil. Afortunadamente, Nvidia incluyó algunos ejemplos de VisionWorks en el paquete de revisión.

Con VisionWorks, el Supersónico pudo identificar características relevantes para cruzar el puente Golden Gate. Pudo utilizar el paralaje para construir una nube de puntos de un estacionamiento. El Jetson TX2 estabilizaba el vídeo en tiempo real. Una computadora portátil podría hacer esto, pero una Pi no.

Pero no todo Deep Learning es jugar con una cámara; En los puntos de referencia publicados por Nvidia, el TX2 es casi dos veces más rápido que el TX1 en rendimiento de inferencia de GoogleNet. Para el rendimiento de inferencia de AlexNet, el TX2 funciona mejor y utiliza menos energía.

La broma de marketing de Nvidia para el Jetson TX2 es "Aprendizaje profundo en el borde". ¿Qué significa eso? El futuro estará lleno de robots que ejecuten OpenCV, automóviles que eviten a las personas automáticamente y IA de voz tipo Alexa que realicen todo el procesamiento del lenguaje natural de forma local. Estas aplicaciones se denominan colectivamente aprendizaje profundo. 'The Edge' en esta metáfora son entornos donde la latencia de la red y el ancho de banda son problemas. Para un automóvil autónomo, es posible que ni siquiera exista una red para enviar datos a un servidor para su procesamiento. Si no desea que su robot Alexa envíe grabaciones de audio a un servidor por razones de privacidad, debe realizar el procesamiento localmente.

El Jetson está diseñado para poner una gran cantidad de potencia de procesamiento en el "borde", en aplicaciones que tienen un presupuesto de energía. Esto es aprendizaje profundo integrado. ¿Es una CPU de escritorio más rápida que un Jetson en tareas de aprendizaje profundo? Por supuesto, pero una CPU de escritorio consumirá 60 vatios; el Jetson TX2 solo consume quince. Si su proyecto o producto gira en torno a tener una computadora portátil guardada en algún lugar, ahora tiene un reemplazo que es más pequeño, potencialmente más rápido y consume menos energía.

Si quieres crear un emulador de Game Cube, el TX2 no es para ti. Si su idea de innovación es imprimir en 3D una carcasa RetroPi, la TX2 no es para usted. Esto no es un juguete. Esta es una herramienta de ingeniería. Se trata de un módulo que alimentará un coche autónomo o un cuadricóptero para capturar selfies. Estos son problemas de ingeniería difíciles que exigen un procesamiento rápido con un presupuesto de energía bajo.

Hay una razón por la que el kit de desarrollador TX2 es caro. El mercado para un dispositivo como este es pequeño en comparación con el montón de Pi Zeros en Microcenter. Sin embargo, no existe otra herramienta como esta. Si necesita una CPU rápida que sólo consuma quince vatios, no conozco una opción mejor.

AlmacenamientoUSBConectividad de redEncabezadosEn pruebas comparativas sintéticas que prueban la CPU, la Nvidia Jetson TX2 es aproximadamente cuatro veces más rápida que la Raspberry Pi 3.
COMPARTIR