¿Podría duplicar la velocidad de una GPU haciendo la mitad del trabajo?

0

¿Es la impedancia térmica de la oblea de una GPU al disipador de calor lo suficientemente baja como para que pueda llegar a duplicar la velocidad del reloj si reduce a la mitad el ciclo de trabajo (representa el 50% de la tasa de cuadros de TDP completo)?

Una suposición que he realizado a través de la investigación es que el TDP (julios por segundo de capacidad de disipación térmica) está altamente relacionado con la cantidad de trabajo que puede realizar una GPU por unidad de tiempo.

Esta capacidad, en cierto grado, se hace evidente por referencia a los modos de "refuerzo" y los esquemas de disipación térmica de las GPU de alta potencia de hoy.

Me doy cuenta de que probablemente no sea una relación lineal, pero estoy hablando de pequeñas ráfagas de trabajo con mayor frecuencia:

Digamos que una tarjeta puede generar un marco específico en 16 ms de manera continua en su TDP, eso es 60 fps. En lugar de eso, quiero procesar ese mismo fotograma en 8 ms y luego omitir un fotograma, repetir (¿o quizás 6 ms si omito 2 fotogramas?)

    
pregunta joshperry

3 respuestas

2

Probablemente no.

En primer lugar, el TDP no se escala linealmente con la velocidad del reloj, una duplicación de la velocidad del reloj puede triplicar o cuadruplicar o incluso aumentar el calor producido.

En segundo lugar, el calor no es el único factor limitante de la velocidad del reloj. La señal aún tiene que alcanzar su destino dentro del IC dentro de un tiempo limitado y las puertas lógicas y las trazas añaden latencia. Si aumenta la velocidad del reloj lo suficiente, sin cambiar físicamente la GPU, la señal no viajará lo suficientemente rápido y el circuito lógico no funcionará correctamente.

    
respondido por el GrixM
2

La potencia consumida por los circuitos CMOS, incluidas las GPU, es principalmente la potencia de conmutación. Esto ocurre cuando un nodo realiza una transición de un nivel lógico alto a bajo / bajo a alto, debido a que toda la capacitancia asociada con ese nodo (límite de salida, límite de entrada a otras puertas lógicas, límites de parásitos, topes de cables, etc.) tiene que girar hacia arriba o hacia abajo también. Una vez que el nodo ha cambiado, no hay energía consumida en relación con el evento de conmutación. Solo las corrientes de fuga a través del FET 'OFF' contribuyen al poder aquí, pero esto es órdenes de magnitud más bajas que el evento de conmutación.

Por lo tanto, reducir el ciclo de trabajo no va a ayudar en este caso.

De hecho, debido a que lo más probable es que el circuito esté limitado por los flip flops, reducir el ciclo de trabajo ni siquiera hará una diferencia en el circuito que produce calor. Su flanco ascendente del reloj se usa para bloquear valores, y el ciclo de trabajo bajo está estático en una señal constante para los bloques de circuitos. Esto sucede porque la salida de la mayoría de los elementos de memoria se activa en cada borde del reloj.

Además, los bloques lógicos tienen un retraso. Di 300ps. No importa qué tan pronto pulses tus entradas, el retraso es de 300ps. Así que cambiar el ciclo de trabajo tampoco ayudará con esto.

Y, si su reloj llega a los flip flops de lanzamiento reales, si el pulso no es lo suficientemente largo (independientemente de la frecuencia entre los pulsos), el elemento de transmisión al primer pestillo no permanecerá abierto el tiempo suficiente para que cualquier información ser escrito en el bitnode (configuración o retención de violación). Puede ver esto en la imagen de abajo, como las barras rojas / azules alrededor del borde ascendente de la señal del reloj.

    
respondido por el jbord39
2

No. Y aquí hay una lista de razones:
Existe un "powerwall" donde necesitas duplicar la potencia si quieres duplicar la velocidad. Esto se debe a que alcanza la saturación de velocidad antes de salir del umbral por debajo del tamaño de la función actual (~ 25nm). Esto simplemente significa que no puede impulsar los transistores más rápido, suponiendo que ya está diseñado para la velocidad.

La mejor "ganancia" que puede obtener con CMOS es 70mv / década de la corriente. Esto significa que si desea que el correo sea más rápido, nuevamente, debe hacer más al mismo tiempo. Para hacer que un IC sea "más rápido", terminas incrementando el umbral y por lo tanto incrementando la fuga. Para los diseños "rápidos", tiene casi la misma potencia consumida dinámicamente durante la transición del conmutador que durante el tiempo integrado entre eventos de conmutación.

Las GPU están diseñadas para funcionar a 60FPS y luego duermes para disipar el calor. Estás limitado por la transferencia térmica. Si aumentara la velocidad del ciclo de conmutación, aún tendría que reducir los transistores para alcanzar su objetivo de calor.

Si desea una encuesta de TDP para obtener energía, aquí están mis resultados de 2015: Lasreferenciascompletasconunresumenrápidoson aquí .
La mejor manera de hacer que algo vaya dos veces más rápido es a la mitad de la cantidad de código que envías a través de él.

    
respondido por el b degnan

Lea otras preguntas en las etiquetas