¿Por qué exactamente comienzan a funcionar mal los chips una vez que se sobrecalientan?

26

Una vez que un chip se sobrecalienta, puede comenzar a funcionar mal, por ejemplo, muchos programas pueden comenzar a fallar una vez que se sobrecalientan algunas o todas las partes de una computadora.

¿Qué sucede exactamente que hace que los chips no funcionen correctamente cuando se sobrecalientan?

    
pregunta sharptooth

6 respuestas

26

Para ampliar en otras respuestas.

  1. Corrientes de fuga más altas: esto puede llevar a más problemas de calentamiento y puede resultar fácilmente en un escape térmico.
  2. La relación señal-ruido disminuirá a medida que el ruido térmico aumente : esto puede resultar en una mayor tasa de error de bits, esto hará que un programa se lea mal y los comandos se interpreten mal. Esto puede causar una operación "aleatoria".
  3. Los dopantes se vuelven más móviles con el calor. Cuando tienes un chip completamente sobrecalentado, el transistor puede dejar de ser transistores. Esto es irreversible.
  4. Un calentamiento desigual puede hacer que la estructura cristalina del Si se descomponga. Una persona normal puede experimentar poniendo vidrio a través de un choque térmico. Se romperá, un poco extremo, pero ilustra el punto. Esto es irreversible.
  5. Las memorias ROM que dependen de una placa aislada cargada podrán perder memoria a medida que aumenta la temperatura. La energía térmica, si es lo suficientemente alta, puede permitir que los componentes electrónicos escapen del conductor cargado. Esto puede dañar la memoria del programa. Esto me sucede regularmente durante la soldadura de circuitos integrados que ya están programados cuando alguien sobrecalienta el chip.
  6. Pérdida del control del transistor: con suficiente energía térmica, sus electrones pueden saltar el intervalo de banda. Un semiconductor es un material que tiene un pequeño espacio de banda, de modo que se puede salvar fácilmente con dopantes, pero lo suficientemente grande como para que la temperatura de funcionamiento requerida no lo convierta en un conductor donde el espacio sea más pequeño que la energía térmica del material. Esto es una simplificación excesiva y es la base de otra publicación, pero quería agregarla y ponerla en mis propias palabras.

Hay más razones, pero éstas son unas pocas importantes.

    
respondido por el Kortuk
13

El principal problema con el funcionamiento de IC a altas temperaturas es el aumento considerable de la corriente de fuga de los transistores individuales. La corriente de fuga puede aumentar hasta tal punto que los niveles de voltaje de conmutación de los dispositivos se vean afectados, de modo que las señales no puedan propagarse correctamente dentro del chip y deje de funcionar. Por lo general, se recuperan cuando se les permite enfriarse, pero no siempre es así.

Los procesos de fabricación para el funcionamiento a alta temperatura (hasta 300 ° C) emplean tecnología CMOS de silicona sobre aislante debido a las bajas fugas en un rango de temperatura muy amplio.

    
respondido por el Leon Heller
9

Solo una adición a algunas respuestas excelentes: técnicamente, no son los dopantes los que se hacen más móviles, es un aumento en la concentración intrínseca de portadores. En todo caso, los dopantes / portadores se vuelven menos móviles a medida que la red de cristal de silicio comienza a "vibrar" debido al aumento de la energía térmica, lo que dificulta que los electrones y los orificios fluyan a través del dispositivo: dispersión óptica de fonones. estar equivocado.

Cuando la concentración de portadora intrínseca aumenta más allá del nivel de dopaje, se pierde el control eléctrico del dispositivo. Los portadores intrínsecos son los que están ahí antes de impregnar el silicio, la idea de los semiconductores es que agregamos nuestros propios portadores para generar uniones pn y las otras cosas interesantes que hacen los transistores. El silicio alcanza un máximo de aproximadamente 150 ° C, por lo que el RF que se hunde por calor y los procesadores de alta velocidad son muy importantes, ya que 150 ° C no es demasiado difícil de lograr en la práctica. Existe un enlace directo entre la concentración intrínseca del operador y la corriente de fuga de un dispositivo.

Como lo han demostrado otros chaps, esta es solo una de las razones por las que los chips fallan: incluso puede llegar a algo tan simple como que un cable se caliente demasiado y se salga de la almohadilla, hay una gran lista de cosas. / p>     

respondido por el SimonBarker
8

Aunque las corrientes de fuga aumentan, es de esperar que un problema mayor para muchos dispositivos basados en MOS es que la cantidad de corriente que pasa a través de un transistor MOS en el estado "encendido" disminuirá a medida que el dispositivo se calienta. Para que un dispositivo funcione correctamente, un transistor que está cambiando un nodo debe poder cargar o descargar cualquier capacitancia latente en esa parte del circuito antes de que cualquier otra cosa dependa de que ese nodo haya sido conmutado. La reducción de la capacidad de paso de los transistores reducirá la velocidad a la que pueden cargar o descargar los nodos. Si un transistor no puede cargar o descargar un nodo lo suficiente antes de que otra parte del circuito confíe en que dicho nodo ha sido conmutado, el circuito funcionará mal.

Tenga en cuenta que para los dispositivos NMOS, hubo un compromiso de diseño al dimensionar transistores de pull-up pasivos; cuanto más grande es un pull-up pasivo, más rápidamente el nodo puede cambiar de bajo a alto, pero se desperdiciará más energía cuando el nodo sea bajo. Por lo tanto, muchos de estos dispositivos fueron operados de alguna manera cerca del borde de la operación correcta y las fallas de funcionamiento basadas en el calor fueron (y para la electrónica vintage, bastante comunes). Para la electrónica CMOS común, tales problemas son generalmente menos graves; No tengo ni idea en la práctica hasta qué punto juegan un papel en cosas como los procesadores multi-GHZ.

    
respondido por el supercat
2

Para complementar las respuestas existentes, los circuitos de hoy son sensibles a los siguientes dos efectos de envejecimiento (no solo estos, sino que son los principales en los procesos < 150nm):

Debido a que la temperatura aumenta la movilidad de los portadores, aumenta los efectos de HCI y NBTI, pero la temperatura no es la causa principal de NBTI y HCI:

  • La HCI es causada por una alta frecuencia
  • NBTI por alto voltaje

Estos dos efectos de envejecimiento de silicona causan daños reversibles e irreversibles a los transistores (al afectar / deteriorar los sustratos aislantes) que aumentan el umbral de voltaje del transistor (Vt). Como resultado, la parte requerirá un voltaje más alto para mantener el mismo nivel de rendimiento, lo que implica un aumento en la temperatura de operación y, como se dijo en otros puestos, seguirá una mayor fuga en la puerta del transistor.

Para resumir, la temperatura realmente no hará que la parte de la pieza sea más rápida, es la frecuencia y el voltaje más altos (es decir, el overclocking) lo que hará que una parte de la edad. Pero el envejecimiento de los transistores requerirá un mayor voltaje de operación, lo que hará que la parte se caliente más.

Corolary: la consecuencia del overclocking es un aumento de la temperatura y el voltaje requerido.

    
respondido por el Eric
1

La razón general por la que los circuitos integrados fallan irreversiblemente es porque el metal de aluminio que se encuentra dentro de ellos, que se utiliza para crear interconexiones entre los diversos elementos, se funde y abre o corta dispositivos.

Sí, las corrientes de fuga aumentarán, pero en general no es la corriente de fuga lo que constituye un problema, sino el calor que esto causa, y el consiguiente daño al metal dentro del IC.

Los circuitos de alimentación (por ejemplo, las fuentes de alimentación, los controladores de alta corriente, etc.) pueden dañarse debido a los altos voltajes, cuando los controladores del transistor se apagan rápidamente, se generan corrientes internas que provocan un bloqueo del dispositivo, o una distribución de energía desigual en su interior. lo que provoca el calentamiento local y la subsiguiente falla del metal.

Un gran número (1000) de ciclos térmicos repetidos puede causar fallas debido a desajustes entre la expansión mecánica del IC y el paquete, lo que eventualmente hace que se rompan los cables de unión o se delimite el material del paquete de plástico y la falla mecánica posterior. / p>

Por supuesto, un gran número de especificaciones paramétricas de IC solo se especifican en un rango de temperatura dado, y es posible que no estén dentro de las especificaciones fuera de este. Dependiendo del diseño, esto puede causar fallas o cambios paramétricos inaceptables (mientras que el IC está fuera del rango de temperatura), esto puede ocurrir con temperaturas extremadamente altas o bajas.

    
respondido por el jp314

Lea otras preguntas en las etiquetas