Cosas que chocan en la noche

Por Charles Miller

Continuando con la historia de la semana pasada, ¿qué es esta cosa misteriosa que puede causar un mal funcionamiento de la computadora que casi hace que un avión caiga del cielo y que también podría causar un comportamiento intermitente e inexplicable de su computadora o teléfono inteligente? La respuesta son los rayos cósmicos, radiación de alta energía procedente del espacio exterior.

El planeta Tierra y todo lo que hay en él está siendo constantemente bombardeado por estos rayos. Estas partículas son 90% protones, 9% son núcleos de helio y 1% son núcleos más pesados. Algunos provienen de nuestro sol, y otros rayos cósmicos de alta energía que se mueven cerca de la velocidad de la luz provienen de estrellas en explosión, supernovas en el espacio profundo. Estas balas veloces e invisibles llueven constantemente sobre nosotros.

Cuando una de estas partículas perfora un transistor u otro semiconductor, tiene la capacidad de golpear en el lugar correcto para crear una gran cantidad de portadores de carga gratuitos. Estos electrones podrían causar un «cambio de bit» cambiando un byte del lenguaje binario de la computadora de uno a cero o viceversa.

Esto se conoce como un trastorno de evento único (SEU), un tipo de error leve. El error se llama «suave» porque el hardware no estaba dañado. «Evento único» significa que el error no es reproducible y es posible que ese error exacto nunca vuelva a ocurrir. Y asumo que «Molesto» podría ser una referencia a cómo te sentirías si gastaras una pequeña fortuna en una investigación forense solo para descubrir que aún es imposible saber con certeza qué causó un mal funcionamiento.

Cuando comenzaron los vuelos espaciales tripulados en la década de 1960, la NASA se dio cuenta del hecho de que, además de otras cosas, los rayos cósmicos podían tener un efecto en la electrónica. Los ingenieros entendieron que si ocurría un mal funcionamiento en los sistemas computarizados de guía y control del transbordador espacial, las consecuencias podrían ser catastróficas. No volaría (advertencia de juego de palabras) para proteger las computadoras detrás de varias toneladas de blindaje de plomo, por lo que la solución fue simplemente instalar cuatro computadoras en lugar de una.

Los cuatro sistemas informáticos hacen todos los mismos cálculos al mismo tiempo, y cada pocos milisegundos comparan sus resultados. Si alguna vez uno de los cuatro no está de acuerdo con los demás, se ignora ese dispar. Esta redundancia cuádruple de los sistemas informáticos del transbordador espacial también proporcionó una forma de rastrear la frecuencia de los cambios de bits. En la misión del transbordador espacial STS-48 en 1991, se registraron cambios de 161 bits en cinco días y, gracias a cuatro computadoras, Discovery aterrizó de manera segura.

Aquí en la Tierra, el fabricante de chips Intel estima que en cada computadora, teléfono inteligente y tableta podría haber un bit flip cada pocos meses; pero quién sabe, porque estos errores blandos de SEU no dejan pistas. Los fabricantes de chips han creado un código de corrección de errores sofisticado para ayudar a mitigar los efectos de los cambios de bits. Después de que el vuelo 76 de Quantas Airlines estuvo a punto de estrellarse, los fabricantes de aviones realizaron actualizaciones en la aeronáutica, lo que hizo que el sistema, que ya era confiable, fuera aún más confiable. Pero las cosas a veces siguen chocando en la noche. Si su dispositivo electrónico hace algo inexplicable solo una vez, podrían haber sido esos rayos cósmicos.

Charles Miller es un consultor informático independiente, un visitante frecuente de San Miguel desde 1981 y ahora prácticamente un residente de tiempo completo. Puede comunicarse con él al 415-101-8528 o enviar un correo electrónico a FAQ8@SMAguru.com.