La falla tecnológica mundial demostró que estamos a sólo un error del caos

EEUU, 24 de julio de 2024 ::: En caso de que los acontecimientos recientes (un intento de asesinato, un nuevo candidato

republicano a la vicepresidencia, el presidente en ejercicio que contrajo Covid-19 antes de abandonar su candidatura a la reelección) no lo hayan dejado lo suficientemente ansioso por la fragilidad del orden global, no olvidemos que una empresa de ciberseguridad de la que probablemente nunca hayas oído hablar cometió un gran error que demostró cómo Internet podía, sin previo aviso, detenerse.

Si bien es posible que no hayas conocido el nombre CrowdStrike antes, es poco probable que lo olvides pronto. Con un solo error en una actualización de software de rutina, la compañía desencadenó lo que probablemente fue la mayor falla informática de la historia, creando el tipo de crisis tecnológica que sus productos están diseñados para prevenir.

Aunque CrowdStrike dijo que la actualización defectuosa se había revertido, los problemas que causó no son exactamente las antiguas soluciones de "apagarlo y volverlo a encender" a las que la mayoría de nosotros estamos acostumbrados. Como informó mi colega Brian Fung, el error que puso las computadoras con Windows en el modo de pantalla azul de la muerte se puede solucionar. Pero en muchos casos requiere un trabajo minucioso por parte de un ser humano.

Este podría ser un buen momento para comprarle a su personal de TI un buen café y un panecillo porque todos y cada uno de los dispositivos afectados (para algunas organizaciones, estamos hablando de miles) probablemente tendrán que ser evaluados por un administrador y reiniciados en modo seguro y luego el archivo infractor se puede eliminar manualmente.

"No se puede automatizar eso", dijo Kevin Beaumont, investigador de seguridad y ex analista de amenazas de Microsoft, en una publicación en X. "Así que esto será increíblemente difícil para los clientes de CrowdStrike".

E incluso si su negocio no tuvo nada que ver con CrowdStrike, la interrupción podría haber arruinado el día.

Piense en una cafetería que utiliza servicios de reserva en línea de terceros, subcontrata sus pedidos de entrega y acepta tarjetas de crédito y débito a través de su punto de venta, que está conectado a los sistemas de procesamiento de pagos. No era necesario ser cliente de CrowdStrike para sentirse afectado por el error de la empresa, y eso es lo que hizo que la interrupción del viernes fuera tan frustrante.

Hemos tenido interrupciones aterradoras antes y seguramente las volveremos a tener. Pero la magnitud de la falla de CrowdStrike subraya una vez más cuán interconectado se ha vuelto el mundo a través de una red que casi ninguno de nosotros comprende y que en gran medida se autorregula.

"Hay organizaciones de las que dependemos en gran medida y ni siquiera nos damos cuenta de lo dependientes que somos hasta que dejan de funcionar", dijo Stuart Madnick, profesor de tecnología de la información en la Sloan School of Management del MIT.

Microsoft estimó que la interrupción de CrowdStrike afectó a unos 8,5 millones de dispositivos Windows. Las aerolíneas cancelaron 5.000 vuelos en todo el mundo el viernes, mientras que los retrasos persistieron durante el fin de semana y el lunes. Los hospitales y los servicios gubernamentales se vieron afectados y en algunas zonas las comunicaciones del 911 dejaron de funcionar.

Sería fácil echar toda la culpa a CrowdStrike por su descuidada actualización del sistema, o a las aerolíneas por no crear protocolos de respaldo sólidos, o incluso a Microsoft por dominar el mercado de los PC. Pero los expertos en TI aseguran que aquí hay problemas sistémicos más amplios en juego.

La naturaleza centralizada de las empresas de ciberseguridad significa que ahora tenemos “algunos puntos de falla importantes”, dijo Anil Khurana, director ejecutivo del Centro Baratta para Negocios Globales de la Escuela de Negocios McDonough de Georgetown. "Eso por sí solo no es malo, porque la proliferación en realidad dificulta aún más el diagnóstico".

Pero las empresas necesitan “un mejor modelo de redundancia operativa y respaldos”, comentó Khurana. “Nuestras plataformas tecnológicas tienen una combinación de sistemas heredados junto con sistemas modernos, lo que significa que el eslabón más débil determina el rendimiento general del sistema. Yo lo llamo un modelo de “castillo de naipes”.

En este momento existen salvaguardas, pero los reguladores de todo el mundo se han dormido en los laureles respecto a la gestión de riesgos de ciberseguridad. Los sistemas de TI son una infraestructura verdaderamente clave, dijo Khurana, lo que sugiere que "deberían pasar por el mismo tipo de rigor, pruebas y supervisión que vemos en empresas como Boeing o JPMorgan".

Le pregunté a Madnick si el mundo debería esperar más interrupciones masivas.

"Eso ya de por sí fue muy malo", dijo. “¿Podría empeorar? La respuesta es sí, podría”.

Por muy oneroso y lento que sea el reinicio manual de millones de dispositivos, la interrupción del viernes fue en última instancia un error puntual de una empresa que actuó rápidamente para solucionarlo.

Un mal actor que busque causar daños graves podría utilizar software para “hacer que las computadoras u otros equipos exploten, se incendien o se quemen, en cuyo caso no basta con reiniciarlos, sino que se destruyen”.

Bien, entonces hay un escenario de pesadilla que nos hace a todos anhelar ir a vivir a una cueva. Pero antes de empezar a acumular productos enlatados, Madnick tiene otra manera de ver nuestra situación moderna.

“Estas tecnologías nos brindan muchos beneficios que realmente valen la pena, el 99% de las veces”, afirmó. Lo más importante es prepararse para ese 1% de ocasiones en las que las cosas se ponen mal.

Sidebar

Ayuda-nov-dec

La falla tecnológica mundial demostró que estamos a sólo un error del caos

Follow Us on Social

Most Read