La inteligencia artificial no puede resolver este famoso misterio de asesinato
Los programas de inteligencia artificial que analizan y generan texto están cambiando la forma en que leemos y aprendemos. Para analizar el texto, los modelos de IA espían a través de pistas de texto, como opciones de palabras, para ver cómo están conectadas. Pero, ¿qué sucede cuando esas pistas son intencionalmente vagas y confusas? Traté de responder a esa pregunta cuando desafié a los desarrolladores de IA a resolver Cain’s Jawbone, un libro de acertijos y misterios de asesinatos de 1934 de casi un siglo de antigüedad.
Este libro llegó a mi vida tan misteriosamente como un detective literario podría esperar. Una tarde de octubre de 2022, Amazon entregó al azar un paquete en mi puerta sin notas ni dirección de devolución. Nunca he oído hablar del libro, pero una búsqueda en Google me dice que Cain’s Jawbone es tanto un misterio de asesinato como un acertijo alucinante. El libro fue publicado con todas sus páginas mezcladas deliberadamente; para resolver el caso, los lectores primero deben reorganizar el orden de las páginas y luego nombrar a los seis asesinos y sus víctimas.
El autor de esta siniestra trama es (sorprendentemente) un experto en acertijos. Edward Mathers trabajó como compilador de crucigramas para The Observer bajo el seudónimo de Torquemada. Publicó Jawbone de Kane durante la llamada edad de oro de la novela policíaca, pero solo dos personas lograron abordarlo antes de que el libro se agotara. En 2022, John Mitchinson, cofundador de la plataforma editorial Unbound Publishing, se topó con una copia de la historia y su solución en un museo literario británico, y Mitchinson decidió reimprimir el rompecabezas de 100 páginas. «Dije: ‘Bueno, esto es genial. Es una historia de detectives, ¿qué tan difícil es armarla?'», recuerda.
Resulta que la respuesta es «muy, muy difícil». En los últimos años, solo cuatro personas han resuelto este rompecabezas. Luego, el libro se volvió viral después de que varios usuarios de TikTok intentaron reordenar las páginas usando un colorido «muro asesino». La nueva popularidad del libro llevó a Mitchinson a imprimir varias copias más de las 5.000 copias originales.
Cuando salió mi Jawbone of Kane, en lugar de designar un espacio en la pared para las páginas, mi esposo y yo las extendimos sobre la cama de invitados. En una noche con poca luz, mientras analizábamos el lenguaje florido y deliberadamente vago, sugerí usar un algoritmo de inteligencia artificial para abordar la novela.
Tratando de arreglar la quijada de Cain.Crédito de la imagen: Austin Hughes
Como no soy un experto en software, comencé a buscar una empresa de inteligencia artificial dispuesta a resolver este difícil problema. Pero la mayoría de las IA no han sido entrenadas específicamente para reordenar páginas o analizar las peculiaridades lingüísticas del inglés de la década de 1930. Finalmente, contacté a Zindi, una empresa con sede en África que organiza competencias de inteligencia artificial en las que 50 000 científicos de datos usan algoritmos para resolver problemas difíciles y ganar premios. Zindi estaba interesada en organizar una competencia y, con el apoyo de Unbound, creé la Competencia Jawbone Murder Mystery de Kane 2022; digitalizamos el libro de 90 años y desafiamos al mundo a usar algoritmos de procesamiento de lenguaje natural (NLP) para reordenar las páginas.
Los algoritmos de PNL, como el famoso ChatGPT, intentan comprender la información del texto comparando su contexto y lenguaje con los datos de entrenamiento que recibe. Dichos algoritmos pueden analizar texto nunca antes visto convirtiendo cada palabra en un «token» y luego analizando cómo encaja cada token en una composición completa. Esto ayuda a los algoritmos de IA a analizar el texto de manera rápida y eficiente, ya sea literatura o informes científicos. Gentilmente me negué a usar inteligencia artificial para descifrar quién me envió este divertido libro, en lugar de enviar mensajes de texto a amigos y publicar en Instagram para encontrar al culpable.
En nuestra competencia, los participantes comienzan con un modelo de PNL existente llamado BERT, desarrollado por Google y disponible en una biblioteca de código abierto, que se puede modificar para usos específicos. «Estos modelos… se entrenan solo con la gran cantidad de datos disponibles para los creadores del modelo, y luego se refinan para seguir un conjunto específico de instrucciones», dijo Jonathan May, profesor asociado de investigación de ciencias de la computación en la Universidad del Sur en California. Para refinar su modelo para este uso específico, proporcionamos a los participantes la primera novela de misterio de Agatha Christie, The Mysterious Affair of Styles, como datos de entrenamiento, ya que la historia está relacionada con la mandíbula de Kane, fue escrita durante el mismo período y contiene un lenguaje similar. como pistas de fondo que muestran novelas de misterio clásicas.
AI tiene una larga historia en la ficción, incluidos los misterios de asesinatos. En 1973, el científico informático Sheldon Klein ideó el Escritor de ficción automatizado, que, según él, podía escribir un misterio de asesinato de 2100 palabras en 20 segundos. Desde entonces, los programadores e ingenieros han perfeccionado los resultados de estos modelos utilizando más datos. «En cierto modo, los misterios de asesinatos son fáciles», dice Mike Shapples, profesor emérito de tecnología educativa en el Instituto de Tecnología Educativa de la Universidad Abierta. “Tiene una estructura de trama estándar: se encuentra el cuerpo, vienen los detectives, obtienes una distracción, etc.” También podría ayudar al programa de lenguaje de IA a tratar de poner las páginas mezcladas de estas historias nuevamente en el orden correcto.
Desafortunadamente, Cain’s Jawbone presenta el último desafío para los algoritmos de análisis del lenguaje: no solo la historia transcurre completamente fuera de secuencia, sino que también está diseñada para obstaculizar al lector. Por ejemplo, el lenguaje es muy estilizado (Mitchinson lo describe como “un poema posmoderno”) y deliberadamente vago para dificultar al máximo el orden de las páginas. Además, la historia está llena de pistas falsas, como nombres falsos para algunos personajes y nombres engañosos para otros, todo lo cual puede confundir a los modelos de IA y los solucionadores humanos. Como resultado, ninguno de los desarrolladores de IA pudo descifrar el rompecabezas, aunque algunos de ellos lograron algunos avances.
El econometrista MG Ferreira de Sudáfrica fue uno de los ganadores de la competencia de IA con la puntuación más alta del 42%. Esto significa que su programa clasificó correctamente 42 páginas de 100. «La PNL tiene cierta comprensión de esto, como saber que las tormentas eléctricas se juntan», dijo Ferreira. «Pero el problema es que el libro trata de confundirte con pistas equivocadas. Destruye la comprensión de la PNL». . «Yendo en esa dirección, eventualmente podremos resolver todo el problema. Pero en ese punto, el procesamiento del lenguaje natural será una pequeña parte, y la cobertura humana será una gran parte, lo que yo llamo asistencia de la máquina», agregó. .
La competencia de misterio de asesinato muestra que los programas de lenguaje de IA actuales pueden ser capaces de realizar hazañas impresionantes, pero no se enfrentarán cara a cara con Poirot en el corto plazo. Estos modelos no son buenos para analizar cosas sin contexto, lo que puede causar problemas a los investigadores que buscan utilizar la PNL para analizar lenguas antiguas. Dado que algunas civilizaciones desaparecidas tienen escasos registros históricos, la falta de contexto dificulta que la IA aprenda a traducir sus idiomas perdidos.
Al menos esta experiencia me ayudó a resolver un dilema: encontré a la persona que me envió el libro y me puse en la búsqueda de resolverlo. El culpable resultó ser un amigo mío de la escuela primaria que no tenía redes sociales pero estaba obsesionado con los misterios de asesinatos, como yo.
Este es un artículo de opinión y análisis, y las opiniones expresadas por el autor no representan necesariamente las de Noticias-Hoy.