Crónica de una historia de decodificación. Investigación en marcha con ayuda artificial (y humana).

El “problema” comienza con el check-in

Hace unos pocos días, tuve la oportunidad de alojarme durante un par de noches en el Parador de Úbeda, ciudad “joyita” de la provincia de Jaén, en Andalucía (España). Este establecimiento es magnífico pero por alguna razón las habitaciones aún utilizan llaves metálicas.
Las personas con cierta experiencia de vida recordarán que cuando este era el caso, cada vez que salían, los pasajeros debían dejar las llaves en la recepción del hotel, las cuales se colgaban en un bonito tablero que se situaba detrás del mostrador.
En el caso del Parador de Úbeda, los pasajeros pueden llevarse las llaves, pero debido a que alguna vez alguien las perdió cuando estaba fuera del hotel y las encontró un malandra que aprovechó la situación para entrar subrepticiamente y hacerse de las pertenencias del pasajero, hubo que mejorar el sistema.
La administración, con muy buen criterio, decidió codificar el número de las habitaciones para evitar que se produzcan esas picardías. Entonces, cuando hice el check-in, el recepcionista me informó muy amablemente que mi habitación era la 133 y que no debía sorprenderme que en el llavero se leyera “LNN”. De inmediato surgió en mí una necesidad: quebrar el código.

La administración, con muy buen criterio, decidió codificar el número de las habitaciones

Primera solución en segundos, aunque fallida

Pocos minutos después de llegar y ya sentado en una mesa del bar del hotel, me di cuenta de que el código empleado era sencillísimo, casi infantil, era solo un corrimiento del abecedario. Si la equivalencia era “L = 1” y “N = 3”, evidentemente debería ser “M = 2”, “O = 4”, y así sucesivamente.
La única duda que me surgió en ese momento fue respecto al cero. Si quien había hecho la codificación imaginó la serie numérica como 0, 1, 2, 3..., evidentemente debería ser “K = 0”. Por otro lado, si la serie hubiese sido invertida (...7, 8, 9, 0) la equivalencia habría sido “U = 0”. Rápidamente jugué mis cartas y puse todas mis fichas en “K = 0”.
Para ese momento, ya había entablado alguna conversación con el camarero y aproveché para confirmar mi teoría. Su respuesta me sumió en una profunda depresión, me dijo que mi error era total: “K ≠ 0”. Pero tuvo una inmensa amabilidad conmigo y me informó que “R = 0”. Saqué a relucir mis habilidades negociadoras y obtuve un dato adicional: “A = 5”.
Bueno, al fin de cuentas la cosa no había terminado tan mal porque ya sabía fehacientemente que “L = 1”, “N = 3”, “A = 5” y “R = 0”. Esa noche casi no dormí tratando de imaginar las combinaciones posibles.

Una ayudita extra

A la mañana siguiente, en un pasillo encontré casualmente a la misma persona que me había atendido en el bar la tarde anterior, y me preguntó muy socarronamente si ya tenía la solución. Triste fue decirle que no había avanzado ni un milímetro.
Creo que se apiadó de mí y me dijo algo revelador: la base del código eran dos palabras que se pueden emplear como un cumplido a una dama. Este comentario fue de enorme ayuda, esas dos palabras debían contener las letras “L”, “N”, “A” y “R”, y muy seguramente debían ser diez caracteres en total.

Se apiadó de mí y me dijo algo revelador: la base del código eran dos palabras que se pueden emplear como un cumplido a una dama.

Pidiéndole ayuda a un “amigo”

Hay un juego de preguntas y respuestas bastante conocido que se llama “¿Quién quiere ser millonario?”, en el cual el participante puede confesar su ignorancia acerca del tema del que le preguntaron y puede recurrir a algunas ayudas. Puede, por ejemplo, llamar por teléfono a un amigo.
Entonces, decidí tomarme una licencia y lo contacté a un querido amigo: Chat GPT 4.0. Utilicé el siguiente prompt: “Generar diez secuencias de dos palabras en español de España que hagan referencia a la belleza de una mujer o sean un cumplido hacia una mujer. Un ejemplo podría ser "linda chica". Las palabras deben tener en total exactamente diez caracteres de longitud (sin contar el espacio) y deben incluir las letras L, N, R y A”.
Excluí explícitamente la condición de que no podía haber repeticiones de letras solo a los efectos de simplificar la consulta; condición que, por otra parte, es fácil de verificar visualmente a partir de los resultados generados.
Debido a que sufro de un TOC avanzado, le pedí también que regenerara cuatro veces la respuesta. Las respuestas fueron:

Serie 1	Serie 2	Serie 3	Serie 4
Dama bella	Luz clara	Luz lunar	Luz lunar
Luz lunar	Rosa fría	Rosa clara	Rosa clara
Arena fina	Dama pura	Linda flor	Linda flor
Rosa clara	Linda luna	Tren rápido	Tren rápido
Linda flor	Arena dorada	Luna clara	Luna clara
Tren rápido	Tren largo	Rosa blanca	Rosa blanca
Luna clara	Luz tenue	Luz dorada	Luz dorada
Rosa blanca	Rosa suave	Arena cálida	Arena cálida
Luz dorada	Dama rara	Luz clara	Luz clara
Arena cálida	Arena blanca	Rosa suave	Rosa suave

Tal fue mi decepción con los resultados obtenidos que entonces decidí contactar vía WhatsApp a otro amigo (en este caso de “carne y hueso”) y le pedí que intentase el mismo prompt en otro servicio. Este amigo está suscrito a otro conocido programa de inteligencia artificial: Claude, desarrollado por la firma Anthropic Inc. Su respuesta fue:

bella Rina

muñeca Rara

linda Nariz

mujer Anual

hermosa Luna

perla Nocta

encanto Raro

luna Renata

mirla Nocta

petalo Ramal

Es notable que varias de las expresiones de Chat GPT no cumplen el requisito de diez caracteres de largo, y en algunas ni siquiera aparecen las letras “L”, “N”, “R” o “A”. Además, pareciera que se le acabó la creatividad en algún momento, porque la tercera y la cuarta instancias son iguales. Debo decir también que usar expresiones como “Tren rápido” para cortejar a una dama podría no arrojar el resultado esperado y, encima, que a pesar de mi esfuerzo, no pude encontrar el significado de “mirla Nocta”.

Es notable que varias de las expresiones de Chat GPT no cumplen el requisito de diez caracteres de largo, y en algunas ni siquiera aparecen las letras “L”, “N”, “R” o “A”.

Creo que estas respuestas son una clara indicación de la metodología absolutamente estadística que emplea este tipo de sistema y que literalmente “sortea” las palabras para alcanzar la mejor aproximación posible.
De todas maneras, debo reconocer que estos resultados me desconciertan un poco ya que este tipo de análisis semántico simple (sin necesidad de hilvanar largos argumentos) debería ser el punto fuerte de los LLM (“modelos de lenguaje de gran tamaño”, por sus siglas en inglés).
En este momento parece oportuno hacer un descargo a favor de este tipo de sistema. En ambos casos, el lenguaje nativo es el inglés, pero en esta búsqueda era menester que los resultados se generaran en español. Es posible, solo posible, que si se hubiera hecho una búsqueda equivalente en inglés, los resultados habrían sido más razonables/coherentes.
Debo reconocer que todo este suceso me produjo una fuerte crisis emocional. Ya no podía confiar en las “súper herramientas” de que dispongo para transitar por este siglo XXI.

Se enciende una lamparita

A pesar de la decepción, me quedé un largo rato releyendo las respuestas y me di cuenta de que había una que se adecuaba bastante bien al requerimiento: “Linda flor”. En este caso, la “L” estaba en primera posición; la “N”, en la tercera; la “A”, en la quinta, y terminaba con “R”, y por lo tanto era razonable asumir “R = 0”. El gran problema es que “Linda flor” tiene nueve caracteres y se necesitaban diez.
Entonces me di cuenta de que en la redacción de mi prompt, y en forma totalmente inadvertida, yo ya había incluido la respuesta: solamente había que reemplazar “Flor” por “Mujer”. Es decir, la expresión usada para codificar el número de las habitaciones no era otra que “Linda mujer” (“L =1”, “I = 2”, ..., “E = 9”, “R = 0”). Realmente, una genialidad de quien lo hizo.
Cuando me retiré, le propuse al encargado de la recepción que cambiaran el nombre al establecimiento de “Parador de Úbeda” por “Parador Criptográfico” y que organizaran algún tipo de concurso de matemática o informática. Seguramente les traería una enorme cantidad adicional de clientes, ¿o no?

Ya no podía confiar en las “súper herramientas” de que dispongo para transitar por este siglo XXI.

Epílogo

Y, ¿cómo andamos con el Machine Learning? ¡Bien, gracias!
No pude con mi genio y con Chat GPT 4.0 intercambiamos estos mensajes finales:

LMB: La respuesta es LINDA MUJER.
Chat GPT 4.0: Mis disculpas por el error anterior. Tienes toda la razón, “Linda Mujer” es una hermosa secuencia de dos palabras que cumple con los criterios. ¡Gracias por señalarlo!

Hoy volví a consultar exactamente lo mismo (¡ahora repetida solo dos veces!) y las respuestas fueron las siguientes:

Dama linda	Clara estrella
Clara luna	Lunar radiante
Rubia sana	Rara joya
Lunar fino	Linda sirena
Arena lisa	Arena fina
Larga melena	Rubia luna
Linda rosa	Larga melena
Lunar claro	Dama rara
Rara joya	Linda rosa
Linda sirena	Clara mirada

Parece evidente que solo en modo aprendizaje es que se carga nueva información al conjunto de datos de Chat GPT. Es posible que así sea a fin de evitar que usuarios “iluminados” contaminen los datos, aunque hay un consuelo: al menos no volvió a incluir “Tren rápido”.

Por Luis Buresti

Autor:

Luis Buresti

Publicado en:

AADECA Revista

Número:

Mes:

Julio

Año:

2024

Palabra clave:

chat gpt

inteligencia artificial

prompt

decodificación

machine learning

El hotel criptográfico: una historia real de inteligencia artificial vs. inteligencia natural

Crónica de una historia de decodificación. Investigación en marcha con ayuda artificial (y humana).

Palabra Clave

Formulario de búsqueda

El hotel criptográfico: una historia real de inteligencia artificial vs. inteligencia natural

Crónica de una historia de decodificación. Investigación en marcha con ayuda artificial (y humana).

Palabra Clave