La inteligencia artificial logró hacerse pasar por humana en una prueba clásica de conversación

20 de mayo de 2026

La inteligencia artificial logró superar una de las pruebas más conocidas de la historia de la computación: convencer a otras personas de que estaban hablando con un ser humano.Un estudio publicado es

Contenido mejorado: La inteligencia artificial ha logrado un hito importante al superar una de las pruebas más emblemáticas en la historia de la computación: convencer a otros de que están interactuando con un ser humano. Un estudio reciente publicado en la revista PNAS el 19 de mayo evaluó diferentes modelos de lenguaje utilizando una versión clásica de la prueba de Turing, propuesta hace 75 años por el matemático Alan Turing. Los investigadores descubrieron que algunos sistemas de IA alcanzaron niveles de desempeño en los que los participantes no pudieron distinguirlos de personas reales.

La prueba de Turing consiste en una conversación escrita entre tres participantes: un interrogador, una persona real y una máquina. El objetivo de la máquina es hacerse pasar por humana. Si el interrogador no puede identificar correctamente cuál interlocutor es la máquina, se considera que el sistema ha pasado la prueba. Para este experimento, se evaluaron cuatro sistemas: GPT-4.5, LLaMa-3.1-405B, GPT-4o y ELIZA, un chatbot desarrollado en la década de 1960.

Participaron 126 estudiantes universitarios y 158 personas reclutadas a través de la plataforma Prolific. Cada participante mantuvo conversaciones simultáneas con un humano y un sistema de IA durante cinco minutos, y luego tuvo que determinar quién era la persona real. El modelo GPT-4.5 obtuvo los mejores resultados al adoptar una personalidad específica: una persona joven, introvertida y familiarizada con la cultura de Internet. En estas condiciones, fue identificado como humano en el 73% de las conversaciones.

Los investigadores también realizaron una segunda versión del experimento con conversaciones de 15 minutos, donde dos modelos mantuvieron resultados similares y conservaron tasas de éxito superiores al 50%. Este estudio plantea preguntas sobre la utilidad actual de la prueba de Turing para medir la inteligencia artificial y destaca el avance de los modelos de lenguaje en imitar conversaciones humanas de manera convincente en interacciones cortas. Los autores señalan que esta capacidad podría tener implicaciones importantes en áreas como la manipulación, la ingeniería social y la automatización de interacciones en plataformas digitales.

Comentarios

Cargando comentarios...