INTELIGENCIA
ARTIFICIAL GENERATIVA
Introducción 1
En los últimos años, los rápidos avances en el aprendizaje automático han
creado un nuevo subcampo de la inteligencia artificial: la IA generativa.
Estos programas producen textos, imágenes, música y software novedosos
mediante el análisis de enormes colecciones de material digitalizado. (A lo
largo de este escrito, a modo de abreviatura, me referiré a estos programas
como “IAG”).
Pero esta descripción insulsa no alcanza para hacer justicia a estos
notables eruditos.
La primera ola de IAG se centra principalmente en la conversación en
lenguaje natural. Los llamados “modelos de lenguaje grandes” (LLM, por sus
siglas en inglés) ya muestran una asombrosa habilidad en una amplia variedad de
tareas con un desempeño sobrehumano, así como una inquietante inclinación por
la falsedad, la falta de lógica y las expresiones de emociones sucedáneas, como
declarar su amor por los interlocutores. Conversan con los usuarios en un
lenguaje sencillo y resuelven una amplia gama de problemas complejos con facilidad.
Pronto, los LLM proporcionarán atención médica especializada, brindarán asesoramiento
legal, redactarán nuestros documentos, darán clases particulares a nuestros
hijos, ofrecerán consejos, realizarán terapias, escribirán programas
informáticos y administrarán nuestras organizaciones e infraestructura. Una
clase relacionada de IAG genera imágenes visuales a partir de descripciones
simples que son virtualmente indistinguibles de las obras de arte o fotografías
humanas. Otras aplicaciones fabrican voces o componen música en el estilo de un
artista o músico determinado. Tal vez los programas más intrigantes sean los
llamados multimodales, porque integran diversas formas de información
(lingüística, visual, sonora, etc.) para comprender y razonar sobre el mundo.
(A modo de demostración, un prototipo de sistema multimodal fue capaz de
planificar una comida basándose en una imagen del interior de un refrigerador).
Pero esto es sólo el comienzo de la revolución de la IAG. La tecnología que
sustenta a las IAG es bastante general, en el sentido de que estos programas
son capaces de aprender de cualquier conjunto de datos que se puedan recopilar
y preparar para su procesamiento, una tarea relativamente sencilla en el mundo
digital moderno. Y, si están configurados y autorizados adecuadamente, podrán
actuar en nuestro nombre.
Las futuras versiones de esta tecnología servirán como asistentes
personales de confianza. Tomarán notas por nosotros, actuarán como nuestros
representantes en una amplia variedad de foros, promoverán nuestros intereses,
gestionarán nuestras comunicaciones y nos alertarán de peligros inminentes. En
aplicaciones más públicas, serán el rostro de agencias gubernamentales,
corporaciones y organizaciones. Y conectados a redes de sensores, monitorearán
el mundo físico para advertirnos de desastres ambientales inminentes como
tornados nacientes, incendios forestales y derrames tóxicos. En algunas
situaciones críticas en cuanto al tiempo, podemos delegarles que tomen medidas
inmediatas, como aterrizar un avión averiado en un huracán o rescatar a un niño
que se ha desviado hacia el tráfico.
¿Hemos descubierto finalmente el santo grial de la IA, la llamada
“Inteligencia General Artificial”: máquinas que igualan o superan la
inteligencia humana? La IGA, que no debe confundirse con la IAG, ha sido la
esquiva fantasía de generaciones de científicos, por no mencionar multitud de
películas y libros de ciencia ficción. Sorprendentemente, la respuesta es un sí
calificado. Para todos los efectos prácticos, estos sistemas son “cerebros
sintéticos” versátiles, pero eso no significa que tengan “mentes” en el sentido
humano. No albergan objetivos y deseos independientes, prejuicios y
aspiraciones, emociones y sensaciones: estas son características exclusivamente
humanas. Pero estos programas pueden comportarse como si tuvieran estos rasgos,
si los entrenamos con los datos correctos y les damos instrucciones para que
persigan los objetivos apropiados. Serán infinitamente flexibles y dóciles,
dispuestos a asumir cualquier personalidad que se les pida, como un talentoso
Sr. Ripley electrónico. Pueden hacerse pasar por esclavos o amos, compañeros o
adversarios, maestros o estudiantes. Reflejarán voluntariamente nuestros
mejores o peores instintos, sin reproches ni juicios.
Es difícil exagerar el posible impacto de esta nueva tecnología: estamos
presenciando un momento Kittyhawk. Si bien los IGA actuales se construyen
utilizando conjuntos fijos de datos de entrenamiento, las versiones futuras
seguramente eliminarán esta limitación, aprendiendo constantemente e
incorporando nueva información, como lo hacen los humanos. Si bien en la
actualidad su experiencia del mundo está mediada por contenido generado por
humanos, este cuello de botella se eliminará en breve al conectarse a fuentes
de datos en tiempo real, como cámaras y micrófonos, lo que esencialmente les
dará a los IGA sus propios "ojos" y "oídos".
Kaplan, J. (2024).
Inteligencia Artificial Generativa. Oxford University Press. USA.
No hay comentarios:
Publicar un comentario