La trayectoria de la Inteligencia Artificial (IA)

Desde ideas de Aristóteles hasta llegar a chatGPT

En un mundo donde las máquinas conversan como humanos y los autos se conducen solos, la Inteligencia Artificial (IA) es con seguridad uno de los temas de conversación. Lo que podría sorprender es que mucho de estos conceptos no son nuevos. En una serie de posteos voy a explicar qué es esto de “IA”, empezando hoy con la base histórica.

¿Qué es IA?

La Inteligencia Artificial (IA), al igual que otras disciplinas científicas, se basa en observar el mundo que nos rodea para poder emularlo. De manera similar a cómo los hermanos Wright se inspiraron en el vuelo de los pájaros para diseñar aviones, la IA busca entender la mente humana y, posteriormente, imitar su funcionamiento.

Este concepto de entender la mente humana se puede rastrear incluso hasta la época de Aristóteles (384-322 AC), quien desarrolló un sistema que permite el razonamiento adecuado. El sistema se basa en llegar a conclusiones de manera mecánica, utilizando premisas iniciales en lo que hoy se conoce como el "silogismo aristotélico".

Desde la época de Aristóteles hasta nuestros días, diversas mentes han contribuido en nuestra -aún- pequeña comprensión de cómo funciona la mente. Aunque muchos esfuerzos han sido realizados, los primeros avances significativos en la capacidad de "imitar” el comportamiento de la mente surgieron en la década de 1950. Fue en este periodo que John McCarthy acuñó el término "inteligencia artificial" con la siguiente definición:

"La construcción de programas de computación que pueden realizar tareas que actualmente son ejecutadas de manera satisfactoria por seres humanos, ya que requieren un alto nivel de procesamiento mental. Estas tareas incluyen aprender de la percepción, organizar conceptos y llevar a cabo razonamiento crítico."

Ciclos de auge y el invierno de IA

La historia de la IA ha experimentado, al menos en dos ocasiones, ciclos de entusiasmo exuberante seguidos de épocas de aparente estancamiento.

En la década de los 60, se lograron avances notables al resolver problemas que anteriormente se consideraban reservados para los humanos, como demostrar teoremas simples o jugar a las damas. No obstante, al intentar abordar desafíos más reales, los algoritmos se mostraron poco prácticos.

Un argumento aceptado de la época era que el poder de cómputo era insuficiente para impulsar la IA. Es una afirmación veraz, si consideramos que estamos en los años incipientes de la computación.

Arthur Samuel jugando damas con una IBM 704 en Poughkeepsie, New York

Sí! Es increible que en esa máquina funcionaban algoritmos que se pueden clasificar como de IA.

En los años 80, con la llegada de microchips más potentes, se reveló que muchos de los enfoques no solo carecían de poder de computo, sino que eran inviables desde el punto de vista computacional (tardarían cientos de años o simplemente no sabemos si encontrarían una solución). Los algoritmos funcionaban para problemas pequeños, pero no podía escalarse a problemas más complejos.

En los años 80 se popularizaron los sistemas expertos. Una técnica que utiliza reglas y un motor de inferencia para realizar conclusiones en un dominio específico. Por ejemplo, MYCIN, un sistema especializado para brindar diagnóstico en enfermedades de la sangre.

A continuación un ejemplo de reglas para realizar un diagnóstico médico.

Si el paciente tiene fiebre alta y dolor de garganta, entonces podría tener una infección de garganta.

Si el paciente tiene fiebre y dificultad para respirar, entonces podría tener una infección pulmonar.

Si el paciente tiene fiebre baja, fatiga y dolor en las articulaciones, entonces podría tener un resfriado común.

En este ejemplo, cada regla establece una conexión entre ciertos síntomas y una posible enfermedad. El sistema experto analizaría los síntomas reportados por el paciente y aplicaría estas reglas para llegar a una sugerencia de diagnóstico.

Los sistemas expertos migraron de la academia a la industria, aunque su implementación no era sencilla. Requerían la colaboración de expertos en el dominio del problema junto con profesionales en IA para codificar las reglas necesarias. Sin embargo, esta cooperación resultaba muy costosa para la resolución de varios problemas. Los sistemas permanecen en nichos.

En cada ciclo de entusiasmo, la inversión aumenta, lo que a su vez impulsa avances, técnicas y aprendizajes. Luego, cuando las expectativas y las posibilidades técnicas se calibran, la realidad que se materializa puede no ser tan revolucionaria como se anticipaba, pero definitivamente la nueva realidad es diferente.

La nueva ola desde ~2010

A comienzos del milenio aparece un cambio de paradigma en IA. El enfoque hasta este momento había sido en mejorar los algoritmos. La nueva propuesta es que se pueden obtener mejores resultados, utilizando los mismos algoritmos, pero con un volumen de datos considerablemente mayor.

Este enfoque se combina con dos desarrollos claves:

  • El auge de Internet ha generado enormes volúmenes de datos.

  • Las Unidades de Procesamiento Gráfico (GPU) aceleran los cálculos de los algoritmos de aprendizaje.

Basada en estas premisas de tener acceso a un amplio conjunt de datos, y poder de procesamiento robusto, es que las empresas como Alphabet (Google), Meta (Facebook), Amazon, tienen una posición privilegiada para mejorar sus modelos de datos.

Con técnicas como esta se lograron avances como:

  • En 2011, Watson, la IA de IBM, conquista el programa de preguntas y respuestas Jeopardy, ganando $1 millón.

  • En 2012, La máquina “aprende” (sin asistencia) a identificar imágenes de Gatos.

  • En 2015, En 2016 AlphaGO (AI de Google) le gana a Lee Sedol, el mejor jugador del mundo Go, un juego más complejo que el Ajedrez.

  • En 2018, los autos autónomos llegan a la calle. Acá un video publicado por Bill Gates en este año (2023).

Estos avances atraen inversión, lo que a su vez genera un circuito virtuoso de avances.

El boom de chatGPT

En Noviembre 2022 surge chatGPT y la notoriedad que recibe es completamente justificada. Los resultados que esta tecnología puede generar son realmente impactantes. Actualmente, es posible utilizar este modelo de manera gratuita para una variedad de aplicaciones, como:

  • Componer poesía.

  • Realizar correcciones editoriales.

  • Actuar como tutor para el aprendizaje de nuevos temas.

  • Generación de ideas.

  • Asistencia en programación.

Todas estas capacidades se ofrecen en lenguaje natural, con resultados sobresalientes en inglés gracias al amplio volumen de datos disponible. Sin embargo, estas habilidades se extienden a varios idiomas, incluyendo el español, con altos niveles de competencia.

Naturalmente, junto con estas capacidades emergen preguntas éticas y legales significativas. Preguntas como "¿Quién es responsable de las decisiones respaldadas por la IA?", "¿Cómo afecta a aquellos cuyos trabajos son reemplazados por la IA?" y "¿Quién es el autor de una creación generada por la IA?" surgen como dilemas abiertos.

Si aún no probaste chatGPT, te recomiendo que lo hagas.

Resumen

La Inteligencia Artificial (IA) no es un concepto nuevo en el año 2023; ha estado presente durante décadas tanto en el ámbito académico como en sectores industriales selectos. A lo largo de su historia, la IA ha atravesado períodos de entusiasmo y avances, seguidos por etapas de estancamiento.

En cualquier caso, posterior a cada época de entusiasmo han quedado conceptos, y nuevas herramientas que previamente no existían.

Definitivamente estamos en una nueva ola de entusiasmo por la IA. La ola no empezó este año, sino que se gestó alrededor del 2010. En esta etapa, la centralización de datos impulsada por el modelo de Internet y el aumento del poder de cómputo gracias a las GPUs han sido los catalizadores que han llevado a la IA a nuevos horizontes.

Reply

or to participate.