IA simbólica vs. redes neuronales. Y los modelos que vendrán.
Las redes neuronales tuvieron durante años mala prensa entre la comunidad científica y hoy son la piedra filosofal de la IA. ¿Qué nos espera mañana?
Aunque los titulares de la semana nos han recordado que Bard (el ChatGPT de Google) ya está accesible en Europa, he centrado mi atención en la integración de Code Interpreter en ChatGPT Plus. Los usuarios de pago pueden ahora acceder a una funcionalidad integrada en el chatbot, que permite hacer upload y download de ficheros, para usar funciones matemáticas a través de escritura de código (en Python, por ejemplo) y así analizar datos, pintar gráficos y mucho más. Algo que ya buscó con la funcionalidad “Function Calling” que se integró a principios de junio. Lo que se busca es facilitar la extracción de información estructurada y determinista de un LLM no estructurado y no determinista como GPT-4. Hablaremos de Code Interpreter más adelante porque aún no he tenido ocasión de probarlo, pero en los enlaces de hoy dejo un par de análisis magníficos que me han dejado con ganas de hacerlo.
Me leí hace tiempo Genius Makers un apasionante libro sobre el desarrollo de las redes neuronales que se centra en los protagonistas de esta revolución: Geoffrey Hinton, Yann LeCun y Joshua Bengio (los padrinos de la IA) y muchos más, como Andrew Ng, Ian Goodfellow, Jeff Dean, Demis Hassabis, … Esta historia de la ciencia reciente explica por qué las redes neuronales, cuyas bases teóricas fueron asentadas en los años 40 no ganaron tracción hasta el 2011, año en que Google se las toma en serio y decide adquirir en 2012 la startup (o más bien el cerebro) de Geoffrey Hinton. La siguiente línea de tiempo resalta los hitos relevantes hasta la llegada de GPT-2 y evidencia la aceleración reciente y el arranque de las IAs generativas que desencadenó Ian Goodfellow con las GANs (generative adversarial networks).
Le escuché hace tiempo a David Llorente, de Narrativa la diferenciación entre IA simbólica y redes neuronales. Una de las principales diferencias es cómo se produce el aprendizaje: en el razonamiento simbólico, las reglas se crean mediante la intervención humana, en el “deep learning” (redes neuronales) los algoritmos aprenden reglas a medida que se establecen correlaciones entre entradas y salidas. El primero es un enfoque “de abajo arriba”, son humanos los que establecen las reglas. Una tarea minuciosa que limitó la velocidad de desarrollo de este tipo de IA y su precisión, especialmente en tareas como la escritura (la traducción de textos) y otras funciones de creación de contenido. Sin embargo, en tareas deterministas como la creación de órdenes de compra venta en mercados financieros, la compra programática de publicidad, o el control automático de armamento, la IA simbólica tiene más sentido y lleva mucho años en aplicación industrializada.
Sin embargo, el uso masivo por parte del ciudadano de a pie de la IA arranca con las redes neuronales (reconocimiento de imágenes en el móvil o ahora el uso de herramientas tipo ChatGPT o MidJourney). La introducción de Code Interpreter busca suplir limitaciones de los LLMs, introduciendo lógica estructurada en modelos no estructurados. Si un día se llegara a una AGI (Inteligencia General Artificial, signifique eso lo que signifique), puede que se consiga con una combinación de IAs generativas y simbólicas. Mientras tanto, hay muchos investigadores (y cada vez más dinero) trabajando en mejorar los sistemas basados en redes neuronales: como la detección y supresión de alucinaciones o el desaprendizaje (machine unlearning).
Hemos anunciado esta semana la creación del Foro IA en MXC (Marketing, Experiencia de cliente y Comunicación). Impulsado desde Good Rebels y fundado por un increíble grupo de 20 ejecutivos MXC de grandes empresas y startups para fomentar el aprendizaje y el uso de herramientas IA en la profesión. Puedes leer más sobre la iniciativa y alguno de los profesionales que componen el grupo de fundadores aquí.
El domingo que viene vuelvo a tu buzón,
Fernando.
¿Con ganas de más?
Enlaces que he explorado esta semana y me han parecido relevantes:
Code Interpreter permite a GPT-4, cargar y descargar información, y escribir y ejecutar programas en un espacio de trabajo único. Y ser útil de una manera que no era posible con ChatGPT. LINK
Un análisis (de hace unas semanas, pero re-editado) de cómo funciona Code Interpreter y cómo podría cambiar el mundo de las finanzas. EVERY
The Verge ha hecho una encuesta a 2000 personas sobre cómo están usando la IA y sus temores al respecto. La mayoría ha oído hablar parte de ChatGPT pero no sabe lo que es MidJourney o Stable Diffusion. El uso está dominado por millenials y generación Z. Y muchas más cosas. THE VERGE
Adobe es el promotor de una iniciativa que arrancó hace años, pero que cobra más importancia ahora si cabe. Content Authenticity Initiative, una comunidad de medios de comunicación y empresas tecnológicas, ONGs, académicos y otros actores que trabajan para promover la adopción de una norma industrial abierta para la autenticidad y procedencia de los contenidos. CAI
Estoy en la lista de espera mordiéndome las uñas, para probar Typeface que fue fundada por un ex-Adobe y ha conseguido levantar 100 mill de dólares a valoración de 1 billón en serie B. El objetivo, crear soluciones con IA generativa orientadas a funciones corporativas MXC. TYPEFACE, TECHCRUNCH
Threado construye un chatbot como agente de soporte para comunidades online. Se entrena con las conversaciones de la comunidad, URLs de documentos de ayuda, documentación o PDFs. Se puede afinar y después se integra en Slack, Discord o en la web. THREADO
YouTube prueba cuestionarios (quizzes) generados por IA en vídeos educativos. Esta idea me fascina, y no sé bien por qué. TECHCRUNCH
El futuro de los LLMs es open source. “Con la publicación de los LLM Falcon-7B y Falcon-40B, tenemos por primera vez LLMs de código abierto que empiezan a rivalizar con la calidad de los modelos de pago más populares.” LINK
Stability.AI ha lanzado Clipdrop, para crear imágenes completas usando un dibujo sencillo (doodle). Sigo con la boca abierta. CLIPDROP
Toda startup es hoy una AI startup. Más servicios tipo templates con IA generativa integrada para crear activos simples para social media, web, anuncios, newsletters, ... Smart Layouts tiene lista de espera. LINK