Cómo la IA generativa puede ayudar a gestionar nuestros datos.
La IA generativa, entrenada con datos "de otros", puede mejorar la gestión de la cadena de valor del dato en nuestra organización.
En la versión sonora de este newsletter (Rebel Intel the Podcast) hemos entrevistado esta semana a Justo Hidalgo, Chief AI Officer en Adigital, que nos explicó en detalle qué es la transparencia algorítmica, un certificado pionero creado por la Asociación Española de la Economía Digital.
¿Qué significa ser transparente para un sistema de IA? Involucra, entre muchos otros aspectos, informar, siempre dentro de los criterios de la empresa o institución y los requisitos regulatorios acerca de elementos tales como los tipos de fuentes de datos, los criterios de decisión o la estructura de los algoritmos utilizados en la IA.
Hace un par de semanas, participé en una reunión de trabajo de Big Data Magazine en la que intercambié ideas, entre otros, con varios Chief Data Officers de grandes corporaciones. Y en la que confirmé una sensación creciente: parece que la gestión de los datos empresariales “propios” hubiera perdido brillo (recordando cuando el “big data” era sexy). Unas herramientas IA que han aprendido a conversar, pintar o cantar con datos externos, han cobrado protagonismo y nos podrían hacer olvidar lo importante que es mantener nuestra casa (y sus datos) en orden.
Lo decía en una anterior edición de este newsletter y lo repito bastante, unas herramientas que cuestan unos pocos euros al mes (en su opción de pago) no pueden representar una ventaja competitiva para ninguna organización. Pero aprender a combinar estas herramientas con nuestros datos, sí nos podría proporcionar algo de ventaja.
¿Qué aporta la IA Generativa a la gestión de datos?
Muchas empresas manejan datos no estructurados en multitud de formatos: están en correos, vídeos, documentos de texto, emails, redes sociales… ¿Cuántas son las empresas que pueden decir que tienen ordenado y clasificado todo ese material? Es un trabajo complejo y pesado, especialmente si hablamos de sectores que trabajan con grandes cantidades de información personal.
Al mismo tiempo, cada vez más empresas están utilizando los modelos pre-entrenados de IA Generativa (LLMs) para obtener algún tipo de beneficio (mejorar la comprensión de sus clientes, automatizar la atención, afinar sus campañas, personalizar las interacciones, etc). Y se requiere esfuerzo para asegurarse de que los datos -propios- utilizados han pasado por las fases de arquitectura e ingeniería, y de ese modo ofrecen garantía de calidad y seguridad en el uso.
Y aquí aparece un buen giro de guión: la IA generativa, capaz de generar outputs gracias a su entrenamiento con enormes cantidades de datos no estructurados puede ayudarnos a organizar nuestros datos. Nos ayuda a limpiar los datos eliminando el ruido (corrigiendo anomalías), descartando datos corruptos o no válidos. O a enriquecer los datos con etiquetas de metadatos. Los metadatos son descripciones de los datos no estructurados, donde se especifica información como el origen, las relaciones entre datos, si hay o no derechos de propiedad, etc... Los metadatos garantizan que los algoritmos hacen un uso optimizado de los datos.
También nos puede ayudar a romper silos organizacionales: conectando bases de datos, encontrando datos duplicados, incompletos o no estandarizados, que la IA se encarga de ordenar y unificar. O anonimizar datos para garantizar la confidencialidad en entornos afectados por la privacidad. Encapsulando los datos que contienen información sensible o identificable, y conservando las propiedades estadísticas de los datos originales.
Y también puede generar datos: la IA puede crear sets de datos “sintéticos” que imitan las características y propiedades de los datos reales, cuando no disponemos de suficientes datos para entrenar modelos de IA o son difíciles de obtener.
Relacionándonos con los datos en lenguaje natural.
Otra de las grandes ventajas de la IA generativa, que no es exclusiva para la gestión de datos, pero que va a tener una gran relevancia, es que nos permite entablar conversaciones en lenguaje natural con los datos. Lo hemos experimentado con el lanzamiento el año pasado de Code Interpreter en ChatGPT Plus (y que se ha introducido en la funcionalidad para crear asistentes). Subimos un fichero excel y le pedimos a ChatGPT información sobre los datos del fichero. El sistema escribe y ejecuta código Python en un entorno de ejecución aislado, de forma iterativa para resolver problemas de análisis de datos, matemáticas y código más complejos.
La tecnología Natural Language to SQL (NL2SQL) permite a cualquier persona, sin conocimientos de programación SQL tradicional, consultar bases de datos y extraer información utilizando lenguaje natural. Cualquier profesional MCX o de otra actividad sin background técnico (un médico, un abogado, un profesor…) puede articular sus dudas y obtener una respuesta sin depender de un analista de datos.
El auge de las bases de datos vectoriales.
Las bases de datos vectoriales están cambiando la manera en que gestionamos y accedemos a grandes volúmenes de datos, tanto estructurados como no estructurados. Su gran ventaja es la capacidad de representar datos complejos en un formato eficiente. Al convertir los datos en vectores y ubicarlos en un espacio multidimensional, la IA generativa es capaz de capturar las relaciones semánticas, el contexto, y las similitudes entre distintos sets de datos, lo que permite búsquedas y análisis más sofisticados para extraer insights y correlaciones. Particularmente útil para trabajar con información compleja como imágenes, texto y sonido, que no se ajustan fácilmente a estructuras tabulares. Si quieres saber cómo funcionan con mayor detalle, este artículo en español me ha parecido bastante completo.
Junto con las bases vectoriales, la IA generativa nos acerca más a la promesa de una búsqueda semántica (y con lenguaje natural) para acceder a todo el conocimiento de una organización, por ejemplo. Buscando romper “silos funcionales”, accediendo a diferentes sistemas y como hemos explicado arriba, creando “metadatos” que ayuden en las búsquedas más complejas. Pero este caso de uso merece un capítulo aparte.
La IA generativa se convierte en un aliado clave para limpiar, estructurar y acceder a nuestros datos. Pero si descuidamos la gestión de los mismos, estas herramientas no nos ayudan en el día a día, pero no proporcionarán una ventaja diferencial y sostenible en el tiempo.
El próximo domingo, vuelvo a tu buzón.
Fernando.
Enlaces de interés para el profesional MCX.
Lecturas seleccionadas de la semana:
Perplexity se acerca a la categoría de unicornio tras una nueva ronda de financiación que sitúa su valoración en 1.000 millones de dólares. Hace apenas dos meses estaba valorada en 520 millones, lo que da una ligera idea del potencial que los inversores están viendo en un lucrativo universo de búsquedas soportadas por IA. CRUNCHBASE
Anthropic ha presentado esta semana Claude 3. Además de superar a Gemini y Chat GPT en muchos parámetros técnicos (según la propia Anthropic), algunos de los que lo han probado (desde España no tenemos acceso) aseguran que es el LLM más "humano", cercano y creativo hasta la fecha. ANTHROPIC
Captar el potencial de la IA generativa es más difícil de lo que parece: poner en marcha pilotos de IA Gen es relativamente fácil, pero escalarlos y obtener un valor significativo requiere cambios organizativos sustanciales. De este modo, la ventaja competitiva provendrá de una reorganización destinada a facilitar la implementación, el despliegue y la mejora de las soluciones IA. MCKINSEY
Puede que estemos pensando en integrar un chatbot IA para atender a nuestros usuarios, pero no debemos hacerlo sin antes habernos planteado estas tres cuestiones: ¿resuelve una necesidad real de los usuarios? ¿Se alinea con nuestra estrategia de producto? ¿Es escalable o contempla flexibilidad en el futuro? Nielsen Group nos recuerda siempre la importancia de alinear tecnología y UX/UI. NIELSEN NORMAN GROUP
Lore Machine elabora ilustraciones (para guiones, scripts, relatos cortos, story boards, o lo que se nos ocurra) a partir de los textos (hasta 30.000 palabras) que introducimos. MIT TECH REVIEW
Google ha anunciado profundas reformas para mitigar la invasión de spam generado por IA en los resultados, un problema que afecta seriamente a su reputación y su posición dominante en las búsquedas. Con estos cambios, pretende reducir un 40% los enlaces de baja calidad. GOOGLE
Los fundamentos de la IA generativa son difíciles de entender (la arquitectura transformer, sin ir más lejos), pero las herramientas son fáciles de usar. Y esto puede llevar a muchos profesionales a considerarnos “expertos” sin acercarnos siquiera a un conocimiento técnico mínimo. Una encuesta pone de manifiesto esa desconexión: el 67% de los miembros de comités de dirección se cree con un conocimiento “experto” o “avanzado” de la IA generativa. Yo llevo cientos de horas acumuladas de estudio, y aún no termino de entender muchas cosas. LINK, FORBES
Wix ha presentado Website Builder, que permite construir un sitio web a partir de prompts: solo tenemos que indicar nombre, actividad y objetivos, y en segundos la IA creará una web. La herramienta es gratuita, pero hay que pagar por todas las funcionalidades extra. THE VERGE
El riesgo de crear materiales de comunicación espectaculares usando IA y que no se ajustan “para nada” a la realidad. De ello va el desastre de la Experiencia Willy Wonka. FAST COMPANY
Ojo a las afirmaciones grandilocuentes: “la IA curará el cáncer”. Yo me reconozco en esta tesitura a veces. Pero la realidad médica a la que nos enfrentamos en la vida real se empeña en estropear titulares tecno-optimistas. LINK
Algunos de los planes e inversiones alrededor de la IA generativa de los grandes conglomerados publicitarios. MARTECH
¿Estamos preparados para ver un anuncio cuando le preguntamos algo a un LLM? La publicidad dentro de los chatbots apunta a negocio emergente. Ya hay startups que colocan resultados patrocinados en las respuestas a determinadas consultas en algunos GPTs de OpenAI. Y sonando de fondo, el fin de las cookies. AXIOS
Una agente de Qatar Airlines vestida de metaverso mejora la experiencia en vuelo y ayuda a la aerolínea a vender más. ADWEEK
La BBC ha publicado una guía de uso de la IA, dirigida a sus trabajadores y colaboradores. "Cualquier uso de la IA por parte de la BBC en la creación, presentación o distribución de contenidos debe incluir una supervisión y aprobación editorial humana activa, adecuada a la naturaleza de su uso y coherente con las Directrices Editoriales". Amén. THE GUARDIAN
La semana pasada os hablé de Suno AI, una startup que me ha sorprendido por su capacidad de crear canciones de la nada y que suenen bien (por primera vez). En esta entrevista con Mikey Shulman, CEO y co-fundador, se desvelan algunos secretos de cómo han llegado a esto (se le está prestando poca atención, pero se trata de otra revolución en ciernes). YOUTUBE
Los profesionales de marketing necesitan cierta formación técnica para extraer el máximo valor de las herramientas IA. En esta entrevista se habla sobre ingeniería de prompts aplicada al marketing. Un dato llamativo: el 60% de las veces los profesionales no escriben los prompts, solo se dejan llevar por las sugerencias de la herramienta. MARTECH
El milagro de los chips y su miniatura, ilustrado con maravillosos gráficos en el Financial Times. FT.COM
Artículo largo, largo de Stephen Wolfram, que terminaré de leer un día. ¿Puede la IA ayudarnos a resolver todos los problemas científicos que nos quedan? LINK