El papel de los LLMs en la investigación de mercado.
La IA generativa se consolida como una asequible solución alternativa a la investigación con consumidores de carne y hueso. Complementaria, no sustitutiva.
Los métodos cualitativos utilizados tradicionalmente para sondear las opiniones de los consumidores (encuestas, focus groups, entrevistas personales, dinámicas de grupo, etc) son técnicas complejas y a menudo costosas, que requieren de planificación cuidadosa y abundantes recursos. Desde hace unos meses, la IA generativa se está consolidando como una solución complementaria y asequible a la investigación con consumidores reales.
Un usuario sintético (a veces denominados gemelos digitales, o synths) es un perfil generado con IA con el objetivo de replicar el comportamiento o las respuestas que nos daría ante diferentes propuestas una persona real, que responde a unas determinadas características. Y se emplean en una gran variedad de industrias, desde la moda —¿cómo acogería un determinado perfil de consumidor una nueva línea de ropa?— hasta la medicina — ensayos clínicos con pacientes ficticios para tratamientos experimentales—. En este paper se explica en detalle el proceso de creación de estos usuarios sintéticos con un modelo fundacional de lenguaje (LLM).
La IA nos permite configurar a nuestro gusto el tipo de usuario al que nos queremos dirigir, jugando con un amplio rango de parámetros: la edad, el género, estudios, hábitos de compra, estilo de vida, intereses y preocupaciones, etc. En este sentido, los usuarios sintéticos no son muy diferentes de las buyer personas que se utilizan en marketing para representar arquetipos de consumidores. La diferencia es que la IA nos permite establecer una relación interactiva con ellos: entablando una conversación y valorando la reacción del consumidor (virtual) a nuestra propuesta comercial.
Creando usuarios sintéticos: ¿DIY o empresas especializadas?
Si optamos por fabricar synths con nuestras propias manos, usaremos un LLM como ChatGPT o Claude y una herramienta como AutoGen para crear e interactuar con nuestros usuarios / agentes virtuales. En el LLM definimos las características de los perfiles que buscamos construir: el modelo procesa esa información y genera una narrativa que responde a un perfil cohesionado y realista de consumidor. En AutoGen creamos un entorno donde los diferentes perfiles que hayamos creado interactúen entre sí, bajo la conducción de un moderador o un investigador. Podemos simular dinámicas de grupo, entrevistas, pruebas de concepto o tests de usabilidad. Después, el LLM analiza las conversaciones y las resume en informes estructurados, en los que se detallen las necesidades, preferencias y pain points de los usuarios simulados. Aquí hay un tutorial para guiarnos en todo este proceso.
Pero también se puede acudir a plataformas donde configurar usuarios a medida, o bien la opción de escoger perfiles ya definidos, basados en amplios conjuntos de datos. Dos empresas destacan en este ámbito.
Fundada en 2013, en 2019 Synthetic Users comenzó a experimentar con LLMs. La plataforma permite especificar un grupo de usuarios, el objetivo del estudio y el tipo de entrevista. Los clientes registran las interacciones de los consumidores virtuales con sus productos y servicios, para identificar errores e ineficiencias, o bien optimizar la UX. Con estos datos en la mano, quizá no se tomarán decisiones para presupuestos millonarios, pero pueden servir para tomar decisiones ágiles cuando algo de investigación es mejor que nada de investigación, que es el caso de miles de decisiones cada segundo en el ámbito MCX (marketing, comunicación y experiencia de cliente).
El otro gran protagonista del sector es Brox.ai, creado en Los Angeles en 2023. Brox realiza de manera continua encuestas en video a consumidores reales, capturando reacciones y emociones auténticas de los participantes para ofrecer una comprensión profunda de sus percepciones. Las respuestas se transcriben y se analizan con IA, lo que permite identificar patrones y tendencias clave en métricas de marca y otros insights. Con herramientas como la "Quick Query Bar" y dashboards personalizados, los usuarios pueden consultar datos específicos sobre su marca, sector o competidores en tiempo real.
Además, Brox.AI ofrece un "Shadow Panel", un panel de casi 30.000 gemelos digitales, réplicas de consumidores reales. Los clientes de Brox pueden lanzar preguntas relacionadas con propuestas comerciales o nuevos servicios entre segmentos escogidos de este público simulado: ¿por qué los usuarios latinos de 20 a 30 años no compran mis pizzas? ¿Pagaría un hombre de 60 años un 40% más por un paquete premium?
Un caso de estudio real: Netflix utilizó los servicios de Brox para identificar y retener a los clientes que estaban a punto de cancelar su suscripción. El proceso consistió en analizar más de 10.000 respuestas de clientes a preguntas abiertas sobre el streaming. Se identificaron las principales motivaciones tras las cancelaciones, destacando la relación calidad-precio (los clientes a menudo sienten que no están recibiendo suficiente valor a cambio de lo que pagan) y la falta de adecuación de los contenidos (menos violencia, más documentales y contenidos familiares).
Pero, ¿es fiable? Ventajas y sesgos.
Las ventajas son evidentes: ahorro de costes, velocidad y eficiencia. La capacidad de crear audiencias “nicho” que nos permiten además, refinar y ajustar las preguntas que luego puede ser formuladas a usuarios reales. O identificar los temas más destacados. Integrando datos datos propios, combinando datos sintéticos y reales, generando hipótesis resultado de la síntesis de gran cantidad de información, podemos terminar recabando un conocimiento útil para la toma de decisión.
Pero también existen riesgos en el uso de estas metodologías. Los synths “cuelgan” de un LLM, y por tanto pueden reproducir todos los sesgos y riesgos inherentes a aquellos, o mejor dicho, a los datos con que fueron entrenados: falta de diversidad, prejuicios perpetuados, alucinaciones, etc. En un estudio comparativo que realizó Kantar, demostraban que las mismas respuestas a un panel sintético y a otro real ofrecían sesgos positivos:
Y más riesgos que seguramente puedan ser modulados con un trabajo de preparación de los paneles sintéticos exhaustivo:
Visión corta: tal vez estemos usando datos que no están al día o que no recogen tendencias recientes.
Superficialidad: los synths no pueden integrar estímulos sensoriales, matizar y detallar respuestas ni relatar experiencias reales. También es posible que no entiendan las prioridades de un consumidor real, y concedan igual importancia a todas las necesidades o demandas.
Privacidad de datos: existe el habitual riesgo de incluir información sensible o confidencial entre los datos utilizados para entrenar a los encuestados sintéticos.
No son pocas las trabas que dificultan replicar con total precisión el comportamiento humano. Por eso es recomendable combinar los métodos de investigación, y utilizar los usuarios sintéticos como un complemento de la investigación tradicional.
Los usuarios sintéticos nos pueden dar pistas e información provechosa. Pueden ser muy útiles en las fases iniciales de una investigación, para generar o testar hipótesis que luego se testean con consumidores reales. Sin duda son un recurso valioso, pero es necesario prestar atención a la solidez de las fuentes de datos, y no olvidar que son creaciones con limitaciones. Tomar decisiones que conlleven asignaciones presupuestarias o lanzamientos de productos en base a la opinión de un usuario sintético es una apuesta no exenta de riesgos.
El próximo domingo, volvemos a tu buzón,
Fernando y Carlos.
Actualidad.
La semana acaba con el botón de “búsqueda en la web” de ChatGPT. Por ahora disponible sólo para usuarios Plus y Team. Lo he probado en estos días y sorprende. “Estoy con amigos a los que no les gusta la música este finde en Madrid, ¿qué me recomiendas?” O "Resúmeme como funciona este servicio de IA extrayendo la información de su web”. Muy rápido y preciso, aunque las fuentes informativas sólo son internacionales, por ahora. Y parece quedarse corto en alguna búsqueda más compleja. En paralelo, Google se defiende todo lo rápido que puede expandiendo AI Overview a 100 países (pero todavía no a Europa). Sabiendo que le tiemblan los cimientos de sus ingresos publicitarios bajo los pies. Me huele a que recordaremos el día en que OpenAI introdujo la búsqueda en ChatGPT. La buena acogida de Perplexity apunta a que la “búsqueda generativa” es imparable porque el usuario lo demanda, y que toca reformular muchas estrategias empresariales. Muchas. [En Good Rebels tenemos un estudio reciente sobre Google AI Overview y el futuro de las búsquedas.] OPENAI
Después de que Anthropic presentara la semana pasada el modo Computer Use para Claude, ahora es Google quien prepara Jarvis, un agente inteligente que toma el control de Chrome para completar tareas como investigación de productos, rellenar formularios o comprar. Se apunta a que podría presentarse en diciembre, junto con Gemini 2.0. LINK
Decart es una startup israelí de generación de vídeo por IA, que está apareciendo en las noticias después de la ronda de financiación desde Sequoia. Dicen que su modelo es 10 veces más eficiente que el de Sora. Su apuesta es optimizar la computación en GPUs, lo cual tiene implicaciones muy importantes. No sólo se abarata (y se hace eficiente, energéticamente hablando), si no que podría llegar a construir vídeo en tiempo real (algo que ahora están demostrando con Minecraft). Tela. THE INFORMATION (paywall)
Reflexiones.
Meta lleva un año y pico (no debe ser casualidad que el valor esté disparado en bolsa) recogiendo alabanzas de todos los analistas y guruses y se configura como un ganador a futuro de la carrera IA. Sorprende lo acertadas que fueron las decisiones de Meta de invertir en GPUs y en un sólido equipo de IA, porque hace diez años, no estaba claro para qué necesitaba “una red social” ninguna de las dos cosas. En el corto plazo, mientras otros no saben cómo hacer rentable la ingente cantidad de dinero de capital riesgo, ellos generan retorno a través de su plataforma publicitaria donde la IA ayuda a optimizar la inversión del anunciante. En el medio plazo, Meta puede utilizar la IA para generar contenidos perfectamente personalizados para los feeds de los usuarios, y transformar cada pieza de contenido en un potencial inventario publicitario, reconociendo los objetos y los enlaces. Y en el largo, tecnologías como las gafas de realidad aumentada (que han llamado Orion), les podrá proporcionar el control de un nuevo espacio publicitario. El análisis completo de Ben Thompson en STRATCHERY
Sólo el 5% de los usuarios de ChatGPT son de pago, la mayoría lo utiliza para tareas básicas, como resumir textos. Pero, ¿por qué los LLMs no se utilizan más a menudo para reflexiones profundas y estratégicas? La paradoja que expone este artículo es la siguiente: estamos tan agobiados por los deadlines de nuestro día a día que no podemos dedicar tiempo a pensar cómo, con la IA, podríamos ahorrar tiempo. ¿Cómo salir de esta trampa? Implementando cambios fundamentales desde el liderazgo, que permitan crear espacios para la exploración. El verdadero reto no es dar herramientas IA a los empleados, sino proporcionarles el tiempo y la libertad para reinventar sus modos de trabajo. LINK
Meredith Ringel, Directora de Investigación Humanos - IA en Google Deepmind, explica en este artículo por qué considera que el prompting es una manera confusa y limitada de relacionarse con la IA generativa. Confía en que en unos años miraremos atrás y veremos el prompt como una forma antinatural y contraintuitiva de relacionarnos con la IA. LINK
Muchas empresas no saben qué recursos necesitan (humanos, presupuestarios) para implementar soluciones IA. Pero al reducir la dependencia de los científicos de datos y adoptar soluciones no-code, las empresas pueden acceder a la IA de manera asequible y eficiente. Este cambio democratiza el acceso a la IA, lo que allana el camino para una adopción más amplia en diversas industrias. LINK
Bill Gates, entrevistado por Reid Hoffman, para hablar de sus principales áreas de interés: cambio climático, energía, salud mundial y educación, y de cómo la IA ayudará a transformar cada una de ellas. YOUTUBE
MCX
A principios de este año, los ejecutivos de la startup de software financiero Runway utilizaron OpenAI y otras herramientas para escanear una lista de posibles clientes corporativos y redactar correos electrónicos personalizados basados en la información de los sitios web de cada uno de ellos. Para que los mensajes parecieran más realistas y humanos, se introducía alguna errata. El software, que tardó un fin de semana en construirse, ahorra ahora decenas de horas a la semana al personal de ventas, formado por 12 personas, que pueden dedicar su tiempo a atender a los clientes que muestran interés en responder a los mensajes redactados por la IA.
La IA está transformando las áreas comerciales, pero surgen preguntas sobre el equilibrio entre eficiencia y el toque humano en las relaciones comerciales THE INFORMATION (paywall).Growin Up: Navigating Gen AI's Early Years es un estudio de Wharton entre 800 altos directivos sobre la adopción de la IA generativa. Si bien el uso general de la IA ha aumentando notablemente (del 37% en 2023 al 73% en 2024), su aplicación está siendo estratégica, muy pendiente del ROI y centrándose en tareas específicas como el análisis de datos, la generación de ideas y la redacción de contratos. También destaca el crecimiento en las áreas de Marketing y Ventas y RRHH. WHARTON
¿A quién pertenecen los derechos de los materiales de marketing generados con IA? ¿Pueden otros reproducirlos sin pedir permiso? Bajo las leyes de EEUU, los materiales creados con modelos generativos no puden protegerse con derechos de autor, porque la US Copyright Office solo reconoce la autoría humana. ¿Quién tiene entonces los derechos sobre la imagen? Bajo la legislación actual, nadie. ¿Se pueden emprender emprender acciones legales si alguien reproduce o distribuye como propio tu material generado con IA? Según la legislación vigente, no, porque no tienes los derechos de la obra. Al menos, nadie puede registrar los derechos de autor de esas imágenes. (¿Y en España / UE? ¿Algún jurista en la sala?) LINK
Un análisis de Wired estima que casi el 50% de las publicaciones en la plataforma Medium han sido generadas con IA. El CEO de Medium no le da demasiada importancia al asunto, porque el slop no afecta a la experiencia de los usuarios, ya que esos artículos ni se recomiendan ni se leen apenas (la mayoría tiene cero visitas). Medium tiene 9.000 editores que filtran el contenido, y a las piezas creadas con IA no se les da bola: no pueden ser artículos de pago, beneficiarse de programas de distribución ni promocionar enlaces de afiliados. WIRED
Time ha sacado su lista de los mejores 200 inventos del año, incluyendo una sección de IA donde aparecen AlphaFold 3 de DeepMind, Gen-3 Alpha de Runway, NotebookLM de Google o Typeface Arc (IA generativa para marketing), entre otros. TIME
Herramientas IA.
Rufus ya está disponible en la app de Amazon Shopping en España, Italia, Fracia y Alemania, aunque de momento en beta y para un número limitado de usuarios. Rufus es un asistente diseñado para mejorar la experiencia de compra: responde a preguntas sobre productos, hace recomendaciones, comparativas o nos descubre productos nuevos. AMAZON
LinkedIn ha presentado un asistente que se encarga de algunas de las tareas del proceso de contratación, desde descripciones de puestos, selección de candidatos y primer contacto con estos. TECH CRUNCH
ElevenLabs ha presentado Voice Design: con una única descripción, es suficiente para generar la voz de un personaje. X
Me ha sorprendido Ideogram 2.0. Generación de imágenes casi tan buena como MidJourney, con la capacidad para incluir textos en imágenes de manera sorprendente.
Off Tópicos.
“Arenas” es el épico nombre que McKinsey Global Institute ha elegido para denominar las industrias que está transformando el panorama empresarial. Y han elegido 18 “arenas” del futuro podrían remodelar la economía mundial y generar entre 29 y 48 billones (americanos) $ de ingresos en 2040. MGI
Muchas gracias por tanta y tan buena información. Me quedo sintético🤓 con los Synthetic Users que estarán por llegar y afinar
Genial los ejemplos, muchos no los conocía pero ya estoy trasteando con ello. Gracias por compartir.