Comprar con un agente IA: la revolución que no será inmediata.
El lanzamiento de Atlas y las alianzas con Walmart y Etsy anticipan una aceleración del denominado "comercio conversacional". Pero los agentes con autonomía real pueden estar lejos aún.
Las últimas semanas se han llenado de titulares sobre el “comercio conversacional” o cómo los LLMs (grandes modelos de lenguaje) y los agentes IA van a navegar, investigar y comprar por nosotros. OpenAI acaba de lanzar un navegador web llamado Atlas y las redes se han llenado estos días de vídeos mostrando cómo ChatGPT “compra solo” en tiendas online.
La semana pasada Walmart se sumaba a Etsy y anunciaba su integración con ChatGPT mediante MCP, el nuevo protocolo que permitirá ejecutar compras directamente desde la interfaz de ChatGPT. Las demos son interesantes y el relato es irresistible. Llevamos 2 años por aquí anticipando que los agentes IA que compran por nosotros terminarán llegando. Y en ese contexto, dónde queda el branding o el diseño de interfaz para humanos. Con estas novedades es evidente que todo parece acelerarse e incluso podría parecer que los agentes ya están aquí y que estamos asistiendo al final del eCommerce tal y como lo conocemos. Pero…, la realidad suele ser más tozuda y puede que no sea momento de comprar el “hype” a ciegas aún.
La infraestructura invisible: MCP y ACP.
Para entender lo que está ocurriendo conviene mirar bajo el capó. El Model Context Protocol (MCP), impulsado por Anthropic, y el Agentic Commerce Protocol (ACP), desarrollado por OpenAI junto a Stripe, son los ladrillos técnicos que permiten conectar modelos de lenguaje con sistemas externos. Actúan como un traductor universal entre el agente y las APIs de los comercios: catálogos, pasarelas de pago, gestión de pedidos.
Si la web visual se construyó sobre HTML, la web agéntica se está levantando sobre estos protocolos. MCP habilita el acceso seguro a la información (“pensar”), mientras ACP permite ejecutar acciones (“hacer”). En teoría, esto debería democratizar la integración y reducir los costes para los comercios. En la práctica, seguimos en fase de ensayo: un terreno más de laboratorio que de adopción masiva.
Etsy y Walmart: dos visiones complementarias.
Etsy fue el primer gran marketplace en probar el “Instant Checkout” dentro de ChatGPT. Su apuesta es emocional: utilizar el lenguaje natural para encontrar productos artesanales o personalizados. “Quiero un regalo para un amigo al que le gusta la astronomía y la estética vintage.” ChatGPT traduce esa intención a una búsqueda estructurada y devuelve opciones relevantes.
Walmart, en cambio, se orienta a la eficiencia. Su alianza con OpenAI busca facilitar compras recurrentes, reabastecimientos y listas de compra automáticas. Más conveniencia que descubrimiento. Con 240 millones de clientes semanales en EE. UU., será el primer test serio de transacciones desde LLMs.
Pero ambos experimentos comparten una incógnita: ¿cuánto tiempo falta para que esto funcione fuera de un entorno controlado? Perplexity fue el primer jugador en ofrecer Buy with Pro, en noviembre de 2024, solo para usuarios premium en EEUU. La novedad era pago en un clic y envío gratuito para productos seleccionados, además de Snap to Shop (búsqueda visual) y descripciones de producto no patrocinadas y objetivas. Aun no existen datos de que este experimento haya avanzado de manera notable.
La promesa frente a las capacidades agénticas reales de la IA actual.
Las limitaciones actuales de los agentes son profundas. Andrej Karpathy, miembro fundador de OpenAI, exdirector de IA de Tesla y una de las voces más escuchadas del sector, sitúa la llegada de una AGI funcional “a diez años o más”. Sin esa autonomía, los agentes siguen siendo macros sofisticadas: ejecutan tareas dentro de un entorno muy definido, pero carecen de comprensión persistente del contexto o de capacidad de razonamiento general.
La realidad es que, como sugiere Andre Infante, miramos el techo de rendimiento de los LLMs, pero no nos fijamos suficiente en el suelo. Los modelos no han dejado de mejorar (en capacidades reales de solución de problemas matemáticos, menores alucinaciones) pero no son fiables estructuralmente aún. Mirando al índice METR, Infante sugiere que nos falten aún de dos a cinco años para llegar a conseguir que los errores y el coste de supervisión humana se reduzcan hasta el punto de compensar la automatización absoluta de algunos procesos. Delegar una transacción requiere un nivel de precisión y trazabilidad que los sistemas actuales no ofrecen. Y sin fiabilidad cercana al 100%, es complejo automatizar la transacción.
Y los problemas muy reales de seguridad y privacidad.
Los avances técnicos chocan con una realidad poco glamurosa: la seguridad. Los ataques de inyección de prompts ya han demostrado cómo un texto o enlace malicioso puede inducir a un agente a ejecutar acciones no deseadas: compartir datos personales, alterar pedidos o favorecer a un proveedor concreto. Incluso OpenAI, en su lanzamiento de Atlas, reconoce la necesidad de reforzar los controles antes de abrir las capacidades de acción a gran escala.
El comercio agéntico necesitará su propio sistema inmunitario: protocolos de autenticación, trazabilidad y validación de fuentes. Igual que en su día el eCommerce no despegó hasta que llegaron los certificados SSL y las pasarelas seguras, los agentes no lo harán hasta que los protocolos de confianza se hayan resuelto.
El consumidor: entre la inspiración, la delegación y el control.
La pregunta de fondo es si queremos realmente ceder el acto de compra a una máquina. Según YouGov, el 58 % de los consumidores estadounidenses duda de que usaría un agente IA para realizar compras, y el 81 % no permitiría que gastara más de 100 dólares sin revisión humana. La principal medida de seguridad que reclaman es precisamente la supervisión humana, lo que contradice la promesa de automatización total.
El idioma inglés distingue entre shopping y buying: ir de compras y comprar. Tal vez ahí esté la frontera. La compra por agentes será útil en el buying —reposición de detergente, comida para el perro, pilas—, donde la decisión es rutinaria. Pero el shopping —el vestido de boda, el portátil, la bici eléctrica— seguirá siendo visual, comparativo y emocional. La exploración, la serendipia o la validación social no pueden estar cubiertas al 100% con un LLM (todavía). En ese contexto, hoy las marcas deben seguir explorando el GEO.
La resistencia de las plataformas. ¿Y de las marcas?
Hemos dejado un gran obstáculo para el despliegue del comercio conversacional para el final. No todas las plataformas estarán dispuestas a abrir sus datos o sus sistemas a los modelos de terceros. Brian Chesky, CEO de Airbnb, lo dejó claro esta semana: las herramientas de OpenAI “aún no están listas” para integrarse en plataformas a gran escala.
En el fondo, lo que está en juego no es la madurez técnica, sino el control del acceso al cliente. Amazon, por ejemplo, mantiene su estrategia de “muro propio” y no tiene previsto integrarse con ChatGPT, apostando en su lugar por su asistente Rufus. Ninguna gran plataforma quiere convertirse en proveedor de inventario para un agente que intermedie la relación con el usuario. Si la IA va a comprar en nuestro nombre, la batalla real será decidir en qué tienda puede hacerlo. Y podría ocurrir que las marcas se pongan del lado de las plataformas o de los retailers en esta batalla. Ceder el control del proceso de descubrimiento y de la experiencia de compra a un agente a cambio de incrementar la distribución es un trade off inquietante.
En definitiva, el comercio conversacional avanza rápido, pero está lejos de sustituir la experiencia web o móvil por ahora. Las demos muestran lo que podría ser, no lo que ya es. Los protocolos emergen, los acuerdos también, pero la autonomía técnica, la fiabilidad y la confianza del usuario siguen en obras.
Comprar a través de un agente no será una revolución instantánea, sino un proceso que llevará tiempo (como ha ocurrido y aún ocurre con el eCommerce frente al retail físico). El futuro del eCommerce no se medirá por la velocidad de los agentes, sino por nuestra disposición a confiar en ellos. Y la confianza, como en todo intercambio comercial, no se programa: se gana.
El próximo domingo, volvemos a tu buzón.
Fernando y Carlos.
El AI BUSINESS FORUM 2025, es un evento organizado por ESIC Business & Marketing School y Foro IA, para entender qué cambiar en tu empresa, cómo hacerlo y a qué velocidad:
Un marco claro para priorizar oportunidades reales (nuevos productos, servicios y líneas de negocio).
Conocer cómo la IA transformará la experiencia de cliente.
Descubrir los cambios organizativos y culturales que separan a los que avanzan… de los que desaparecen.
El 4 de noviembre a las 9.30 am. Puedes regístrarte aquí.
Actualidad.
Hace unas semanas hablábamos de la batalla de los navegadores IA. Como hemos comentado arriba, Open AI entra de lleno en el juego con Atlas, un navegador con ChatGPT integrado que aspira a replantear por completo la forma en que navegamos. Entre las novedades, Atlas incorpora un modo agente, entiende el contexto de las páginas, responde a instrucciones en lenguaje natural y recuerda interacciones pasadas. Simon Wilson opina que aún le queda para ser un producto y no un prototipo. LINK, WILSON
Open AI, por cierto, tomará medidas para atenuar los deepfakes creados con Sora 2 tras las protestas de los actores (como si no lo hubieran visto venir...). Mientras, YouTube pone a disposición de creadores una herramienta para identificar si alguien está subiendo contenido a la plataforma con su imagen o voz. CNBC, TECH CRUNCH
El tráfico directo a Wikipedia ha descendido un 8% en el último año, debido a los chatbots y los resúmenes que genera la IA. A pesar de esa caída, la Fundación Wikimedia destaca que su contenido sigue siendo el conjunto de datos más valioso para entrenar modelos de IA, y advierte del riesgo que supone el círculo vicioso menos visitas > menos editores voluntarios > menos financiación > menos contenidos fiables. WIKIMEDIA
OpenEvidence ha conseguido una inversión de $200 millones, elevando su valoración a casi $6.000 millones. OpenEvidence a modo de ChatGPT médico especializado, actúa como soporte para toma de decisiones médicas, accediendo rápidamente a bases de conocimiento recientes y fiables. Ya facilita unos 15 millones de consultas al mes, y es gratuita (financiada con publicidad) para personal médico verificado. TECH CRUNCH
Google ha presentado Willow, su nuevo procesador cuántico, con el que afirma haber alcanzado una ventaja cuántica verificable, es decir, realizar cálculos imposibles para cualquier superordenador clásico conocido. Más allá del hito científico, el avance apunta a un futuro donde la computación cuántica podría acelerar el entrenamiento de modelos de IA, optimizar redes neuronales o resolver problemas de simulación que hoy limitan el progreso de la inteligencia artificial. GOOGLE
Netflix se mete a usar la IA generativa a saco en sus producciones mientras el resto de la industria parece dudar. TECH CRUNCH
Reflexiones.
Lo hemos mencionado arriba, pero repetimos aquí, porque el artículo de André Infante nos ha parecido de las más reveladoras de las últimas semanas. El impacto de la IA en la economía real está siendo muy poco visible. Los modelos actuales no están a la altura para automatizar muchas tareas a día de hoy, porque los errores más “básicos” (el “rendimiento suelo” de los LLMs) introducen costes de supervisión que impiden una automatización desde una perspectiva económica. Es una simplificación y como él dice, parece un razonamiento obvio, pero a nosotros nos ha aclarado las ideas. Ahora sí, él termina pronosticando una revolución similar a la industrial en un período mucho más corto de tiempo (15 años, que pueden ser 10 ó 30).
Por otro lado, Michael Spencer analiza el cambio inminente en la fuerza laboral de EEUU causado por la robótica y la automatización industrial, mucho más relevante que el que puede traer la IA generativa. El impulsor principal de este cambio es Amazon, el segundo mayor empleador de EEUU (1,2 millones de trabajadores), con planes para automatizar el 75% de sus operaciones, y ahorrar así 12.600 millones $, sustituyendo a 600.000 empleados de aquí a 2033. Walmart es el primer empleador, y puede seguir un camino similar. AI SUPREMACY
Jack Clark, cofundador de Anthropic, dice en el ensayo Technological Optimism and Appropriate Fear que la IA no es solo una herramienta predecible, sino una entidad misteriosa que exhibe una inesperada autoconciencia. Aunque se define como tecnooptimista, Clark se muestra preocupado por el futuro, especialmente ante los modelos de IA que diseñan a sus propios sucesores, y cree que los desarrolladores de IA deberían prestar más atención a las preocupaciones del público y ampliar el debate más allá de las élites tecnológicas.
¿Deberíamos preocuparnos por las inversiones circulares entre desarrolladores IA, fabricantes de chips y proveedores de servicios cloud? ¿Es todo una burbuja que se autoalimenta? Noah Smith cree que es cierto que hay un riesgo sistémico (si la IA explota, todas las empresas caen), pero al invertir en múltiples empresas de IA y proveedores, Nvidia, el epicentro de todo este entramado, está diversificando su dependencia. NOAHPINION
Research.
CX 2028 describe una cronología de la transformación de la experiencia del cliente impulsada por la IA: desde la deflexión iniciada en 2024 (copiloto para agentes, e interacción con usuarios para casos repetitivos) hasta una predicción para 2028 donde los agentes de IA actúan como beta testers y clientes de la propia empresa (dogfooding), proporcionando información para mejorar el producto, y el soporte alcanza escala infinita.
MCX.
Unilever saca pecho de las muchas maneras en que la IA generativa les está ayudando a conseguir “Desire at scale”… Un poco de autobombo, pero también un buen muestrario de ejemplos y casos de usos concretos. Aseguran que no sólo ganan velocidad en el desarrollo de activos publicitarios sino que también son capaces de mantener coherencia de marca con herramientas y metodologías propias como Brand DNAi, que garantiza que los modelos de IA obtengan información únicamente de un conjunto de datos, valores, estrategias e identidades visuales aprobadas por la marca. UNILEVER
Datos de Semrush y Similarweb que muestran cómo las búsquedas con IA generativa están transformando la visibilidad de los editores. Grandes medios como Fox o CNN han duplicado el tráfico que viene de la IA, aunque sigue siendo menos del 1% del total. Sin embargo, las búsquedas con IA son principalmente un canal de investigación, con apenas conversiones directas (compras o suscripciones). DIGIDAY
Aunque Sam Altman predijo en su día que la IA haría el 95% del trabajo de las agencias, es llamativo y paradójico que Open AI contratara a una agencia “humana” (Isle of Any) para su primera campaña global, con spots rodados en 35mm, un guiño a lo táctil y tradicional. Un ejemplo de cómo la industria publicitaria se dirige hacia la colaboración multidisciplinar y las agencias evolucionan a “consultoras impulsadas por ideas”, que mezclan creatividad humana con tecnología. BUSINESS INSIDER
Yelp rediseña por completo la plataforma. Ha lanzado un agente recepcionista capaz de gestionar llamadas de clientes, modificar o cancelar reservas, proporcionar tiempos de espera e incluso atender solicitudes especiales. La verdad es que todo el rediseño es un ejemplo de cómo repensar por completo un producto poniendo la IA de fondo para mejorar la experiencia de usuario. THE VERGE, YELP
Off Tópicos.
Los humanos ya no somos necesarios. Replacement AI promete hacer lo mismo que nosotros, pero más rápido y más barato. La empresa da las gracias a todos los creadores a los que han robado su trabajo para conseguir una valoración millonaria. Citan a Sam Altman: “La IA probablemente conducirá al fin del mundo; pero mientras tanto, habrá grandes empresas”. Por suerte, todo es una parodia, de autores desconocidos, pero con el objetivo de denunciar los peligros de un crecimiento sin control de la industria IA. LINK











