Retos en la generación de agentes de AI

Antes, adquirir tecnología muchas veces significaba aprender a usar herramientas complejas para cumplir una función específica. Hoy, gracias a la inteligencia artificial, basta con preguntarle a un agente qué puede hacer y pedirle que ejecute la tarea. La rapidez y facilidad para obtener resultados es, sin duda, lo más revolucionario de la inteligencia artificial actual.

Los agentes han evolucionado enormemente: pueden realizar desde funciones simples—como proporcionar información o enviar correos—hasta tareas complejas, como resolver ecuaciones, desarrollar sistemas o incluso hacer compras del súper. Lo impresionante es que la curva de aprendizaje se ha reducido casi a cero: ya no necesitas memorizar pantallas y procesos; basta con escribir o enviar un audio, y el agente se encarga de todo. Esta simplicidad abre un mundo de posibilidades creativas, permitiendo que empresas y usuarios se enfoquen en lo que realmente importa.

Sin embargo, a pesar de lo maravillosos que pueden ser los agentes, aún enfrentamos grandes retos tecnológicos para alcanzar su máximo potencial y lograr que sean verdaderamente útiles y confiables en el día a día. A continuación, detallo los desafíos más relevantes con los que nos hemos topado en Wallavi.

Principales desafíos tecnológicos en la generación de agentes

Aunque los agentes de inteligencia artificial captan la atención, en la práctica aún se quedan cortos para ofrecer soluciones completamente útiles a los usuarios finales. Tanto en México como a nivel global, no se han lanzado agentes que cumplan todas las expectativas, debido a desafíos tecnológicos complejos. A continuación, detallo algunos de estos retos.

Reto: Agentes confiables

Para que un agente sea verdaderamente útil, es crucial integrar capas multi-modelo que unifiquen funciones esenciales, como el function calling (una de las funcionalidades más revelantes, aunque no la única). Los distintos modelos de lenguaje presentan variaciones en su desempeño y características; por ejemplo, no todos soportan el function calling de manera nativa, lo que puede generar inestabilidades al alternar entre ellos. Incluso soluciones como Bedrock de AWS carecen de una integración unificada de estas funciones críticas, lo que puede provocar interrupciones en el servicio.

En 2024 viví de primera mano lo desastroso que puede ser presentar una demo a un prospecto y ver cómo falla la solución, o peor aún, que el agente se caiga frente a los clientes. Esa experiencia subrayó la necesidad de contar con agentes robustos y consistentes. Con Wallavi, hemos logrado unificar estas funciones integrando modelos de Bedrock, Open AI, DeepSeek, xAI y otros, ofreciendo una solución coherente que mantiene la continuidad operativa y la capacidad de respuesta, protegiendo así la confianza de los usuarios.

Estado de DeepSeek en los últimos 90 días.

Estado de DeepSeek en los últimos 90 días.

Estado de OpenAI en los últimos 90 días.

Estado de OpenAI en los últimos 90 días.

Reto: Orquestación dinámica en tiempo real

Uno de los mayores desafíos es lograr la correcta orquestación de tareas en tiempo real. Un usuario puede enviar una solicitud que involucre múltiples acciones, y el agente debe determinar el flujo de ejecución óptimo. Por ejemplo, si se pide:

”¿Puedes generar un resumen de las ventas de hoy de la sucursal Tepic y enviarlo por correo a [email protected]?”

El agente debe ejecutar las tareas en el orden correcto: primero extraer la información, luego generar el resumen y, finalmente, enviar el correo. Algunas acciones pueden ejecutarse de forma concurrente, mientras que otras requieren un proceso secuencial. El verdadero reto es que el agente interprete la solicitud en tiempo real y determine la forma óptima de ejecución, optimizando el rendimiento, preservando la coherencia y permitiendo la realización de consultas cada vez más complejas.

A continuación, se presentan ejemplos de algunas de las diferentes formas en las que los agentes pueden ejecutar tareas.

Wallavi (5).png

Flujo simple con una sola extensión

La solicitud se atiende mediante una única función, resolviendo todo en un solo paso.

Wallavi (7).png

Flujo híbrido: ejecución concurrente y luego secuencial

Algunas extensiones operan en paralelo al inicio y, al finalizar, se activa otra de manera ordenada.

Wallavi (6).png

Flujo completamente secuencial

Cada extensión depende de la anterior, ejecutándose paso a paso hasta completar la solicitud.

Reto: Veracidad en RAG con datos tabulares a gran escala