Agentes IA

Publicado por Andrés López

AI Agents

Este es mi primer post acerca de IA, probablemente este muy atrasado respecto a la información que ya existe en internet, pero estoy utilizando estos posts como apuntes para mi mismo, si así como yo apenas te vas introduciendo a profundidad en IA, quizá te sirva.

Primero algunos conceptos básicos muy resumidos:

Large Language Models (LLMs)

Aplicaciones como

Fueron construidas a partir de Large Language Models (modelos largos de lenguaje quizá haya una traducción más adecuada).

Son geniales para generar y editar textos, básicamente:

Das una entrada de texto -> el LLM lo procesa -> genera una respuesta

Gif de como se ve el chat de un LLM

Sin embargo estos LLMs no pueden acceder a cierta información: ¿Qué pasa si le escribo a chatGPT...

¿Cuando es mi siguiente cita con el dentista?

¿Puedes corregir el archivo HelloWorld.php?

Probablemente nos topemos con alguna respuesta como:

Imagen de respuesta generica de no Agent

Y esto es porque no tiene un contexto, una manera de acceder a tu calendario o a tu código, más alla de copiar y pegar la información.

Y también hay un punto importante, los LLMs son pasivos, es decir esperan un prompt para comenzar a responder.

Flujos de trabajo de IA

Ya vimos un poco acerca de los flujos previamente:

Das una entrada de texto -> el LLM lo procesa -> genera una respuesta

Que tal si ahora añadimos alguna integración, por ejemplo con el calendario

Imagen de integracion LLM con calendario

De esta manera el LLM tiene un mejor contexto y es capaz ahora de dar una respuesta adecuada a nuestras preguntas acerca de mis siguientes citas dentales.

Pero ahora que pasa si preguntamos por ejemplo el clima en Zapopan, México, el LLM preguntará al calendario y bueno... no será capaz de responder pues el calendario no tiene ninguna información acerca de.

Estos son los flujos de trabajo, definidos por el usuario y seguidos a rajatabla por la IA. Mientras más integraciones añadamos, más capaz será la IA de entender nuestro contexto, nuestras necesidades.

RAG

Retrieval Augmented Generation: Basicamente un término fancy para decirle a la IA que cheque primero las integraciones (calendario, editor de código, el servicio de clima) y posterior con esa información genere una respuesta adecuada.

Agentes IA

Y para finalizar, los agentes IA, básicamente todo lo anterior, pero remplazando un factor importantisimo:

El ser humano, el usuario.

Es decir que el LLM sea capaz de razonar con los medios y recursos dados, que sea capaz de cuestionarse procesos e ideas y las implemente por si misma:

¿debería acceder al calendario para ver las citas? ¿debería modificar esta línea de código que esta ocasionando errores?

ReAct Framework

Razonamiento -> Actuación

Una parte importante de los agentes IA es la iteración del pogreso, repetir procedimientos y mejorarlos a partir de sus propias pruebas.

Y listo, basicamente es lo que se requiere saber (básico) de AI Agents :).

References

Andrés López

Gran fan de Laravel, entusiasta de Vue y escritor de cualquier cosa que suene interesante

Volver al listado...