LLMs, Agents, Multi-agents… y ahora, los «self-improving»

Parece como si hubiéramos parpadeado y, de repente, estuviéramos pasando de los modelos de lenguajes (LLM) de gran capacidad que utilizan diversas técnicas de incitación, como Chain Of Thoughts y otras herramientas, a la exploración de los ámbitos de los sistemas de agentes y multiagentes. Justo cuando empezamos a entender cómo aprovechar este inmenso potencial, se nos presentan tutoriales y demostraciones sobre agentes «self-improving», que amplían aún más los límites.

Tomemos, por ejemplo, innovaciones como CrewAI, AutoGen Studio v2, Devin de Cognition o los agentes de LangChain, por citar sólo algunas. Están reconfigurando nuestro enfoque del desarrollo de software. Profundicemos para entenderlo mejor.

Debate entre humanos y equipos multiagente

Devin

Cognition Labs presenta a Devin, una IA diseñada como el primer ingeniero de software totalmente autónomo. Devin presume de su capacidad para planificar y ejecutar complejas tareas de ingeniería, aprender de la experiencia y corregir errores. Viene equipado con herramientas estándar para desarrolladores dentro de un entorno aislado y puede colaborar en tiempo real, ajustándose a los comentarios y participando en las decisiones de diseño.

Las habilidades de Devin incluyen el uso de nuevas tecnologías, la creación y despliegue de aplicaciones, la depuración y la mejora de modelos de IA, entre otras. Demostró un rendimiento superior en la prueba SWE-bench, resolviendo un porcentaje significativo de los problemas reales de GitHub.

Devin, el primer ingeniero de software de IA (Cognition AI)

SWE-Agent de Princeton NLP

En este caso, SWE-agent es una herramienta que integra modelos de lenguaje (como GPT-4) en procesos de ingeniería de software para resolver problemas en repositorios reales de GitHub. He aquí un breve resumen de sus aplicaciones al desarrollo de software:

  • Interfaz agente-ordenador (ACI): SWE-agent utiliza ACI para simplificar las interacciones entre el modelo de lenguaje y el repositorio, lo que permite navegar, editar y ejecutar archivos de código de forma eficiente.
  • Resolución de problemas: En el conjunto de pruebas SWE-bench, el agente SWE resuelve con éxito el 12,29% de los problemas, lo que demuestra un rendimiento de vanguardia.
  • Impacto del diseño de la ACI: El diseño de la ACI influye significativamente en la eficacia del agente; una ACI bien ajustada da como resultado un mejor rendimiento en comparación con un agente de referencia sin ella.
  • Configuración y uso: La página proporciona instrucciones para configurar SWE-agent utilizando Docker y Miniconda, y detalles sobre cómo utilizarlo para generar pull requests que intenten solucionar problemas de GitHub.

Aquí está el repositorio de GitHub para empezar a probarlo.

CrewAI

Imagínese lo siguiente: reunir un equipo de ensueño de expertos en IA, cada uno de los cuales aporta un super poder único. Esa es la esencia de CrewAI. Es como tener a un grupo de personas brillantes, cada una experta en su campo, trabajando juntas a la perfección para agilizar el proceso de desarrollo de software.

CrewAI destaca por su innovador marco diseñado para coordinar agentes de IA autónomos cada uno en su rol. Al centrarse en la simplicidad y en un diseño modular, descompone el complejo mundo de la IA en componentes manejables como agentes, herramientas, tareas y procesos. Este enfoque no sólo desmitifica la IA, sino que también la hace atractiva y accesible.

Proporciona una plataforma robusta para ingenieros, ofreciendo un marco de trabajo, herramientas e interfaz de usuario fáciles de desarrollar para construir localmente automatizaciones multiagente. Tanto si utiliza modelos prediseñados como los de otros proveedores, CrewAI fomenta una comunidad en la que los desarrolladores pueden intercambiar recursos, modelos y asistencia.

La fuerza de CrewAI reside en su capacidad para facilitar la colaboración en equipo, organizando múltiples agentes inteligentes de una forma cohesionada. Este sistema destaca en tareas que requieren un esfuerzo de colaboración, mejorando la toma de decisiones, la creatividad y la resolución de problemas de una forma que las herramientas tradicionales no pueden igualar.

AutoGen Studio

AutoGen v2 está a la vanguardia de la IA, especialmente en el aprovechamiento de los LLM para flujos de trabajo complejos y automatizados. Esta plataforma facilita la orquestación y optimización de los flujos de trabajo de LLM, permitiendo la creación de aplicaciones innovadoras, eficientes y de gran impacto.

Con AutoGen v2, obtendrá agentes personalizables y conversables que se integran y comunican a la perfección, impulsados por LLM avanzados, conocimientos humanos o una mezcla de herramientas. Esta adaptabilidad abre un sinfín de aplicaciones, desde la resolución de tareas complejas hasta la facilitación de interacciones dinámicas basadas en la conversación.

AutoGen Studio introduce una interfaz fácil de usar para este potente marco, simplificando la creación rápida de prototipos y la gestión de sistemas multiagente. Tanto si se trata de configurar un proveedor LLM como de crear agentes y habilidades, AutoGen Studio agiliza el proceso y abre nuevas posibilidades en el desarrollo de IA.

Para los amantes de la innovación, AutoGen Studio v2 (GitHub) supone un avance significativo, ya que invita a la colaboración y al crecimiento continuo de las aplicaciones de IA.

LangChain’s Agents

LangChain revoluciona la integración de los LLM en las aplicaciones a través de «agentes». No se trata de meros guiones, sino de entidades inteligentes que deciden su próximo movimiento en función del contexto proporcionado. Este enfoque ofrece más flexibilidad e intuición en el desarrollo de aplicaciones complejas basadas en IA en comparación con los métodos tradicionales.

LangChain ofrece herramientas y marcos como LangGraph, que mejoran el control del bucle del agente, el seguimiento del estado y las respuestas humanas en el bucle. Esta flexibilidad permite a los desarrolladores crear agentes que pueden redactar contenidos de forma autónoma o requerir su aprobación, manteniéndolos al mando.

LangChain, que admite varios tipos de agentes y ofrece una completa biblioteca de herramientas, permite a los desarrolladores seleccionar la arquitectura cognitiva óptima para sus aplicaciones, garantizando resultados precisos.

Para los desarrolladores que deseen pasar rápidamente del prototipo a la producción con aplicaciones GenAI fiables, LangChain y sus herramientas, como LangSmith, proporcionan una base sólida, ofreciendo trazabilidad y explicabilidad a lo largo de todo el proceso de desarrollo.

La era de los agentes que se mejoran a sí mismos

Combinar las fuerzas de CrewAI, AutoGen Studio v2 y los agentes de LangChain no es sólo simplificar: es revolucionar el desarrollo de software. Esta sinergia promete una eficacia, creatividad y flexibilidad sin precedentes, ampliando los horizontes de la IA en la creación de software.

Y no hemos hecho más que empezar. La progresión hacia agentes que se mejoran a sí mismos, como se muestra en Autogen Studio, abre un abanico de nuevas posibilidades. Estos agentes aprenden sobre la marcha, comparten conocimientos y evolucionan, transformando tareas intimidantes en procesos realizables y más eficientes.

A diferencia de los agentes tradicionales, estas maravillas de la autosuperación aprenden y se adaptan dinámicamente sin necesidad de codificación humana directa, lo que aumenta su eficacia y escalabilidad.

La próxima generación de agentes fomenta el aprendizaje colaborativo, haciéndose eco de la dinámica de los equipos humanos y dando lugar a estrategias de resolución de problemas más inventivas.

Aquí tienes un adelanto de David Ondrej en su canal.

“Self-Improving Agents are the future, let’s build one”, de David Ondrej

Implicaciones éticas y sociales

Sin embargo, esta potente tecnología conlleva la necesidad de un uso responsable. A medida que estos agentes se integran en diversos sectores, las consideraciones éticas y los controles de eficacia son cruciales.

Con el avance de los agentes que se mejoran a sí mismos surge la necesidad de tener en cuenta consideraciones éticas y optimizar la eficiencia. Estos agentes tienen el potencial de superar a sus homólogos humanos en términos de velocidad de aprendizaje y desarrollo, lo que plantea interrogantes sobre el desplazamiento, la seguridad y el control del empleo. Además, su eficiencia en la realización de tareas y la resolución de problemas podría dar lugar a aumentos de productividad sin precedentes, pero también exigiría nuevos marcos de control de calidad y responsabilidad.

Unas palabras de Andrew Ng…

En este punto, merece la pena ver esta keynote de Andrew Ng (si no has visto sus cursos en deeplearning.ai tienes que hacerlo) para Sequoia Capital (echa un vistazo a su informe sobre IA Generativa) sobre «What’s next for agentic reasoning«. En resumen, la atención se centró en el potencial transformador de los flujos de trabajo basados en agentes dentro de la IA.

Estos innovadores flujos de trabajo suponen un cambio significativo con respecto a los planteamientos lineales tradicionales, ya que ofrecen un proceso más iterativo y dinámico que refleja las estrategias cognitivas humanas. Al adoptar este método, los modelos de IA son capaces de planificar, redactar, revisar y reflexivos, con lo que se consiguen resultados notablemente mejores.

Ng lo ilustró con ejemplos convincentes, incluido un estudio de caso que mostraba cómo la integración de flujos de trabajo agénticos con modelos de IA como GPT-3.5 puede superar el rendimiento de modelos más avanzados como GPT-4 en tareas específicas. Esta mejora iterativa, facilitada por la capacidad del agente para criticar y perfeccionar sus resultados, subraya el enorme potencial de los flujos de trabajo de los agentes para elevar la capacidad de resolución de problemas de la IA.

What’s next for agentic reasoning?, Andrew Ng y Sequoia Capital

Además, el discurso de Ng ahondó en la aparición de distintos patrones de diseño en los agentes de IA, que incluyen la reflexión, la planificación, la colaboración entre varios agentes y la utilización de herramientas externas. Estos patrones son cruciales para el desarrollo de sistemas de IA robustos, eficientes y versátiles, capaces de ejecutar tareas complejas con mayor autonomía.

Cabe destacar la importancia de la generación rápida de tokens en los flujos de trabajo agénticos, que, según Ng, podría revolucionar la creación de aplicaciones de IA al priorizar la velocidad sobre la precisión, lo que permitiría ciclos iterativos más rápidos. Esta perspectiva no sólo arroja luz sobre el estado actual y los avances de la IA, sino que también allana el camino para futuras innovaciones. Mientras nos encontramos al borde de estos saltos tecnológicos, las ideas de Ng ofrecen una visión convincente de la capacidad de la IA para ampliar sus horizontes, acercándonos a la realización de la inteligencia artificial general (AGI).

Implantación en la industria: Los Turing Bots (Forrester)

Lo que está claro es que la integración de agentes de IA en el ciclo de vida del desarrollo de software (SDLC) está revolucionando nuestra forma de abordar la gestión y ejecución de proyectos. Diego Lo Giudice de Forrester por ejemplo publicó hace algún tiempo una serie de artículos sobre sus Turing Bots que hace un uso intensivo de agentes en las diferentes fases del desarrollo ya sea generando código o cualquiera de las otras tareas como la captura de requisitos.

Empresas como G-Research están a la cabeza, mostrando notables aumentos de productividad al incorporar asistentes generativos de IA (o TuringBots) a sus procesos de desarrollo. Este enfoque innovador no sólo agiliza los flujos de trabajo, sino que también fomenta una cultura de mejora y aprendizaje continuos.

Para desmitificar el complejo funcionamiento de estos agentes de cara a un público más amplio, puede resultar muy eficaz incorporar demostraciones interactivas que muestren sus capacidades en tiempo real. Por ejemplo, una simulación visual de CrewAI coordinando un proyecto multiagente o un recorrido interactivo de Devin superando un reto de codificación pueden proporcionar información tangible sobre su funcionamiento y ventajas. Involucrarse con estas tecnologías a través de experiencias prácticas no sólo mejora la comprensión, sino que también estimula la curiosidad por el futuro de la IA.

Próximos pasos

De cara al futuro, la integración de agentes que se mejoran a sí mismos promete no sólo redefinir el panorama del desarrollo de software, sino también desencadenar cambios transformadores en todos los sectores. Para las empresas deseosas de aprovechar este potencial, el camino a seguir pasa por un planteamiento estratégico de la adopción: empezar con proyectos piloto para evaluar la compatibilidad y la eficacia, seguidos de una integración por fases que permita el aprendizaje y el ajuste continuos. Esta hoja de ruta garantiza que las organizaciones puedan aprovechar las ventajas de los agentes que se perfeccionan a sí mismos sin perder agilidad ante la evolución de las consideraciones tecnológicas y éticas.

En cualquier caso, cada vez estamos más cerca de la máxima que se empezaba a vislumbrar hace algún tiempo sobre nuestro nuevo papel como gestores de agentes humanos en el bucle:

Sólo seremos tan buenos como la red de agentes que podamos gestionar.