Publicado el: 16/05/2025

OpenAI lanza Codex: Un agente de software en la nube que revoluciona el desarrollo

OpenAI ha presentado oficialmente Codex, su nueva herramienta de inteligencia artificial para desarrollo de software, un agente basado en la nube que puede ejecutar múltiples tareas de programación en paralelo. Esta herramienta está impulsada por el modelo codex-1, una versión optimizada del modelo o3 específicamente entrenada para programación y tareas relacionadas con ingeniería de software.

Codex ya está disponible desde hoy para usuarios de ChatGPT Pro, Team y Enterprise, y próximamente llegará a los usuarios del plan Plus y Edu.

¿Qué es Codex?

Codex es una plataforma de desarrollo inteligente integrada en ChatGPT que permite delegar tareas como:

Redacción de nuevas funcionalidades.
Revisión y corrección de código.
Análisis del código fuente existente.
Generación de pull requests con pruebas verificables.

Cada tarea se ejecuta en un entorno seguro y aislado, precargado con el repositorio del usuario. El desarrollador simplemente indica qué necesita hacer, y Codex actúa en consecuencia, documentando cada paso con evidencia como logs de terminal y resultados de pruebas automáticas.

Principales capacidades técnicas

Aislamiento y seguridad: Cada tarea de Codex corre en un contenedor independiente sin acceso a Internet, garantizando un entorno seguro.
Paralelismo: Puede trabajar en múltiples tareas simultáneamente.
Adaptación a preferencias humanas: El modelo ha sido entrenado para alinearse con prácticas comunes de desarrollo, incluyendo estilo de código y convenciones de revisión de PRs.
Ejecución autónoma de pruebas: Codex no solo genera código, sino que también lo ejecuta, prueba, y asegura que cumpla los criterios establecidos.

¿Cómo se utiliza Codex?

Codex se accede desde el sidebar de ChatGPT con dos opciones clave:

“Code”: para ejecutar tareas de desarrollo.
“Ask”: para hacer preguntas sobre el código base.

Además, los usuarios pueden agregar archivos AGENTS.md en sus repositorios para guiar al agente con instrucciones sobre convenciones, herramientas de prueba, comandos personalizados y mejores prácticas.

Evaluaciones y benchmarks

Codex-1 ha sido sometido a extensos benchmarks:

En tareas de evaluación SWE-Bench Verified, alcanza un 75% de precisión (pass@8).
En pruebas internas de OpenAI con tareas reales de ingeniería, supera en rendimiento a versiones anteriores del modelo o3.

Aplicaciones reales: ¿Cómo se está usando?

Empresas como Cisco, Temporal, Superhuman y Kodiak Robotics ya lo están implementando en sus flujos de trabajo:

Cisco evalúa su uso para acelerar el desarrollo en diferentes productos.
Temporal lo usa para depurar, escribir pruebas y documentar funciones.
Superhuman permite a sus product managers hacer pequeños cambios sin apoyo técnico.
Kodiak lo emplea para mejorar herramientas de depuración y aumentar la cobertura de pruebas.

Codex CLI y codex-mini-latest

OpenAI también ha lanzado una nueva versión más liviana del modelo, codex-mini-latest, ideal para su uso local mediante Codex CLI, con un enfoque en tareas de edición rápidas y respuestas de baja latencia.

Con esta nueva versión, los desarrolladores pueden:

Autenticarse directamente con su cuenta de ChatGPT.
Configurar automáticamente la clave API.
Acceder a créditos gratuitos: $5 para usuarios Plus, $50 para usuarios Pro.

Precios y disponibilidad

Codex estará inicialmente disponible sin coste adicional por un periodo limitado. Más adelante, se implementará un sistema de tarifas basado en uso y precios flexibles:

En API:
$1.50 por millón de tokens de entrada
$6 por millón de tokens de salida
75% de descuento con prompt caching

Compromiso con la seguridad

OpenAI ha reforzado las políticas de uso de Codex para evitar desarrollos maliciosos. Codex ha sido entrenado para rechazar explícitamente tareas que impliquen prácticas como el desarrollo de malware o ingeniería inversa agresiva.

Los entornos de Codex están diseñados para funcionar sin conexión a Internet, lo que evita interacciones con fuentes externas no autorizadas.

¿Qué viene después?

OpenAI tiene una visión clara:

“Creemos que la colaboración asincrónica con agentes inteligentes será el estándar de desarrollo en el futuro.”

Entre las futuras funciones previstas:

Interacción más fluida durante tareas en curso.
Capacidad de recibir feedback del usuario en tiempo real.
Integración directa con herramientas como trackers de incidencias, sistemas CI/CD y editores de código.

Opinión desde Utilia

Desde Utilia vemos el lanzamiento de Codex como un paso transformador en la relación entre inteligencia artificial y desarrollo de software. Esta herramienta no solo amplifica las capacidades de los desarrolladores, sino que también redefine lo que significa trabajar en equipo con un asistente digital.

Codex representa el tipo de evolución tecnológica que impulsa el ADN de Utilia: automatizar, asistir, y ayudar a las personas a enfocarse en las decisiones clave, delegando a la IA el resto.

Lo más valioso no es que Codex escriba código, sino que lo haga con comprensión de contexto, verificación de calidad y alineado a objetivos reales.