{"id":218,"date":"2026-02-05T20:32:10","date_gmt":"2026-02-05T19:32:10","guid":{"rendered":"https:\/\/helloblog.io\/es\/gpt-5-3-codex-salto-codex-agente-codigo-colaborador-general-ordenador\/"},"modified":"2026-02-05T20:32:10","modified_gmt":"2026-02-05T19:32:10","slug":"gpt-5-3-codex-salto-codex-agente-codigo-colaborador-general-ordenador","status":"publish","type":"post","link":"https:\/\/helloblog.io\/es\/gpt-5-3-codex-salto-codex-agente-codigo-colaborador-general-ordenador\/","title":{"rendered":"GPT-5.3-Codex: el salto de Codex de \u201cagente de c\u00f3digo\u201d a colaborador general en el ordenador"},"content":{"rendered":"\n<p>OpenAI ha presentado <strong>GPT\u20115.3\u2011Codex<\/strong>, un nuevo modelo que ampl\u00eda Codex a pr\u00e1cticamente todo el espectro del trabajo profesional \u201cen un ordenador\u201d. La idea ya no es solo generar o revisar c\u00f3digo: es <strong>investigar, usar herramientas, ejecutar tareas largas<\/strong>, y hacerlo de forma interactiva, manteniendo el contexto mientras t\u00fa lo diriges como si fuera un compa\u00f1ero de equipo.<\/p>\n\n\n\n<p>Seg\u00fan el anuncio, GPT\u20115.3\u2011Codex combina lo mejor de dos l\u00edneas: <strong>mejora el rendimiento de programaci\u00f3n \u201cfrontier\u201d de GPT\u20115.2\u2011Codex<\/strong> y a la vez incorpora <strong>razonamiento y conocimientos profesionales<\/strong> al nivel de GPT\u20115.2, todo en un \u00fanico modelo. Adem\u00e1s, se ejecuta <strong>un 25% m\u00e1s r\u00e1pido<\/strong>, lo que en la pr\u00e1ctica reduce esperas y hace m\u00e1s viable delegar tareas que se alargan durante horas o d\u00edas.<\/p>\n\n\n\n<p>Un detalle curioso (y relevante si te interesa c\u00f3mo evolucionan estas herramientas): OpenAI indica que <strong>GPT\u20115.3\u2011Codex es el primer modelo que fue instrumental en su propia creaci\u00f3n<\/strong>. El equipo de Codex us\u00f3 versiones tempranas para depurar el entrenamiento, gestionar el despliegue y diagnosticar resultados de pruebas y evaluaciones, acelerando el desarrollo del propio modelo.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Capacidades agentic \u201cfrontier\u201d: d\u00f3nde mejora y c\u00f3mo lo miden<\/h2>\n\n\n\n<p>Para situarlo, OpenAI apoya el lanzamiento con resultados en <strong>cuatro benchmarks<\/strong> orientados a medir habilidades de programaci\u00f3n, agencia (capacidad de actuar con herramientas) y desempe\u00f1o \u201cdel mundo real\u201d: <strong>SWE\u2011Bench Pro<\/strong>, <strong>Terminal\u2011Bench<\/strong>, <strong>OSWorld<\/strong> y <strong>GDPval<\/strong>. La conclusi\u00f3n general del anuncio es que el modelo marca un cambio de escala hacia un <strong>agente m\u00e1s generalista<\/strong>, capaz de razonar, construir y ejecutar tareas t\u00e9cnicas de principio a fin.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Programaci\u00f3n: SWE\u2011Bench Pro y Terminal\u2011Bench 2.0<\/h3>\n\n\n\n<p>En programaci\u00f3n pura, GPT\u20115.3\u2011Codex logra <strong>estado del arte en SWE\u2011Bench Pro<\/strong>, una evaluaci\u00f3n centrada en ingenier\u00eda de software real. OpenAI remarca varios matices importantes:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Mientras <strong>SWE\u2011bench Verified<\/strong> solo prueba Python, <strong>SWE\u2011Bench Pro<\/strong> abarca <strong>cuatro lenguajes<\/strong>.<\/li>\n\n\n<li>SWE\u2011Bench Pro est\u00e1 dise\u00f1ado para ser <strong>m\u00e1s resistente a contaminaci\u00f3n<\/strong> (contamination\u2011resistant).<\/li>\n\n\n<li>Se plantea como un benchmark <strong>m\u00e1s desafiante, diverso y relevante para industria<\/strong>.<\/li>\n\n<\/ul>\n\n\n\n<p>Adem\u00e1s, supera ampliamente el rendimiento previo en <strong>Terminal\u2011Bench 2.0<\/strong>, que mide algo muy \u201cdel d\u00eda a d\u00eda\u201d para un agente como Codex: <strong>competencias en terminal<\/strong> (comandos, navegaci\u00f3n, ejecuci\u00f3n, diagn\u00f3stico). Un punto t\u00e9cnico que tiene impacto pr\u00e1ctico: OpenAI destaca que GPT\u20115.3\u2011Codex consigue estos resultados <strong>usando menos tokens<\/strong> que modelos anteriores, lo que en productos con l\u00edmites o costes por tokens suele traducirse en <strong>m\u00e1s margen para construir<\/strong> antes de topar con techos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Desarrollo web: iteraci\u00f3n aut\u00f3noma durante \u201cd\u00edas\u201d y millones de tokens<\/h3>\n\n\n\n<p>Donde el anuncio se pone especialmente tangible es en desarrollo web. OpenAI habla de una combinaci\u00f3n de <strong>capacidad de c\u00f3digo frontier<\/strong>, mejoras de <strong>est\u00e9tica<\/strong> y <strong>compaction<\/strong> (compactaci\u00f3n) que permite producir trabajo visualmente m\u00e1s s\u00f3lido y funcional, incluso en proyectos complejos como juegos y apps construidos desde cero a lo largo de varios d\u00edas.<\/p>\n\n\n\n<p>Para probar capacidades de \u201cweb dev\u201d y agencia sostenida (long\u2011running agentic capabilities), pidieron a GPT\u20115.3\u2011Codex que creara <strong>dos juegos<\/strong>:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Una <strong>versi\u00f3n 2<\/strong> del juego de carreras del lanzamiento de la app de Codex.<\/li>\n\n\n<li>Un <strong>juego de buceo<\/strong>.<\/li>\n\n<\/ul>\n\n\n\n<p>La prueba tiene un giro interesante: en lugar de guiarlo con prompts hiperconcretos, usaron una habilidad (skill) de \u201cdevelop web game\u201d y <strong>prompts gen\u00e9ricos preseleccionados<\/strong> tipo <em>&#8220;fix the bug&#8221;<\/em> o <em>&#8220;improve the game&#8221;<\/em>. Con ese esquema, GPT\u20115.3\u2011Codex fue <strong>iterando de forma aut\u00f3noma<\/strong> durante <strong>millones de tokens<\/strong>.<\/p>\n\n\n\n<p>Los resultados est\u00e1n publicados como demos jugables:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Juego de carreras con distintos corredores, <strong>ocho mapas<\/strong> e incluso <strong>objetos<\/strong> que se usan con la barra espaciadora: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/racing_v2.html<\/li>\n\n\n<li>Juego de buceo donde exploras arrecifes, coleccionas elementos para completar tu \u201cfish codex\u201d y gestionas <strong>ox\u00edgeno, presi\u00f3n y peligros<\/strong>: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/diving_game.html<\/li>\n\n<\/ul>\n\n\n\n<p>Tambi\u00e9n se comenta una mejora que, para quienes hacemos front o montamos webs peque\u00f1as\/medianas, es clave: GPT\u20115.3\u2011Codex <strong>entiende mejor la intenci\u00f3n<\/strong> cuando le pides p\u00e1ginas \u201cde todos los d\u00edas\u201d, y ante prompts simples o poco especificados tiende a proponer <strong>m\u00e1s funcionalidad y mejores valores por defecto<\/strong> (sensible defaults). Eso se traduce en un lienzo inicial m\u00e1s completo.<\/p>\n\n\n\n<p>En el ejemplo comparativo de una landing page, OpenAI menciona dos decisiones por defecto que marcan diferencia en sensaci\u00f3n de \u201cproducci\u00f3n\u201d:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Al mostrar un plan anual, GPT\u20115.3\u2011Codex lo present\u00f3 como <strong>precio mensual con descuento<\/strong>, haciendo el descuento m\u00e1s claro e intencional, en vez de multiplicar el total anual.<\/li>\n\n\n<li>Gener\u00f3 un carrusel de testimonios que <strong>transiciona autom\u00e1ticamente<\/strong> y con <strong>tres citas distintas<\/strong>, en vez de un \u00fanico testimonio, haciendo la p\u00e1gina m\u00e1s redonda por defecto.<\/li>\n\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">M\u00e1s all\u00e1 del c\u00f3digo: soporte para todo el ciclo de vida del software (y trabajo de conocimiento)<\/h3>\n\n\n\n<p>OpenAI insiste en un punto: el d\u00eda a d\u00eda de perfiles como ingenier\u00eda, dise\u00f1o, PM o data no es solo escribir c\u00f3digo. GPT\u20115.3\u2011Codex est\u00e1 planteado para apoyar trabajo a lo largo de todo el ciclo:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Debugging<\/li>\n\n\n<li>Deploying<\/li>\n\n\n<li>Monitoring<\/li>\n\n\n<li>Redacci\u00f3n de PRDs<\/li>\n\n\n<li>Edici\u00f3n de copy<\/li>\n\n\n<li>User research<\/li>\n\n\n<li>Tests<\/li>\n\n\n<li>M\u00e9tricas y an\u00e1lisis<\/li>\n\n\n<li>Y m\u00e1s all\u00e1 del software: por ejemplo, crear presentaciones o analizar datos en hojas de c\u00e1lculo<\/li>\n\n<\/ul>\n\n\n\n<p>Para medir ese \u201ctrabajo profesional\u201d m\u00e1s general, mencionan <strong>GDPval<\/strong>, una evaluaci\u00f3n publicada por OpenAI en 2025 que mide desempe\u00f1o en tareas de trabajo de conocimiento bien especificadas a lo largo de <strong>44 ocupaciones<\/strong> (presentaciones, spreadsheets y otros entregables). Con habilidades personalizadas similares a las usadas en resultados anteriores de GDPval, GPT\u20115.3\u2011Codex muestra un rendimiento fuerte y <strong>igualar\u00eda a GPT\u20115.2<\/strong> en esa evaluaci\u00f3n, seg\u00fan el anuncio.<\/p>\n\n\n\n<p>Como muestra, incluyen ejemplos de entregables generados por el agente, entre ellos: <em>Financial advice slides<\/em>, <em>Retail training doc<\/em>, <em>NPV analysis spreadsheet<\/em> y <em>Fashion presentation PDF<\/em>. Uno de los prompts de ejemplo describe un encargo realista: preparar una presentaci\u00f3n de 10 diapositivas para asesores financieros, comparando CDs y <em>variable annuities<\/em>, y citando fuentes concretas de FINRA y NAIC.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2560\" height=\"1337\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp\" alt=\"Captura de una presentaci\u00f3n generada como ejemplo de trabajo profesional en GPT-5.3-Codex (GDPval)\" class=\"wp-image-216\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp 2560w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-300x157.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1024x535.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-768x401.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1536x802.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-2048x1069.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-400x209.webp 400w\" sizes=\"auto, (max-width: 2560px) 100vw, 2560px\" \/><figcaption class=\"wp-element-caption\"><em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<p>En paralelo, aparece <strong>OSWorld<\/strong>, un benchmark agentic de \u201cuso de ordenador\u201d donde el agente debe completar tareas de productividad en un entorno de escritorio visual, usando visi\u00f3n. OpenAI afirma que GPT\u20115.3\u2011Codex demuestra capacidades de uso de ordenador mucho m\u00e1s fuertes que modelos GPT anteriores; adem\u00e1s, se menciona que en OSWorld\u2011Verified los humanos punt\u00faan ~72%.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Codex como colaborador interactivo: dirigir al agente mientras trabaja<\/h2>\n\n\n\n<p>A medida que los agentes se vuelven m\u00e1s capaces, el cuello de botella pasa a ser la <strong>interacci\u00f3n humana<\/strong>: c\u00f3mo dirigir, supervisar y coordinar agentes en paralelo sin perder control. En ese contexto, la app de Codex se posiciona como la capa de orquestaci\u00f3n, y con GPT\u20115.3\u2011Codex el modo de trabajo se vuelve m\u00e1s interactivo.<\/p>\n\n\n\n<p>La promesa aqu\u00ed no es \u201cesperar un resultado final\u201d, sino <strong>conversar en tiempo real<\/strong>: el modelo da actualizaciones frecuentes de decisiones y progreso, puedes hacer preguntas, discutir enfoques y corregir el rumbo. Seg\u00fan el anuncio, GPT\u20115.3\u2011Codex va explicando qu\u00e9 est\u00e1 haciendo, responde al feedback y te mantiene al tanto de principio a fin.<\/p>\n\n\n\n<div class=\"wp-block-group callout callout-info is-style-info is-layout-flow wp-block-group-is-layout-flow\" style=\"border-width:1px;border-radius:8px;padding-top:1rem;padding-right:1.5rem;padding-bottom:1rem;padding-left:1.5rem\">\n\n<h4 class=\"wp-block-heading callout-title\">Ajuste en la app<\/h4>\n\n\n<p>Para habilitar el \u201csteering\u201d mientras el modelo trabaja, ve a <strong>Settings > General > Follow-up behavior<\/strong> en la app de Codex.<\/p>\n\n<\/div>\n\n\n\n<h2 class=\"wp-block-heading\">C\u00f3mo usaron Codex para entrenar y desplegar GPT\u20115.3\u2011Codex (automejora en la pr\u00e1ctica)<\/h2>\n\n\n\n<p>OpenAI atribuye las mejoras r\u00e1pidas de Codex a proyectos de investigaci\u00f3n de meses (o a\u00f1os) dentro de la compa\u00f1\u00eda, y a\u00f1ade un matiz: esos proyectos se est\u00e1n acelerando con Codex, hasta el punto de que muchas personas describen su trabajo actual como \u201cfundamentalmente distinto\u201d al de hace dos meses.<\/p>\n\n\n\n<p>Incluso las versiones tempranas de GPT\u20115.3\u2011Codex ya permit\u00edan al equipo usarlas para mejorar el propio entrenamiento y soportar el despliegue de versiones posteriores. En el anuncio se enumeran ejemplos concretos, separados por \u00e1reas:<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">En investigaci\u00f3n (monitorizaci\u00f3n y depuraci\u00f3n del entrenamiento)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Monitorizar y depurar el entrenamiento (training run) de esta release.<\/li>\n\n\n<li>Acelerar investigaci\u00f3n m\u00e1s all\u00e1 de arreglar infraestructura: detectar patrones a lo largo del entrenamiento.<\/li>\n\n\n<li>Hacer an\u00e1lisis profundo de la calidad de interacci\u00f3n (interaction quality).<\/li>\n\n\n<li>Proponer correcciones, y construir aplicaciones ricas para que investigadores humanos entiendan con precisi\u00f3n c\u00f3mo cambiaba el comportamiento frente a modelos previos.<\/li>\n\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">En ingenier\u00eda (harness, edge cases, cach\u00e9 y escalado de GPU)<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Optimizar y adaptar el <strong>harness<\/strong> (banco\/arn\u00e9s de evaluaci\u00f3n y ejecuci\u00f3n) para GPT\u20115.3\u2011Codex.<\/li>\n\n\n<li>Investigar edge cases extra\u00f1os que afectaban a usuarios: identificar bugs de <strong>renderizado de contexto<\/strong> y encontrar la causa ra\u00edz de <strong>bajas tasas de acierto de cach\u00e9<\/strong> (low cache hit rates).<\/li>\n\n\n<li>Durante el lanzamiento, ayudar a escalar din\u00e1micamente clusters de GPU para ajustarse a picos de tr\u00e1fico y mantener la latencia estable.<\/li>\n\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">En an\u00e1lisis durante alpha (clasificadores con regex y lectura de logs)<\/h3>\n\n\n\n<p>Durante pruebas alpha, un investigador quiso medir cu\u00e1nta carga de trabajo adicional se completaba \u201cpor turno\u201d y c\u00f3mo cambiaba la productividad. GPT\u20115.3\u2011Codex propuso varios <strong>clasificadores simples con regex<\/strong> para estimar m\u00e9tricas en logs de sesi\u00f3n:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Frecuencia de aclaraciones (clarifications).<\/li>\n\n\n<li>Respuestas positivas y negativas de usuarios.<\/li>\n\n\n<li>Progreso en la tarea.<\/li>\n\n<\/ul>\n\n\n\n<p>Luego ejecut\u00f3 ese an\u00e1lisis a escala sobre todos los logs y gener\u00f3 un informe con conclusiones. En el resumen del anuncio, la gente que constru\u00eda con Codex estaba m\u00e1s satisfecha porque el agente entend\u00eda mejor la intenci\u00f3n y avanzaba m\u00e1s por turno, con menos preguntas de aclaraci\u00f3n.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">En data science (pipelines nuevos y visualizaci\u00f3n m\u00e1s rica)<\/h3>\n\n\n\n<p>OpenAI tambi\u00e9n menciona que, por ser tan distinto a predecesores, los datos del alpha mostraban resultados inusuales y contraintuitivos. Una persona de data science trabaj\u00f3 con GPT\u20115.3\u2011Codex para:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Construir nuevos pipelines de datos.<\/li>\n\n\n<li>Visualizar resultados de forma m\u00e1s rica de lo que permit\u00edan los dashboards est\u00e1ndar.<\/li>\n\n\n<li>Co-analizar resultados con Codex, que resumi\u00f3 insights clave sobre miles de puntos de datos en menos de tres minutos.<\/li>\n\n<\/ul>\n\n\n\n<p>En conjunto, el mensaje es claro: m\u00e1s all\u00e1 del \u201cqu\u00e9 puede hacer\u201d, el valor est\u00e1 en <strong>acelerar equipos enteros<\/strong> en investigaci\u00f3n, ingenier\u00eda y producto.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Ciberseguridad: m\u00e1s capacidad, m\u00e1s salvaguardas<\/h2>\n\n\n\n<p>En los \u00faltimos meses, OpenAI afirma haber visto mejoras significativas en tareas de ciberseguridad, \u00fatiles tanto para developers como para profesionales de seguridad. En paralelo, indican que han estado preparando salvaguardas reforzadas para apoyar usos defensivos y resiliencia del ecosistema.<\/p>\n\n\n\n<p>GPT\u20115.3\u2011Codex es el <strong>primer modelo<\/strong> que OpenAI clasifica como <strong>\u201cHigh capability\u201d<\/strong> para tareas relacionadas con ciberseguridad bajo su <strong>Preparedness Framework<\/strong>, y el primero que entrenan directamente para <strong>identificar vulnerabilidades de software<\/strong>. Aun diciendo que no tienen evidencia definitiva de que automatice ataques end\u2011to\u2011end, adoptan un enfoque precautorio y despliegan lo que describen como su <strong>stack de seguridad de ciberseguridad m\u00e1s completo hasta la fecha<\/strong>.<\/p>\n\n\n\n<p>Las mitigaciones que enumeran incluyen:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Safety training (entrenamiento de seguridad).<\/li>\n\n\n<li>Automated monitoring (monitorizaci\u00f3n automatizada).<\/li>\n\n\n<li>Trusted access para capacidades avanzadas.<\/li>\n\n\n<li>Pipelines de enforcement (aplicaci\u00f3n de pol\u00edticas) incluyendo threat intelligence.<\/li>\n\n<\/ul>\n\n\n\n<p>Como la ciberseguridad es un dominio de doble uso, el planteamiento declarado es iterativo y basado en evidencia: <strong>acelerar a defensores<\/strong> para encontrar y corregir vulnerabilidades, y a la vez <strong>ralentizar el abuso<\/strong>. En ese marco, lanzan <strong>Trusted Access for Cyber<\/strong>, un programa piloto para acelerar investigaci\u00f3n defensiva.<\/p>\n\n\n\n<p>A nivel de salvaguardas del ecosistema, mencionan:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Ampliaci\u00f3n de la beta privada de <strong>Aardvark<\/strong>, un agente de investigaci\u00f3n de seguridad, como primera oferta de una suite de productos y herramientas de Codex Security.<\/li>\n\n\n<li>Colaboraci\u00f3n con maintainers open source para ofrecer <strong>escaneo gratuito de codebases<\/strong> en proyectos ampliamente usados como <strong>Next.js<\/strong>; se cita un caso donde un investigador de seguridad us\u00f3 Codex para encontrar vulnerabilidades, divulgadas la semana pasada: https:\/\/vercel.com\/changelog\/summaries-of-cve-2025-59471-and-cve-2025-59472<\/li>\n\n<\/ul>\n\n\n\n<p>Y en la parte de apoyo econ\u00f3mico, adem\u00e1s del <strong>$1M Cybersecurity Grant Program<\/strong> lanzado en 2023, OpenAI se compromete ahora a <strong>$10M en cr\u00e9ditos de API<\/strong> para acelerar la defensa con sus modelos m\u00e1s capaces, especialmente en open source e infraestructura cr\u00edtica. Las organizaciones involucradas en investigaci\u00f3n de seguridad de buena fe pueden solicitar cr\u00e9ditos y soporte a trav\u00e9s de: https:\/\/openai.com\/index\/openai-cybersecurity-grant-program\/.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Disponibilidad, rendimiento e infraestructura<\/h2>\n\n\n\n<p>Seg\u00fan el anuncio, <strong>GPT\u20115.3\u2011Codex est\u00e1 disponible en planes de pago de ChatGPT<\/strong>, en todos los entornos donde se puede usar Codex: <strong>app, CLI, extensi\u00f3n para IDE y web<\/strong>. Tambi\u00e9n indican que est\u00e1n trabajando para habilitar <strong>acceso por API<\/strong> \u201cpronto\u201d, con medidas de seguridad.<\/p>\n\n\n\n<p>Adem\u00e1s de la mejora del modelo, OpenAI afirma que ahora ejecutan GPT\u20115.3\u2011Codex <strong>un 25% m\u00e1s r\u00e1pido para usuarios de Codex<\/strong>, gracias a mejoras de infraestructura e inferencia, lo que deber\u00eda traducirse en interacciones y resultados m\u00e1s \u00e1giles.<\/p>\n\n\n\n<p>En cuanto al hardware, GPT\u20115.3\u2011Codex fue co-dise\u00f1ado, entrenado y servido en <strong>NVIDIA GB200 NVL72<\/strong>, y OpenAI agradece la colaboraci\u00f3n de NVIDIA.<\/p>\n\n\n<a href=\"https:\/\/persistent.oaistatic.com\/codex-app-prod\/Codex.dmg\" class=\"download-card\" download>\n                <span class=\"download-icon\"><i class=\"fa-duotone fa-file-arrow-down\"><\/i><\/span>\n                <span class=\"download-info\">\n                    <span class=\"download-title\">Descargar la app de Codex (macOS)<\/span>\n                    <span class=\"download-meta\"><span class=\"download-filename\">Codex.dmg<\/span><\/span>\n                <\/span>\n                <span class=\"download-action\"><i class=\"fa-duotone fa-arrow-down-to-line\"><\/i><\/span>\n            <\/a>\n\n\n<h2 class=\"wp-block-heading\">Qu\u00e9 cambia de fondo: del \u201cmejor agente de c\u00f3digo\u201d a un agente generalista<\/h2>\n\n\n\n<p>La lectura estrat\u00e9gica del anuncio es que Codex est\u00e1 dejando de ser \u201csolo\u201d un generador\/revisor de c\u00f3digo para convertirse en un sistema que usa el c\u00f3digo como herramienta para <strong>operar el ordenador<\/strong> y completar trabajo end\u2011to\u2011end. Empujar el l\u00edmite en agentes de programaci\u00f3n abre la puerta a una clase m\u00e1s amplia de trabajo: construir y desplegar software, pero tambi\u00e9n investigar, analizar y ejecutar tareas complejas que mezclan herramientas, documentos, datos y UI.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Ap\u00e9ndice: resultados de benchmarks (xhigh)<\/h2>\n\n\n\n<p>OpenAI publica una tabla de resultados comparando GPT\u20115.3\u2011Codex con GPT\u20115.2\u2011Codex y GPT\u20115.2. Los valores que figuran en el anuncio son:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li><strong>SWE\u2011Bench Pro (Public):<\/strong> GPT\u20115.3\u2011Codex 56.8% \u00b7 GPT\u20115.2\u2011Codex 56.4% \u00b7 GPT\u20115.2 55.6%<\/li>\n\n\n<li><strong>Terminal\u2011Bench 2.0:<\/strong> GPT\u20115.3\u2011Codex 77.3% \u00b7 GPT\u20115.2\u2011Codex 64.0% \u00b7 GPT\u20115.2 62.2%<\/li>\n\n\n<li><strong>OSWorld\u2011Verified:<\/strong> GPT\u20115.3\u2011Codex 64.7% \u00b7 GPT\u20115.2\u2011Codex 38.2% \u00b7 GPT\u20115.2 37.9%<\/li>\n\n\n<li><strong>GDPval (wins or ties):<\/strong> GPT\u20115.3\u2011Codex 70.9% \u00b7 GPT\u20115.2\u2011Codex &#8211; \u00b7 GPT\u20115.2 70.9% (high)<\/li>\n\n\n<li><strong>Cybersecurity Capture The Flag Challenges:<\/strong> GPT\u20115.3\u2011Codex 77.6% \u00b7 GPT\u20115.2\u2011Codex 67.4% \u00b7 GPT\u20115.2 67.7%<\/li>\n\n\n<li><strong>SWE\u2011Lancer IC Diamond:<\/strong> GPT\u20115.3\u2011Codex 81.4% \u00b7 GPT\u20115.2\u2011Codex 76.0% \u00b7 GPT\u20115.2 74.6%<\/li>\n\n<\/ul>\n\n\n\n<div class=\"wp-block-group callout callout-warning is-style-warning is-layout-flow wp-block-group-is-layout-flow\" style=\"border-width:1px;border-radius:8px;padding-top:1rem;padding-right:1.5rem;padding-bottom:1rem;padding-left:1.5rem\">\n\n<h4 class=\"wp-block-heading callout-title\">Nota sobre las evaluaciones<\/h4>\n\n\n<p>El anuncio indica que <strong>todas las evaluaciones<\/strong> del blog se ejecutaron en GPT\u20115.3\u2011Codex con <strong>xhigh reasoning effort<\/strong>.<\/p>\n\n<\/div>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp\" alt=\"Arte de referencia del anuncio de GPT-5.2-Codex\" class=\"wp-image-217\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/5\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\"><em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n<div class=\"references-section\">\n                <h2>Referencias \/ Fuentes<\/h2>\n                <ul class=\"references-list\"><li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-3-codex\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing GPT-5.3-Codex<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-the-codex-app\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing the Codex app<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gdpval\/\" target=\"_blank\" rel=\"noopener noreferrer\">GDPval<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/strengthening-cyber-resilience\/\" target=\"_blank\" rel=\"noopener noreferrer\">Strengthening cyber resilience<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gpt-5-3-codex-system-card\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPT-5.3-Codex System Card<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/updating-our-preparedness-framework\/\" target=\"_blank\" rel=\"noopener noreferrer\">Updating our preparedness framework<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/trusted-access-for-cyber\/\" target=\"_blank\" rel=\"noopener noreferrer\">Trusted Access for Cyber<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-aardvark\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing Aardvark<\/a><\/li><li><a href=\"https:\/\/vercel.com\/changelog\/summaries-of-cve-2025-59471-and-cve-2025-59472\" target=\"_blank\" rel=\"noopener noreferrer\">Summaries of CVE-2025-59471 and CVE-2025-59472<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/openai-cybersecurity-grant-program\/\" target=\"_blank\" rel=\"noopener noreferrer\">OpenAI Cybersecurity Grant Program<\/a><\/li><\/ul>\n            <\/div>","protected":false},"excerpt":{"rendered":"<p>GPT-5.3-Codex llega como el modelo agentic m\u00e1s capaz de Codex hasta la fecha: m\u00e1s r\u00e1pido, con mejor razonamiento y pensado para ejecutar tareas largas con herramientas, terminal y escritorio.<\/p>\n","protected":false},"author":15,"featured_media":215,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[73],"tags":[105,107,103,106,104],"class_list":["post-218","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ia","tag-agentes","tag-ciberseguridad","tag-codex","tag-desarrollo-web","tag-gpt-5-3-codex"],"_links":{"self":[{"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/posts\/218","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/users\/15"}],"replies":[{"embeddable":true,"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/comments?post=218"}],"version-history":[{"count":0,"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/posts\/218\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/media\/215"}],"wp:attachment":[{"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/media?parent=218"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/categories?post=218"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/helloblog.io\/es\/wp-json\/wp\/v2\/tags?post=218"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}