{"id":226,"date":"2026-02-05T20:31:58","date_gmt":"2026-02-05T19:31:58","guid":{"rendered":"https:\/\/helloblog.io\/pt\/gpt-5-3-codex-salto-codex-colaborador-completo-no-computador\/"},"modified":"2026-02-05T20:31:58","modified_gmt":"2026-02-05T19:31:58","slug":"gpt-5-3-codex-salto-codex-colaborador-completo-no-computador","status":"publish","type":"post","link":"https:\/\/helloblog.io\/pt\/gpt-5-3-codex-salto-codex-colaborador-completo-no-computador\/","title":{"rendered":"GPT-5.3-Codex: o salto do Codex de \u201cagente de c\u00f3digo\u201d para colaborador completo no computador"},"content":{"rendered":"\n<p>A OpenAI apresentou o <strong>GPT\u20115.3\u2011Codex<\/strong> como o modelo mais capaz at\u00e9 agora dentro do Codex &#8211; e a mudan\u00e7a aqui n\u00e3o \u00e9 apenas \u201cmais qualidade de c\u00f3digo\u201d. A ideia declarada \u00e9 expandir o Codex para <strong>todo o espectro de trabalho profissional num computador<\/strong>: desde escrever e rever c\u00f3digo at\u00e9 operar ambientes, gerir tarefas longas, criar artefactos (docs, slides, folhas de c\u00e1lculo), e manter-te no loop enquanto o agente executa.<\/p>\n\n\n\n<p>Em termos de posicionamento, o GPT\u20115.3\u2011Codex combina duas frentes num s\u00f3 modelo: a performance de coding \u201cfrontier\u201d do GPT\u20115.2\u2011Codex com as capacidades de racioc\u00ednio e conhecimento profissional do GPT\u20115.2 &#8211; com a nota adicional de ser <strong>25% mais r\u00e1pido<\/strong>. O resultado pr\u00e1tico \u00e9 um agente mais apto para trabalho prolongado que envolve <strong>pesquisa<\/strong>, <strong>uso de ferramentas<\/strong> e <strong>execu\u00e7\u00e3o complexa<\/strong>, sem perder contexto quando vais orientando o processo.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Capacidades agentic de fronteira: o que mudou na pr\u00e1tica<\/h2>\n\n\n\n<p>A OpenAI enquadra este lan\u00e7amento com resultados fortes em quatro benchmarks usados para medir capacidades de programa\u00e7\u00e3o, ag\u00eancia e execu\u00e7\u00e3o em ambientes reais: <strong>SWE\u2011Bench Pro<\/strong>, <strong>Terminal\u2011Bench<\/strong>, <strong>OSWorld<\/strong> e <strong>GDPval<\/strong>. O ponto importante, para quem desenvolve, \u00e9 que o GPT\u20115.3\u2011Codex est\u00e1 a ser tratado como um agente que n\u00e3o s\u00f3 escreve c\u00f3digo, mas que consegue <strong>executar<\/strong> trabalho em ambiente de computador de forma mais consistente.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Coding: SWE\u2011Bench Pro e Terminal\u2011Bench 2.0<\/h3>\n\n\n\n<p>No eixo de engenharia de software, o GPT\u20115.3\u2011Codex atinge <strong>state\u2011of\u2011the\u2011art no SWE\u2011Bench Pro<\/strong>, uma avalia\u00e7\u00e3o centrada em tarefas reais de software engineering. A compara\u00e7\u00e3o que a OpenAI faz \u00e9 relevante: enquanto o <strong>SWE\u2011bench Verified<\/strong> s\u00f3 testa Python, o <strong>SWE\u2011Bench Pro<\/strong> cobre <strong>quatro linguagens<\/strong>, \u00e9 mais resistente a contamina\u00e7\u00e3o e \u00e9 descrito como mais desafiante, diverso e alinhado com necessidades de ind\u00fastria.<\/p>\n\n\n\n<p>Al\u00e9m disso, o modelo \u201cdispara\u201d no <strong>Terminal\u2011Bench 2.0<\/strong>, que mede compet\u00eancias de terminal necess\u00e1rias a um agente como o Codex. Um detalhe com impacto direto no custo\/escala: a OpenAI nota que o GPT\u20115.3\u2011Codex alcan\u00e7a estes resultados com <strong>menos tokens do que qualquer modelo anterior<\/strong>, o que tende a deixar mais margem para construir (e iterar) antes de bater em limites pr\u00e1ticos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Desenvolvimento web: autonomia a longo prazo (milh\u00f5es de tokens)<\/h3>\n\n\n\n<p>Para testar a vertente de web dev e a capacidade de sustentar tarefas longas, a OpenAI pediu ao GPT\u20115.3\u2011Codex para construir <strong>dois jogos<\/strong>: a vers\u00e3o 2 do jogo de corrida mostrado no lan\u00e7amento da Codex app e um jogo de mergulho. A metodologia foi interessante porque n\u00e3o dependeu de prompts \u201cartesanais\u201d: usaram uma skill espec\u00edfica (\u201cdevelop web game\u201d) e prompts gen\u00e9ricos de follow\u2011up como <strong>&#8220;fix the bug&#8221;<\/strong> ou <strong>&#8220;improve the game&#8221;<\/strong>.<\/p>\n\n\n\n<p>O modelo iterou de forma aut\u00f3noma <strong>ao longo de milh\u00f5es de tokens<\/strong>, refinando mec\u00e2nicas e funcionalidades. A OpenAI disponibilizou os resultados para jogar diretamente no browser:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Jogo de corrida com diferentes pilotos, <strong>oito mapas<\/strong> e <strong>itens<\/strong> ativados com a barra de espa\u00e7o: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/racing_v2.html<\/li>\n\n\n<li>Jogo de mergulho com explora\u00e7\u00e3o de recifes, cole\u00e7\u00e3o de itens para completar um \u201cfish codex\u201d, e gest\u00e3o de <strong>oxig\u00e9nio<\/strong>, <strong>press\u00e3o<\/strong> e <strong>perigos<\/strong>: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/diving_game.html<\/li>\n\n<\/ul>\n\n\n\n<p>Outro ponto que aparece de forma muito \u201cproduto\u201d: em pedidos mais simples (ou subespecificados), o GPT\u20115.3\u2011Codex tende a assumir defaults mais sensatos e entregar p\u00e1ginas com mais funcionalidade de base. A OpenAI mostra um exemplo com duas landing pages geradas por GPT\u20115.3\u2011Codex vs GPT\u20115.2\u2011Codex, onde o GPT\u20115.3\u2011Codex tomou decis\u00f5es que fazem diferen\u00e7a em produ\u00e7\u00e3o: apresentar o plano anual como <strong>mensal com desconto<\/strong> (em vez de multiplicar o total anual) e criar um carrossel de testemunhos a transitar automaticamente com <strong>tr\u00eas cita\u00e7\u00f5es distintas<\/strong>, resultando numa p\u00e1gina que parece mais completa por defeito.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Para al\u00e9m do c\u00f3digo: suporte ao ciclo inteiro (e ao trabalho \u201cde escrit\u00f3rio\u201d tamb\u00e9m)<\/h3>\n\n\n\n<p>A OpenAI tamb\u00e9m faz quest\u00e3o de frisar o \u00f3bvio que muitas equipas vivem: engenheiros, designers, PMs e data scientists fazem muito mais do que gerar c\u00f3digo. O GPT\u20115.3\u2011Codex foi desenhado para apoiar tarefas ao longo do ciclo de vida: <strong>debugging, deployment, monitoring, escrita de PRDs, edi\u00e7\u00e3o de copy, user research, testes, m\u00e9tricas<\/strong> e mais.<\/p>\n\n\n\n<p>E a ambi\u00e7\u00e3o vai al\u00e9m do software: o modelo \u00e9 apresentado como capaz de ajudar a \u201cconstruir o que quiseres construir\u201d, incluindo <strong>apresenta\u00e7\u00f5es<\/strong> (slide decks) e an\u00e1lise de dados em <strong>spreadsheets<\/strong>.<\/p>\n\n\n\n<p>No benchmark <strong>GDPval<\/strong>, o GPT\u20115.3\u2011Codex mostra performance forte em trabalho de conhecimento bem especificado, <strong>igualando o GPT\u20115.2<\/strong> segundo a OpenAI. O GDPval \u00e9 descrito como uma avalia\u00e7\u00e3o lan\u00e7ada em 2025 para medir performance em tarefas de knowledge work ao longo de <strong>44 profiss\u00f5es<\/strong>, incluindo a cria\u00e7\u00e3o de apresenta\u00e7\u00f5es, folhas de c\u00e1lculo e outros outputs.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Exemplo (GDPval): slides de aconselhamento financeiro com fontes<\/h4>\n\n\n\n<p>Um exemplo inclu\u00eddo no an\u00fancio descreve um task completo: atuar como consultor financeiro numa wealth management firm e preparar uma apresenta\u00e7\u00e3o PowerPoint de 10 slides para aconselhar contra trocar certificados de dep\u00f3sito por variable annuities, com t\u00f3picos espec\u00edficos e refer\u00eancias a fontes externas (NAIC e FINRA). A OpenAI mostra um screenshot do output gerado:<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2560\" height=\"1337\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp\" alt=\"Exemplo de output do GPT-5.3-Codex: slides de aconselhamento financeiro gerados como parte do benchmark GDPval\" class=\"wp-image-222\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp 2560w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-300x157.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1024x535.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-768x401.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1536x802.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-2048x1069.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-400x209.webp 400w\" sizes=\"auto, (max-width: 2560px) 100vw, 2560px\" \/><figcaption class=\"wp-element-caption\">Screenshot do exemplo apresentado pela OpenAI (GDPval). \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<p>A mensagem por tr\u00e1s deste exemplo \u00e9 que cada tarefa no GDPval \u00e9 desenhada por um profissional experiente e tenta refletir trabalho real daquela ocupa\u00e7\u00e3o &#8211; ou seja, menos \u201cdemo bonita\u201d e mais trabalho com requisitos.<\/p>\n\n\n\n<p>J\u00e1 no <strong>OSWorld<\/strong>, que \u00e9 um benchmark de uso do computador em ambiente visual (tipo desktop), a OpenAI afirma que o GPT\u20115.3\u2011Codex d\u00e1 um salto grande face a modelos GPT anteriores, com resultados muito superiores em <strong>OSWorld\u2011Verified<\/strong>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Colaborador interativo: a interface passa a ser metade do produto<\/h2>\n\n\n\n<p>H\u00e1 aqui um ponto que, como dev, vale prestar aten\u00e7\u00e3o: \u00e0 medida que os agentes ficam mais capazes, o gargalo desloca-se do \u201co que conseguem fazer\u201d para \u201ccomo \u00e9 que os humanos conseguem <strong>dirigir e supervisionar<\/strong> v\u00e1rios agentes em paralelo\u201d. A Codex app \u00e9 o ve\u00edculo para isto, e com o GPT\u20115.3\u2011Codex o foco \u00e9 torn\u00e1-la mais interativa.<\/p>\n\n\n\n<p>Segundo o an\u00fancio, o Codex passa a fornecer <strong>updates frequentes<\/strong> enquanto trabalha. Em vez de esperares por um output final, consegues interagir em tempo real: fazer perguntas, discutir abordagens, e orientar a execu\u00e7\u00e3o. O modelo explica o que est\u00e1 a fazer, responde a feedback e mant\u00e9m-te informado do in\u00edcio ao fim.<\/p>\n\n\n\n<div class=\"wp-block-group callout callout-info is-style-info is-layout-flow wp-block-group-is-layout-flow\" style=\"border-width:1px;border-radius:8px;padding-top:1rem;padding-right:1.5rem;padding-bottom:1rem;padding-left:1.5rem\">\n\n<h4 class=\"wp-block-heading callout-title\">Onde ativar o \u201csteering\u201d na Codex app<\/h4>\n\n\n<p>Para permitir que possas orientar o modelo enquanto ele trabalha, ativa a op\u00e7\u00e3o em <strong>Settings > General > Follow-up behavior<\/strong>.<\/p>\n\n<\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Como o Codex ajudou a treinar e a lan\u00e7ar o pr\u00f3prio GPT\u20115.3\u2011Codex<\/h2>\n\n\n\n<p>A parte mais curiosa deste lan\u00e7amento \u00e9 quase \u201cmeta\u201d: a OpenAI diz que o GPT\u20115.3\u2011Codex \u00e9 o <strong>primeiro modelo<\/strong> que foi instrumental na sua pr\u00f3pria cria\u00e7\u00e3o. A equipa do Codex usou vers\u00f5es iniciais do modelo para <strong>debug do treino<\/strong>, para <strong>gerir deployment<\/strong>, e para <strong>diagnosticar resultados de testes e avalia\u00e7\u00f5es<\/strong> &#8211; e descreve que ficou surpreendida com a acelera\u00e7\u00e3o que isto trouxe.<\/p>\n\n\n\n<p>Eles enquadram isto num contexto maior: melhorias r\u00e1pidas no Codex resultam de projetos de investiga\u00e7\u00e3o que v\u00eam de meses\/anos, mas esses projetos est\u00e3o a ser acelerados pelo pr\u00f3prio Codex. A OpenAI chega a dizer que muitos investigadores e engenheiros sentem que o trabalho hoje \u00e9 \u201cfundamentalmente diferente\u201d do que era h\u00e1 dois meses, dado o n\u00edvel de assist\u00eancia que estes agentes j\u00e1 d\u00e3o.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Exemplos concretos (research): monitorizar e depurar o treino<\/h3>\n\n\n\n<p>Do lado de research, o Codex foi usado para monitorizar e depurar o training run desta release. Mas n\u00e3o ficou pela infraestrutura: ajudou a identificar padr\u00f5es ao longo do treino, produziu an\u00e1lises profundas sobre qualidade de intera\u00e7\u00e3o, prop\u00f4s corre\u00e7\u00f5es e chegou a construir aplica\u00e7\u00f5es ricas para investigadores humanos perceberem, com precis\u00e3o, como o comportamento diferia face a modelos anteriores.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Exemplos concretos (engineering): harness, edge cases e GPU scaling<\/h3>\n\n\n\n<p>Do lado de engenharia, o Codex foi usado para otimizar e adaptar o <strong>harness<\/strong> (o conjunto de tooling e infraestrutura que executa\/avaliza o modelo) para o GPT\u20115.3\u2011Codex. Quando apareceram edge cases estranhos a impactar utilizadores, membros da equipa usaram o Codex para identificar bugs de rendering de contexto e para encontrar a root cause de <strong>baixas cache hit rates<\/strong>.<\/p>\n\n\n\n<p>Durante o lan\u00e7amento, o GPT\u20115.3\u2011Codex continua a ser usado para tarefas operacionais: <strong>escalar dinamicamente clusters de GPU<\/strong> para lidar com picos de tr\u00e1fego e manter a <strong>lat\u00eancia est\u00e1vel<\/strong>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Exemplos concretos (produtividade): classificadores com regex e an\u00e1lise de logs<\/h3>\n\n\n\n<p>Em alpha testing, um investigador quis medir quanto trabalho extra o GPT\u20115.3\u2011Codex conseguia por turno e o impacto na produtividade. O pr\u00f3prio GPT\u20115.3\u2011Codex prop\u00f4s classificadores simples com <strong>regex<\/strong> para estimar: frequ\u00eancia de pedidos de clarifica\u00e7\u00e3o, respostas positivas\/negativas dos utilizadores e progresso na tarefa. Depois correu esses classificadores de forma escal\u00e1vel sobre logs de sess\u00f5es e gerou um relat\u00f3rio com conclus\u00f5es.<\/p>\n\n\n\n<p>A OpenAI destaca a conclus\u00e3o operacional: \u00e0 medida que o agente entendia melhor a inten\u00e7\u00e3o, avan\u00e7ava mais por turno e fazia menos perguntas de clarifica\u00e7\u00e3o, as pessoas a construir com Codex ficavam mais satisfeitas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Exemplos concretos (dados): pipelines novos e visualiza\u00e7\u00f5es mais ricas<\/h3>\n\n\n\n<p>Como o GPT\u20115.3\u2011Codex difere bastante dos predecessores, os dados de alpha testing mostraram resultados incomuns e contraintuitivos. Um data scientist trabalhou com o modelo para criar <strong>novos data pipelines<\/strong> e visualizar resultados de forma mais rica do que as ferramentas standard de dashboarding permitiam. A an\u00e1lise foi feita em conjunto com o Codex, que resumiu insights-chave em milhares de data points em menos de tr\u00eas minutos.<\/p>\n\n\n\n<p>A OpenAI fecha esta sec\u00e7\u00e3o com uma leitura agregada: isoladamente, s\u00e3o bons exemplos; em conjunto, estas capacidades resultaram numa acelera\u00e7\u00e3o significativa das equipas de research, engineering e produto.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Ciberseguran\u00e7a: \u201cHigh capability\u201d e um stack de mitiga\u00e7\u00e3o mais pesado<\/h2>\n\n\n\n<p>Nos \u00faltimos meses (segundo a OpenAI), houve ganhos relevantes em tarefas de ciberseguran\u00e7a, \u00fateis tanto para developers como para profissionais de seguran\u00e7a. Em paralelo, a empresa diz que tem vindo a preparar <strong>salvaguardas refor\u00e7adas<\/strong> para suportar uso defensivo e resili\u00eancia do ecossistema.<\/p>\n\n\n\n<p>O an\u00fancio marca um ponto novo: o GPT\u20115.3\u2011Codex \u00e9 o <strong>primeiro modelo<\/strong> que a OpenAI classifica como <strong>High capability<\/strong> para tarefas relacionadas com ciberseguran\u00e7a sob o seu <strong>Preparedness Framework<\/strong>, e o primeiro que foi <strong>treinado diretamente para identificar vulnerabilidades de software<\/strong>. Ao mesmo tempo, a OpenAI afirma n\u00e3o ter evid\u00eancia definitiva de que o modelo consiga automatizar ataques end\u2011to\u2011end &#8211; mas opta por uma abordagem de precau\u00e7\u00e3o.<\/p>\n\n\n\n<p>Por isso, est\u00e1 a ser lan\u00e7ado com o que descrevem como o stack de seguran\u00e7a de ciber mais abrangente at\u00e9 hoje. As mitiga\u00e7\u00f5es citadas incluem:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Safety training (treino orientado para seguran\u00e7a)<\/li>\n\n\n<li>Automated monitoring (monitoriza\u00e7\u00e3o automatizada)<\/li>\n\n\n<li>Trusted access para capacidades avan\u00e7adas<\/li>\n\n\n<li>Enforcement pipelines, incluindo threat intelligence<\/li>\n\n<\/ul>\n\n\n\n<p>Como a ciberseguran\u00e7a \u00e9 inerentemente dual\u2011use, a OpenAI descreve a estrat\u00e9gia como <strong>iterativa e baseada em evid\u00eancia<\/strong>: acelerar a capacidade de defensores encontrarem e corrigirem vulnerabilidades, enquanto se tenta travar abuso.<\/p>\n\n\n\n<p>Dentro disso, h\u00e1 tr\u00eas iniciativas e compromissos anunciados:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Lan\u00e7amento do <strong>Trusted Access for Cyber<\/strong> (programa piloto) para acelerar investiga\u00e7\u00e3o defensiva.<\/li>\n\n\n<li>Expans\u00e3o da private beta do <strong>Aardvark<\/strong>, um agente de investiga\u00e7\u00e3o de seguran\u00e7a, como primeira oferta de uma suite de produtos e ferramentas Codex Security.<\/li>\n\n\n<li>Parcerias com maintainers open source para oferecer <strong>scanning gratuito<\/strong> a projetos amplamente usados (ex.: Next.js), citando um caso recente onde um investigador de seguran\u00e7a usou o Codex para encontrar vulnerabilidades que foram divulgadas: https:\/\/vercel.com\/changelog\/summaries-of-cve-2025-59471-and-cve-2025-59472<\/li>\n\n<\/ul>\n\n\n\n<p>Al\u00e9m do programa de bolsas de 2023 (US$1M), a OpenAI tamb\u00e9m comunica um compromisso adicional: <strong>US$10M em cr\u00e9ditos de API<\/strong> para acelerar defesa cibern\u00e9tica com os seus modelos mais capazes, com foco especial em software open source e sistemas de infraestrutura cr\u00edtica. Organiza\u00e7\u00f5es envolvidas em investiga\u00e7\u00e3o de seguran\u00e7a de boa f\u00e9 podem candidatar-se a cr\u00e9ditos e suporte via o <strong>Cybersecurity Grant Program<\/strong>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Disponibilidade, velocidade e infraestrutura<\/h2>\n\n\n\n<p>Em termos de acesso, o GPT\u20115.3\u2011Codex est\u00e1 dispon\u00edvel em planos pagos do ChatGPT e em todo o s\u00edtio onde o Codex existe: <strong>app<\/strong>, <strong>CLI<\/strong>, <strong>extens\u00e3o de IDE<\/strong> e <strong>web<\/strong>. A OpenAI diz que est\u00e1 a trabalhar para ativar acesso via <strong>API<\/strong> \u201cem breve\u201d, com seguran\u00e7a.<\/p>\n\n\n\n<p>O update tamb\u00e9m inclui uma melhoria de performance operacional: a OpenAI afirma estar a correr o GPT\u20115.3\u2011Codex <strong>25% mais r\u00e1pido para utilizadores do Codex<\/strong>, gra\u00e7as a melhorias na infraestrutura e no inference stack, trazendo intera\u00e7\u00f5es e resultados mais r\u00e1pidos.<\/p>\n\n\n\n<p>A n\u00edvel de hardware, o GPT\u20115.3\u2011Codex foi co-desenhado, treinado e servido em <strong>NVIDIA GB200 NVL72<\/strong>. A OpenAI agradece explicitamente a parceria com a NVIDIA.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">O que os n\u00fameros do ap\u00eandice dizem (benchmarks e configura\u00e7\u00f5es)<\/h2>\n\n\n\n<p>No ap\u00eandice, a OpenAI publica uma tabela com m\u00e9tricas lado a lado para GPT\u20115.3\u2011Codex (xhigh), GPT\u20115.2\u2011Codex (xhigh) e GPT\u20115.2 (xhigh). Estes s\u00e3o os valores apresentados:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>SWE\u2011Bench Pro (Public): <strong>56.8%<\/strong> (GPT\u20115.3\u2011Codex) vs <strong>56.4%<\/strong> (GPT\u20115.2\u2011Codex) vs <strong>55.6%<\/strong> (GPT\u20115.2)<\/li>\n\n\n<li>Terminal\u2011Bench 2.0: <strong>77.3%<\/strong> vs <strong>64.0%<\/strong> vs <strong>62.2%<\/strong><\/li>\n\n\n<li>OSWorld\u2011Verified: <strong>64.7%<\/strong> vs <strong>38.2%<\/strong> vs <strong>37.9%<\/strong><\/li>\n\n\n<li>GDPval (wins or ties): <strong>70.9%<\/strong> (GPT\u20115.3\u2011Codex) | (sem valor indicado para GPT\u20115.2\u2011Codex) | <strong>70.9% (high)<\/strong> (GPT\u20115.2)<\/li>\n\n\n<li>Cybersecurity Capture The Flag Challenges: <strong>77.6%<\/strong> vs <strong>67.4%<\/strong> vs <strong>67.7%<\/strong><\/li>\n\n\n<li>SWE\u2011Lancer IC Diamond: <strong>81.4%<\/strong> vs <strong>76.0%<\/strong> vs <strong>74.6%<\/strong><\/li>\n\n<\/ul>\n\n\n\n<div class=\"wp-block-group callout callout-warning is-style-warning is-layout-flow wp-block-group-is-layout-flow\" style=\"border-width:1px;border-radius:8px;padding-top:1rem;padding-right:1.5rem;padding-bottom:1rem;padding-left:1.5rem\">\n\n<h4 class=\"wp-block-heading callout-title\">Nota sobre as avalia\u00e7\u00f5es<\/h4>\n\n\n<p>A OpenAI indica em rodap\u00e9 que <strong>todas as avalia\u00e7\u00f5es no blog<\/strong> foram executadas no GPT\u20115.3\u2011Codex com <strong>xhigh reasoning effort<\/strong>.<\/p>\n\n<\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Try it: download da Codex app<\/h2>\n\n\n\n<p>O an\u00fancio inclui um link direto para experimentar o Codex via app (macOS):<\/p>\n\n\n<a href=\"https:\/\/persistent.oaistatic.com\/codex-app-prod\/Codex.dmg\" class=\"download-card\" download>\n                <span class=\"download-icon\"><i class=\"fa-duotone fa-file-arrow-down\"><\/i><\/span>\n                <span class=\"download-info\">\n                    <span class=\"download-title\">Codex app (macOS) &#8211; download<\/span>\n                    <span class=\"download-meta\"><span class=\"download-filename\">Codex.dmg<\/span><\/span>\n                <\/span>\n                <span class=\"download-action\"><i class=\"fa-duotone fa-arrow-down-to-line\"><\/i><\/span>\n            <\/a>\n\n\n<h2 class=\"wp-block-heading\">O que vem a seguir (segundo o an\u00fancio)<\/h2>\n\n\n\n<p>O framing final da OpenAI \u00e9 que, com o GPT\u20115.3\u2011Codex, o Codex est\u00e1 a evoluir de \u201cescrever c\u00f3digo\u201d para <strong>usar c\u00f3digo como ferramenta para operar o computador<\/strong> e concluir trabalho end\u2011to\u2011end. Ao empurrar o limite do que um coding agent consegue fazer, abre-se espa\u00e7o para uma classe mais ampla de trabalho de conhecimento &#8211; desde construir e deployar software at\u00e9 pesquisar, analisar e executar tarefas complexas.<\/p>\n\n\n\n<p>O que come\u00e7ou como uma aposta em ser o melhor agente de coding \u00e9 descrito como base para um colaborador mais geral no computador, expandindo quem consegue construir e o que \u00e9 poss\u00edvel fazer com o Codex.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art.webp\" alt=\"Arte associada ao System Card do GPT-5.3-Codex\" class=\"wp-image-223\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/System_Card_Art-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\">Imagem apresentada na sec\u00e7\u00e3o de leituras relacionadas do an\u00fancio. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2400\" height=\"1260\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Codex_Landing_Page_SEO.webp\" alt=\"Imagem de destaque associada \u00e0 p\u00e1gina do lan\u00e7amento da Codex app\" class=\"wp-image-224\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Codex_Landing_Page_SEO.webp 2400w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Codex_Landing_Page_SEO-300x158.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Codex_Landing_Page_SEO-1024x538.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Codex_Landing_Page_SEO-768x403.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Codex_Landing_Page_SEO-1536x806.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Codex_Landing_Page_SEO-2048x1075.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/Codex_Landing_Page_SEO-400x210.webp 400w\" sizes=\"auto, (max-width: 2400px) 100vw, 2400px\" \/><figcaption class=\"wp-element-caption\">Imagem apresentada na sec\u00e7\u00e3o de leituras relacionadas do an\u00fancio. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp\" alt=\"Imagem de destaque associada ao an\u00fancio do GPT-5.2-Codex\" class=\"wp-image-225\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/9\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\">Imagem apresentada na sec\u00e7\u00e3o de leituras relacionadas do an\u00fancio. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n<div class=\"references-section\">\n                <h2>Refer\u00eancias \/ Fontes<\/h2>\n                <ul class=\"references-list\"><li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-3-codex\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing GPT-5.3-Codex<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-the-codex-app\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing the Codex app<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gdpval\/\" target=\"_blank\" rel=\"noopener noreferrer\">GDPval<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/strengthening-cyber-resilience\/\" target=\"_blank\" rel=\"noopener noreferrer\">Strengthening cyber resilience<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gpt-5-3-codex-system-card\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPT-5.3-Codex System Card<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/updating-our-preparedness-framework\/\" target=\"_blank\" rel=\"noopener noreferrer\">Updating our preparedness framework<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/trusted-access-for-cyber\/\" target=\"_blank\" rel=\"noopener noreferrer\">Trusted Access for Cyber<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-aardvark\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing Aardvark<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/openai-cybersecurity-grant-program\/\" target=\"_blank\" rel=\"noopener noreferrer\">OpenAI Cybersecurity Grant Program<\/a><\/li><li><a href=\"https:\/\/vercel.com\/changelog\/summaries-of-cve-2025-59471-and-cve-2025-59472\" target=\"_blank\" rel=\"noopener noreferrer\">Summaries of CVE-2025-59471 and CVE-2025-59472<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-2-codex\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing GPT-5.2-Codex<\/a><\/li><\/ul>\n            <\/div>","protected":false},"excerpt":{"rendered":"<p>O GPT\u20115.3\u2011Codex n\u00e3o \u00e9 s\u00f3 melhor a programar: foi pensado para executar trabalho de ponta a ponta no computador, com intera\u00e7\u00e3o cont\u00ednua enquanto o agente pesquisa, usa ferramentas e entrega resultados.<\/p>\n","protected":false},"author":27,"featured_media":221,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[97],"tags":[100,102,98,101,99],"class_list":["post-226","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ia","tag-agentes","tag-ciberseguranca","tag-codex","tag-desenvolvimento-web","tag-openai"],"_links":{"self":[{"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/posts\/226","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/users\/27"}],"replies":[{"embeddable":true,"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/comments?post=226"}],"version-history":[{"count":0,"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/posts\/226\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/media\/221"}],"wp:attachment":[{"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/media?parent=226"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/categories?post=226"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/helloblog.io\/pt\/wp-json\/wp\/v2\/tags?post=226"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}