{"id":211,"date":"2026-02-05T20:33:15","date_gmt":"2026-02-05T19:33:15","guid":{"rendered":"https:\/\/helloblog.io\/da\/gpt-5-3-codex-codex-fra-kodeagent-til-fuld-computerkollega\/"},"modified":"2026-02-05T20:33:15","modified_gmt":"2026-02-05T19:33:15","slug":"gpt-5-3-codex-codex-fra-kodeagent-til-fuld-computerkollega","status":"publish","type":"post","link":"https:\/\/helloblog.io\/da\/gpt-5-3-codex-codex-fra-kodeagent-til-fuld-computerkollega\/","title":{"rendered":"GPT-5.3-Codex: Codex g\u00e5r fra kodeagent til fuld computerkollega"},"content":{"rendered":"\n<p>OpenAI har pr\u00e6senteret GPT\u20115.3\u2011Codex som den hidtil mest kapable <em>agentic<\/em> (agent-baserede) coding-model i Codex-familien. Det, der g\u00f8r lanceringen interessant for os som webudviklere, er ikke kun, at den skriver og reviewer kode bedre \u2013 men at den i stigende grad kan agere som en \u201ccomputer-kollega\u201d: researche, bruge v\u00e6rkt\u00f8jer, k\u00f8re kommandoer, f\u00f8lge op p\u00e5 fejl, og holde en opgave k\u00f8rende i lang tid uden at miste kontekst.<\/p>\n\n\n\n<p>If\u00f8lge OpenAI kombinerer GPT\u20115.3\u2011Codex frontier coding-performance fra GPT\u20115.2\u2011Codex med r\u00e6sonnering og professionel viden fra GPT\u20115.2 i \u00e9n model \u2013 og den k\u00f8rer samtidig <strong>25% hurtigere<\/strong>. Det g\u00f8r en forskel i praksis, fordi lange agent-forl\u00f8b ofte er begr\u00e6nset af latency og interaktionsomkostning mere end \u201cr\u00e5 IQ\u201d.<\/p>\n\n\n\n<p>En ekstra detalje, der skiller sig ud: GPT\u20115.3\u2011Codex er den f\u00f8rste model, OpenAI beskriver som v\u00e6rende med til at skabe sig selv. Codex-teamet brugte tidlige versioner til at debugge tr\u00e6ningen, h\u00e5ndtere deployment og diagnosticere test- og evalueringsresultater. Med andre ord: agenten blev et aktiv i sin egen udviklingspipeline.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Frontier agentic capabilities: hvorfor benchmark-snakken faktisk betyder noget<\/h2>\n\n\n\n<p>OpenAI fremh\u00e6ver is\u00e6r fire benchmarks til at m\u00e5le coding, agentic og real-world evner: <strong>SWE\u2011Bench Pro<\/strong>, <strong>Terminal\u2011Bench<\/strong>, <strong>OSWorld<\/strong> og <strong>GDPval<\/strong>. Pointen er ikke bare \u201ch\u00f8jere score\u201d, men at modellen ser ud til at v\u00e6re mere alsidig p\u00e5 tv\u00e6rs af software engineering, terminal-arbejde og almindelige computeropgaver.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Coding: SWE\u2011Bench Pro og Terminal\u2011Bench 2.0<\/h3>\n\n\n\n<p>P\u00e5 <em>SWE\u2011Bench Pro<\/em> s\u00e6tter GPT\u20115.3\u2011Codex if\u00f8lge OpenAI en ny industri-h\u00f8j. SWE\u2011Bench Pro er t\u00e6nkt som en mere robust og industrirelevant m\u00e5ling end SWE\u2011bench Verified: hvor Verified kun tester Python, sp\u00e6nder Pro over <strong>fire sprog<\/strong>, og den er designet til at v\u00e6re mere modstandsdygtig over for contamination (at en model har set opgaverne eller l\u00f8sningerne f\u00f8r).<\/p>\n\n\n\n<p>Derudover overg\u00e5r den tidligere state-of-the-art p\u00e5 <strong>Terminal\u2011Bench 2.0<\/strong>, som specifikt m\u00e5ler de terminalf\u00e6rdigheder en coding-agent har brug for (t\u00e6nk: navigere projekter, k\u00f8re kommandoer, h\u00e5ndtere output og iterere). En detalje OpenAI selv fremh\u00e6ver: GPT\u20115.3\u2011Codex klarer resultaterne med <strong>f\u00e6rre tokens<\/strong> end tidligere modeller, hvilket i praksis kan betyde, at du f\u00e5r mere \u201cbyggearbejde\u201d for samme interaktionsbudget.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Webudvikling: lange autonome forl\u00f8b og bedre defaults<\/h3>\n\n\n\n<p>Der er ogs\u00e5 et tydeligt webudviklingsspor i lanceringen. OpenAI beskriver en kombination af (1) frontier coding-evner, (2) bedre \u00e6stetik og (3) compaction (komprimering af adf\u00e6rd\/evner i modellen) som \u00e5rsag til, at GPT\u20115.3\u2011Codex kan bygge mere komplette apps og spil fra bunden over flere dage.<\/p>\n\n\n\n<p>For at teste netop webdev + long-running agentic kapacitet bad de modellen om at bygge to spil: en version 2 af et racing game (kendt fra Codex app-lanceringen) og et dykker-spil. De brugte en \u201cdevelop web game\u201d-skill (en specialiseret evne\/arbejdsgang i Codex) og nogle forudvalgte, generiske follow-up prompts som fx \u201cfix the bug\u201d eller \u201cimprove the game\u201d. Modellen itererede derefter autonomt over <strong>millioner af tokens<\/strong>.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Racing game: flere racers, <strong>otte maps<\/strong>, og items der aktiveres med space bar. Spil det her: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/racing_v2.html<\/li>\n\n\n<li>Diving game: udforsk rev, saml dem for at fuldf\u00f8re din fish codex, og styr ilt, tryk og hazards. Spil det her: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/diving_game.html<\/li>\n\n<\/ul>\n\n\n\n<p>I mere hverdagsn\u00e6re webopgaver p\u00e5st\u00e5r OpenAI ogs\u00e5, at GPT\u20115.3\u2011Codex bedre forst\u00e5r intentionen bag prompts, n\u00e5r du beder om \u201cdagligdags websites\u201d. Under-specificerede prompts ender oftere med sider, der har mere funktionalitet og mere fornuftige defaults \u2013 alts\u00e5 et bedre udgangspunkt, f\u00f8r du begynder at finpudse.<\/p>\n\n\n\n<p>De giver et konkret eksempel med to landing pages, hvor GPT\u20115.3\u2011Codex bl.a. (a) viste en \u00e5rsplan som en nedsat m\u00e5nedspris, s\u00e5 rabatten fremstod bevidst og tydelig, frem for blot at gange en \u00e5rspris ud, og (b) lavede en testimonial carousel der auto-transitioner og indeholder <strong>tre<\/strong> forskellige citater i stedet for \u00e9t. Det er pr\u00e6cis den slags \u201cprodukt-f\u00e6rdige\u201d detaljer, som ellers typisk f\u00f8rst kommer i en anden eller tredje iteration, hvis man starter fra en mere r\u00e5 skabelon.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Beyond coding: hele software-livscyklussen (og mere)<\/h3>\n\n\n\n<p>OpenAIs framing er, at softwarefolk ikke kun genererer kode. Derfor er GPT\u20115.3\u2011Codex bygget til at st\u00f8tte arbejde p\u00e5 tv\u00e6rs af livscyklussen: debugging, deploying, monitoring, skrive PRDs, redigere copy, user research, tests, metrics osv. Og agentic-delen r\u00e6kker ud over software: fx at bygge slide decks eller analysere data i sheets.<\/p>\n\n\n\n<p>Her kobler de det til <strong>GDPval<\/strong>, en evaluering OpenAI lancerede i 2025, som m\u00e5ler performance p\u00e5 veldefinerede knowledge-work opgaver p\u00e5 tv\u00e6rs af <strong>44 professioner<\/strong>. OpenAI skriver, at GPT\u20115.3\u2011Codex \u2013 med custom skills p\u00e5 linje med dem, de brugte for tidligere GDPval-resultater \u2013 matcher GPT\u20115.2 p\u00e5 GDPval (alts\u00e5 videnarbejde), samtidig med at den l\u00f8fter agent- og coding-delen.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\">Eksempel: finansr\u00e5dgiver-opgave (prompt + kontekst)<\/h4>\n\n\n\n<p>Et af deres GDPval-eksempler er en opgave, hvor agenten skal agere finansr\u00e5dgiver i en wealth management-kontekst og lave en 10-slide PowerPoint til interne field advisors. M\u00e5let er at forklare, hvorfor man som fiduciary b\u00f8r frar\u00e5de at rulle certificates of deposits over i variable annuities, selvom tilbuddet kan virke tillokkende pga. markedsafkast og livslang m\u00e5nedlig udbetaling.<\/p>\n\n\n\n<p>Pr\u00e6sentationen skulle bl.a. d\u00e6kke:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Sammenligning af features mellem certificates of deposits og variable annuities med investor-advarsler (sourced af FINRA)<\/li>\n\n\n<li>Risk\/return-analyse og effekt p\u00e5 v\u00e6kst<\/li>\n\n\n<li>Forskelle i penalties mellem de to produkter<\/li>\n\n\n<li>Kontrast i risikotolerance og suitability (sourced af NAIC Best Interest Regulations)<\/li>\n\n\n<li>FINRA concerns\/issues<\/li>\n\n\n<li>NAIC issues\/regulations<\/li>\n\n<\/ul>\n\n\n\n<p>I opgaven bad de ogs\u00e5 agenten om at tage udgangspunkt i to konkrete webkilder:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>https:\/\/content.naic.org\/sites\/default\/files\/government-affairs-brief-annuity-suitability-best-interest-model.pdf<\/li>\n\n\n<li>https:\/\/www.finra.org\/investors\/insights\/high-yield-cds<\/li>\n\n<\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2560\" height=\"1337\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp\" alt=\"Sk\u00e6rmbillede af GPT-5.3-Codex' output til en finansr\u00e5dgiver-pr\u00e6sentation (GDPval-eksempel)\" class=\"wp-image-207\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp 2560w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-300x157.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1024x535.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-768x401.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1536x802.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-2048x1069.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-400x209.webp 400w\" sizes=\"auto, (max-width: 2560px) 100vw, 2560px\" \/><figcaption class=\"wp-element-caption\"><em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<p>En vigtig detalje i GDPval-setup\u2019et: OpenAI skriver, at hver opgave er designet af en erfaren fagperson og afspejler reelt videnarbejde i det p\u00e5g\u00e6ldende job.<\/p>\n\n\n\n<p>P\u00e5 <strong>OSWorld<\/strong> (agentic computer-use benchmark i et visuelt desktop-milj\u00f8) skriver OpenAI, at GPT\u20115.3\u2011Codex demonstrerer langt st\u00e6rkere computer-use evner end tidligere GPT-modeller. De n\u00e6vner ogs\u00e5 OSWorld-Verified som et regime, hvor modeller bruger vision til at l\u00f8se varierede computeropgaver, og at mennesker scorer omkring 72%.<\/p>\n\n\n\n<p>Samlet er budskabet: GPT\u20115.3\u2011Codex er ikke kun bedre til enkelte delopgaver, men bev\u00e6ger sig mod en mere generel agent, der kan r\u00e6sonnere, bygge og eksekvere p\u00e5 tv\u00e6rs af \u201crigtigt arbejde\u201d p\u00e5 en computer.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">En interaktiv samarbejdspartner: styring mens agenten arbejder<\/h2>\n\n\n\n<p>N\u00e5r agenters kapacitet vokser, flytter flaskehalsen sig ofte fra \u201ckan modellen?\u201d til \u201ckan vi som mennesker styre og supervisere effektivt?\u201d OpenAI positionerer Codex app\u2019en som svaret p\u00e5 den udfordring \u2013 og med GPT\u20115.3\u2011Codex bliver interaktionen mere l\u00f8bende.<\/p>\n\n\n\n<p>I stedet for at vente p\u00e5 et endeligt resultat, f\u00e5r du if\u00f8lge OpenAI hyppige statusopdateringer, s\u00e5 du kan f\u00f8lge n\u00f8glebeslutninger og fremdrift. Du kan stille sp\u00f8rgsm\u00e5l, diskutere tilgang og styre retningen undervejs. Modellen forklarer, hvad den g\u00f8r, responderer p\u00e5 feedback og holder dig i loopet fra start til slut.<\/p>\n\n\n\n<p>Hvis du vil sl\u00e5 den adf\u00e6rd til i app\u2019en, peger OpenAI p\u00e5 denne indstilling: <strong>Settings > General > Follow-up behavior<\/strong> (id\u00e9en er at tillade \u201csteering\u201d under arbejdet).<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">S\u00e5dan brugte OpenAI Codex til at tr\u00e6ne og deploye GPT\u20115.3\u2011Codex<\/h2>\n\n\n\n<p>OpenAI beskriver de seneste Codex-forbedringer som resultatet af forskningsprojekter, der har k\u00f8rt i m\u00e5neder eller \u00e5r \u2013 men som nu bliver accelereret af Codex selv. De skriver direkte, at mange forskere og ingeni\u00f8rer oplever deres job som fundamentalt anderledes end for bare to m\u00e5neder siden, fordi tidlige versioner af GPT\u20115.3\u2011Codex allerede kunne bidrage til at forbedre tr\u00e6ningen og st\u00f8tte deployment af senere versioner.<\/p>\n\n\n\n<p>De understreger ogs\u00e5, at Codex er brugbart p\u00e5 s\u00e5 mange opgavetyper, at det er sv\u00e6rt at lave en udt\u00f8mmende liste. Men de giver en r\u00e6kke konkrete eksempler, som er ret genkendelige, hvis du selv har fors\u00f8gt at operationalisere en st\u00f8rre AI- eller infra-release.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Research: overv\u00e5gning, debugging og adf\u00e6rdsanalyse gennem tr\u00e6ningsl\u00f8b<\/h3>\n\n\n\n<p>Research-teamet brugte Codex til at overv\u00e5ge og debugge training runs for releaset. Men if\u00f8lge OpenAI var gevinsten ikke kun at l\u00f8se infra-bugs: Codex hjalp med at spore m\u00f8nstre gennem hele tr\u00e6ningsforl\u00f8bet, leverede dyb analyse af interaction quality, foreslog fixes, og byggede rige applikationer s\u00e5 menneskelige forskere mere pr\u00e6cist kunne se, hvordan modellens adf\u00e6rd afveg fra tidligere modeller.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Engineering: harness-optimering, edge cases og cache-problemer<\/h3>\n\n\n\n<p>Engineering-teamet brugte Codex til at optimere og tilpasse harness\u2019et (test- og evalueringsharness\/infrastruktur) til GPT\u20115.3\u2011Codex. Da de begyndte at se m\u00e6rkelige edge cases, brugte teammedlemmer Codex til at identificere context rendering-bugs og finde root cause til lave cache hit rates.<\/p>\n\n\n\n<p>OpenAI skriver ogs\u00e5, at GPT\u20115.3\u2011Codex fortsat hj\u00e6lper under launch ved dynamisk at skalere GPU-clusters, s\u00e5 de kan h\u00e5ndtere traffic surges og holde latency stabil.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Alpha: regex-klassifikatorer over session logs og produktivitetsm\u00e5linger<\/h3>\n\n\n\n<p>Under alpha-test ville en forsker forst\u00e5, hvor meget ekstra arbejde GPT\u20115.3\u2011Codex fik lavet per turn, og hvad produktivitetsforskellen var. If\u00f8lge OpenAI foreslog modellen nogle simple regex-klassifikatorer til at estimere:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Frekvens af clarifications (opklarende sp\u00f8rgsm\u00e5l)<\/li>\n\n\n<li>Positive user responses<\/li>\n\n\n<li>Negative user responses<\/li>\n\n\n<li>Fremdrift p\u00e5 opgaven<\/li>\n\n<\/ul>\n\n\n\n<p>Derefter k\u00f8rte den analyserne skalerbart over alle session logs og producerede en rapport med konklusioner. Observationen var, at folk, der byggede med Codex, var mere tilfredse, fordi agenten bedre forstod deres intent og gjorde mere fremdrift per turn \u2013 med f\u00e6rre opklarende sp\u00f8rgsm\u00e5l.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Data science: nye pipelines og rigere visualiseringer end standard dashboards<\/h3>\n\n\n\n<p>OpenAI n\u00e6vner ogs\u00e5, at fordi GPT\u20115.3\u2011Codex adskilte sig markant fra sine forg\u00e6ngere, viste alpha-data en r\u00e6kke us\u00e6dvanlige og kontraintuitive resultater. En data scientist arbejdede sammen med GPT\u20115.3\u2011Codex for at bygge nye data pipelines og visualisere resultaterne langt rigere, end deres standard dashboarding-v\u00e6rkt\u00f8jer tillod. Resultaterne blev co-analyseret med Codex, som kondenserede n\u00f8gleindsigter fra tusindvis af datapunkter p\u00e5 under tre minutter.<\/p>\n\n\n\n<p>Samlet set er OpenAIs pointe, at de nye egenskaber ikke kun er \u201cnice demos\u201d, men gav en m\u00e6rkbar acceleration p\u00e5 tv\u00e6rs af research, engineering og produktteams.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Cybersikkerhed: High capability, s\u00e5rbarheder og en strammere safety stack<\/h2>\n\n\n\n<p>OpenAI fremh\u00e6ver, at de over de seneste m\u00e5neder har set tydelige forbedringer p\u00e5 cybersecurity-opgaver, til gavn for b\u00e5de udviklere og security-professionals. Samtidig har de forberedt \u201cstrengthened cyber safeguards\u201d for at st\u00f8tte defensiv brug og robusthed i \u00f8kosystemet.<\/p>\n\n\n\n<p>GPT\u20115.3\u2011Codex er \u2013 if\u00f8lge OpenAI \u2013 den f\u00f8rste model, de klassificerer som <strong>High capability<\/strong> p\u00e5 cybersecurity-relaterede opgaver under deres <strong>Preparedness Framework<\/strong>, og den f\u00f8rste, de direkte har tr\u00e6net til at identificere software-vulnerabilities. De skriver ogs\u00e5, at de ikke har endegyldigt bevis for, at modellen kan automatisere cyber attacks end-to-end, men at de anl\u00e6gger en forsigtighedstilgang og deployer deres mest omfattende cybersecurity safety stack til dato.<\/p>\n\n\n\n<p>De n\u00e6vner, at mitigations inkluderer:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Safety training<\/li>\n\n\n<li>Automated monitoring<\/li>\n\n\n<li>Trusted access for advanced capabilities<\/li>\n\n\n<li>Enforcement pipelines inklusive threat intelligence<\/li>\n\n<\/ul>\n\n\n\n<p>Fordi cybersikkerhed er dual-use, beskriver OpenAI en evidensbaseret, iterativ tilgang: acceler\u00e9r defenders\u2019 evne til at finde og fixe s\u00e5rbarheder, men g\u00f8r misbrug sv\u00e6rere. Som del af det lancerer de <strong>Trusted Access for Cyber<\/strong>, et pilotprogram der skal accelerere cyber defense research.<\/p>\n\n\n\n<p>Derudover investerer de i \u00f8kosystem-safeguards, fx ved at udvide private beta af <strong>Aardvark<\/strong>, deres security research agent, som f\u00f8rste offering i en suite af Codex Security-produkter og v\u00e6rkt\u00f8jer. De n\u00e6vner ogs\u00e5 partnerskaber med open-source maintainers om gratis codebase scanning for udbredte projekter som <strong>Next.js<\/strong>, hvor en security researcher brugte Codex til at finde s\u00e5rbarheder, der blev disclosed her: https:\/\/vercel.com\/changelog\/summaries-of-cve-2025-59471-and-cve-2025-59472.<\/p>\n\n\n\n<p>Til sidst bygger de videre p\u00e5 deres $1M Cybersecurity Grant Program fra 2023 ved at committe <strong>$10M i API credits<\/strong> til at accelerere cyber defense med deres mest kapable modeller \u2013 is\u00e6r for open source og kritisk infrastruktur. Organisationer, der arbejder i god tro med security research, kan ans\u00f8ge om API credits og support via deres Cybersecurity Grant Program: https:\/\/openai.com\/index\/openai-cybersecurity-grant-program\/.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Tilg\u00e6ngelighed og praktiske detaljer<\/h2>\n\n\n\n<p>GPT\u20115.3\u2011Codex er tilg\u00e6ngelig p\u00e5 betalte ChatGPT-planer, alle de steder du kan bruge Codex: <strong>app, CLI, IDE extension og web<\/strong>. OpenAI skriver, at de arbejder p\u00e5 at enable API access \u201csnart\u201d, men med fokus p\u00e5 sikker aktivering.<\/p>\n\n\n\n<p>De understreger ogs\u00e5, at Codex-brugere nu f\u00e5r GPT\u20115.3\u2011Codex k\u00f8rt <strong>25% hurtigere<\/strong> pga. forbedringer i deres infrastruktur og inference stack, hvilket giver hurtigere interaktion og hurtigere resultater.<\/p>\n\n\n\n<p>Hardwarem\u00e6ssigt skriver OpenAI, at GPT\u20115.3\u2011Codex blev co-designet til, tr\u00e6net med og served p\u00e5 <strong>NVIDIA GB200 NVL72<\/strong>-systemer, og de takker NVIDIA for partnerskabet.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Hvad er n\u00e6ste skridt (if\u00f8lge OpenAI)?<\/h2>\n\n\n\n<p>OpenAI positionerer GPT\u20115.3\u2011Codex som et skridt fra \u201cat skrive kode\u201d til \u201cat bruge kode som et v\u00e6rkt\u00f8j til at operere en computer\u201d og dermed l\u00f8se arbejde end-to-end. Ved at skubbe gr\u00e6nsen for, hvad en coding agent kan, \u00e5bner de if\u00f8lge deres egen fort\u00e6lling for en bredere klasse af knowledge work: bygge og deploye software, researche, analysere og eksekvere komplekse opgaver.<\/p>\n\n\n\n<p>Det er ogs\u00e5 en interessant re-framing af Codex\u2019 m\u00e5l: det, der startede som en satsning p\u00e5 at v\u00e6re den bedste coding agent, bliver nu pr\u00e6senteret som fundamentet for en mere generel computer-samarbejdspartner, der udvider b\u00e5de hvem der kan bygge, og hvad der kan bygges.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Appendix: n\u00f8glebenchmarks (xhigh) samlet<\/h2>\n\n\n\n<p>OpenAI har ogs\u00e5 publiceret en tabel over udvalgte evalueringer. Alle evalueringer i blogindl\u00e6gget blev k\u00f8rt p\u00e5 GPT\u20115.3\u2011Codex med <strong>xhigh reasoning effort<\/strong>.<\/p>\n\n\n\n<div class=\"wp-block-kevinbatdorf-code-block-pro\" data-code-block-pro-font-family=\"Code-Pro-JetBrains-Mono\" style=\"font-size:.875rem;font-family:Code-Pro-JetBrains-Mono,ui-monospace,SFMono-Regular,Menlo,Monaco,Consolas,monospace;line-height:1.25rem;--cbp-tab-width:2;tab-size:var(--cbp-tab-width, 2)\"><span style=\"display:block;padding:16px 0 0 16px;margin-bottom:-1px;width:100%;text-align:left;background-color:#24292e\"><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"54\" height=\"14\" viewBox=\"0 0 54 14\"><g fill=\"none\" fill-rule=\"evenodd\" transform=\"translate(1 1)\"><circle cx=\"6\" cy=\"6\" r=\"6\" fill=\"#FF5F56\" stroke=\"#E0443E\" stroke-width=\".5\"><\/circle><circle cx=\"26\" cy=\"6\" r=\"6\" fill=\"#FFBD2E\" stroke=\"#DEA123\" stroke-width=\".5\"><\/circle><circle cx=\"46\" cy=\"6\" r=\"6\" fill=\"#27C93F\" stroke=\"#1AAB29\" stroke-width=\".5\"><\/circle><\/g><\/svg><\/span><span role=\"button\" tabindex=\"0\" style=\"color:#e1e4e8;display:none\" aria-label=\"Copy\" class=\"code-block-pro-copy-button\"><pre class=\"code-block-pro-copy-button-pre\" aria-hidden=\"true\"><textarea class=\"code-block-pro-copy-button-textarea\" tabindex=\"-1\" aria-hidden=\"true\" readonly>SWE-Bench Pro (Public)\n- GPT-5.3-Codex (xhigh): 56.8%\n- GPT-5.2-Codex (xhigh): 56.4%\n- GPT-5.2 (xhigh): 55.6%\n\nTerminal-Bench 2.0\n- GPT-5.3-Codex (xhigh): 77.3%\n- GPT-5.2-Codex (xhigh): 64.0%\n- GPT-5.2 (xhigh): 62.2%\n\nOSWorld-Verified\n- GPT-5.3-Codex (xhigh): 64.7%\n- GPT-5.2-Codex (xhigh): 38.2%\n- GPT-5.2 (xhigh): 37.9%\n\nGDPval (wins or ties)\n- GPT-5.3-Codex (xhigh): 70.9%\n- GPT-5.2-Codex (xhigh): -\n- GPT-5.2 (xhigh): 70.9% (high)\n\nCybersecurity Capture The Flag Challenges\n- GPT-5.3-Codex (xhigh): 77.6%\n- GPT-5.2-Codex (xhigh): 67.4%\n- GPT-5.2 (xhigh): 67.7%\n\nSWE-Lancer IC Diamond\n- GPT-5.3-Codex (xhigh): 81.4%\n- GPT-5.2-Codex (xhigh): 76.0%\n- GPT-5.2 (xhigh): 74.6%\n<\/textarea><\/pre><svg xmlns=\"http:\/\/www.w3.org\/2000\/svg\" style=\"width:24px;height:24px\" fill=\"none\" viewBox=\"0 0 24 24\" stroke=\"currentColor\" stroke-width=\"2\"><path class=\"with-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2m-6 9l2 2 4-4\"><\/path><path class=\"without-check\" stroke-linecap=\"round\" stroke-linejoin=\"round\" d=\"M9 5H7a2 2 0 00-2 2v12a2 2 0 002 2h10a2 2 0 002-2V7a2 2 0 00-2-2h-2M9 5a2 2 0 002 2h2a2 2 0 002-2M9 5a2 2 0 012-2h2a2 2 0 012 2\"><\/path><\/svg><\/span><pre class=\"shiki github-dark\" style=\"background-color:#24292e;color:#e1e4e8\" tabindex=\"0\"><code><span class=\"line\"><span>SWE-Bench Pro (Public)<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.3-Codex (xhigh): 56.8%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2-Codex (xhigh): 56.4%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2 (xhigh): 55.6%<\/span><\/span>\n<span class=\"line\"><span><\/span><\/span>\n<span class=\"line\"><span>Terminal-Bench 2.0<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.3-Codex (xhigh): 77.3%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2-Codex (xhigh): 64.0%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2 (xhigh): 62.2%<\/span><\/span>\n<span class=\"line\"><span><\/span><\/span>\n<span class=\"line\"><span>OSWorld-Verified<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.3-Codex (xhigh): 64.7%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2-Codex (xhigh): 38.2%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2 (xhigh): 37.9%<\/span><\/span>\n<span class=\"line\"><span><\/span><\/span>\n<span class=\"line\"><span>GDPval (wins or ties)<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.3-Codex (xhigh): 70.9%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2-Codex (xhigh): -<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2 (xhigh): 70.9% (high)<\/span><\/span>\n<span class=\"line\"><span><\/span><\/span>\n<span class=\"line\"><span>Cybersecurity Capture The Flag Challenges<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.3-Codex (xhigh): 77.6%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2-Codex (xhigh): 67.4%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2 (xhigh): 67.7%<\/span><\/span>\n<span class=\"line\"><span><\/span><\/span>\n<span class=\"line\"><span>SWE-Lancer IC Diamond<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.3-Codex (xhigh): 81.4%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2-Codex (xhigh): 76.0%<\/span><\/span>\n<span class=\"line\"><span>- GPT-5.2 (xhigh): 74.6%<\/span><\/span><\/code><\/pre><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Codex app: download-link fra OpenAI<\/h2>\n\n\n<a href=\"https:\/\/persistent.oaistatic.com\/codex-app-prod\/Codex.dmg\" class=\"download-card\" download>\n                <span class=\"download-icon\"><i class=\"fa-duotone fa-file-arrow-down\"><\/i><\/span>\n                <span class=\"download-info\">\n                    <span class=\"download-title\">Codex app (macOS .dmg)<\/span>\n                    <span class=\"download-meta\"><span class=\"download-filename\">Codex.dmg<\/span><\/span>\n                <\/span>\n                <span class=\"download-action\"><i class=\"fa-duotone fa-arrow-down-to-line\"><\/i><\/span>\n            <\/a>\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art.webp\" alt=\"Illustration brugt til GPT-5.3-Codex System Card\" class=\"wp-image-208\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/System_Card_Art-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\"><em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2400\" height=\"1260\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Codex_Landing_Page_SEO.webp\" alt=\"Codex app landing page illustration (SEO-billede)\" class=\"wp-image-209\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Codex_Landing_Page_SEO.webp 2400w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Codex_Landing_Page_SEO-300x158.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Codex_Landing_Page_SEO-1024x538.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Codex_Landing_Page_SEO-768x403.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Codex_Landing_Page_SEO-1536x806.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Codex_Landing_Page_SEO-2048x1075.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/Codex_Landing_Page_SEO-400x210.webp 400w\" sizes=\"auto, (max-width: 2400px) 100vw, 2400px\" \/><figcaption class=\"wp-element-caption\"><em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp\" alt=\"Artwork for Introducing GPT-5.2-Codex\" class=\"wp-image-210\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/14\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\"><em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n<div class=\"references-section\">\n                <h2>Referencer \/ Kilder<\/h2>\n                <ul class=\"references-list\"><li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-3-codex\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing GPT-5.3-Codex<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gpt-5-3-codex-system-card\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPT-5.3-Codex System Card<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/strengthening-cyber-resilience\/\" target=\"_blank\" rel=\"noopener noreferrer\">Strengthening cyber resilience<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/updating-our-preparedness-framework\/\" target=\"_blank\" rel=\"noopener noreferrer\">Updating our preparedness framework<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/trusted-access-for-cyber\/\" target=\"_blank\" rel=\"noopener noreferrer\">Trusted access for cyber<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-aardvark\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing Aardvark<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/openai-cybersecurity-grant-program\/\" target=\"_blank\" rel=\"noopener noreferrer\">OpenAI Cybersecurity Grant Program<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gdpval\/\" target=\"_blank\" rel=\"noopener noreferrer\">GDPval<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-the-codex-app\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing the Codex app<\/a><\/li><li><a href=\"https:\/\/vercel.com\/changelog\/summaries-of-cve-2025-59471-and-cve-2025-59472\" target=\"_blank\" rel=\"noopener noreferrer\">Summaries of CVE-2025-59471 and CVE-2025-59472<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-2-codex\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing GPT-5.2-Codex<\/a><\/li><\/ul>\n            <\/div>","protected":false},"excerpt":{"rendered":"<p>OpenAI har lanceret GPT-5.3-Codex, som b\u00e5de scorer h\u00f8jere p\u00e5 centrale agent-benchmarks og samtidig er hurtigere i Codex. Det peger p\u00e5 et skifte: fra \u201cskriv kode for mig\u201d til \u201cf\u00e5 arbejdet gjort p\u00e5 computeren \u2013 end-to-end\u201d.<\/p>\n","protected":false},"author":64,"featured_media":206,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[102],"tags":[105,106,103,104,11],"class_list":["post-211","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai","tag-agentic-ai","tag-benchmarking","tag-codex","tag-gpt-5-3","tag-sikkerhed"],"_links":{"self":[{"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/posts\/211","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/users\/64"}],"replies":[{"embeddable":true,"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/comments?post=211"}],"version-history":[{"count":0,"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/posts\/211\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/media\/206"}],"wp:attachment":[{"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/media?parent=211"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/categories?post=211"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/helloblog.io\/da\/wp-json\/wp\/v2\/tags?post=211"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}