{"id":215,"date":"2026-02-05T20:33:22","date_gmt":"2026-02-05T19:33:22","guid":{"rendered":"https:\/\/helloblog.io\/de\/gpt-5-3-codex-codex-vom-coding-agent-zum-computer-kollegen\/"},"modified":"2026-02-05T20:33:22","modified_gmt":"2026-02-05T19:33:22","slug":"gpt-5-3-codex-codex-vom-coding-agent-zum-computer-kollegen","status":"publish","type":"post","link":"https:\/\/helloblog.io\/de\/gpt-5-3-codex-codex-vom-coding-agent-zum-computer-kollegen\/","title":{"rendered":"GPT-5.3-Codex: Wenn Codex vom Coding-Agent zum Computer-Kollegen wird"},"content":{"rendered":"\n<p>OpenAI hat am 5. Februar 2026 <strong>GPT\u20115.3\u2011Codex<\/strong> vorgestellt \u2013 ein Modell, das Codex deutlich breiter aufstellt als \u201enur\u201c Code schreiben und Review machen. Die Ansage ist klar: Codex soll nicht mehr blo\u00df ein Coding\u2011Agent sein, sondern ein Agent, der <em>nahezu alles<\/em> erledigen kann, was Entwickler:innen und andere Professionals am Computer tun \u2013 inklusive Recherche, Tool\u2011Nutzung und komplexer Ausf\u00fchrung \u00fcber l\u00e4ngere Zeitr\u00e4ume.<\/p>\n\n\n\n<p>Technisch spannend ist die Kombination aus zwei Linien: GPT\u20115.3\u2011Codex bringt sowohl die Frontier\u2011Coding\u2011Performance aus der GPT\u20115.2\u2011Codex\u2011Richtung als auch die Reasoning\u2011 und Professional\u2011Knowledge\u2011St\u00e4rken von GPT\u20115.2 zusammen \u2013 und l\u00e4uft laut OpenAI dabei <strong>25% schneller<\/strong>. Das ist gerade dann relevant, wenn Agenten \u00fcber viele Schritte iterieren, Logfiles durchk\u00e4mmen, Tests anwerfen oder sich durch ein Projektverzeichnis und mehrere Tools arbeiten m\u00fcssen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Frontier-Agentic-Capabilities: Benchmarks, die mehr als nur \u201ekann Code\u201c messen<\/h2>\n\n\n\n<p>OpenAI positioniert GPT\u20115.3\u2011Codex als aktuell \u201ef\u00e4higstes agentisches Coding\u2011Modell\u201c und verweist auf starke Ergebnisse in vier Benchmarks, die sie intern nutzen, um Coding\u2011, Agentic\u2011 und Real\u2011World\u2011F\u00e4higkeiten einzuordnen: <strong>SWE\u2011Bench Pro<\/strong>, <strong>Terminal\u2011Bench<\/strong>, <strong>OSWorld<\/strong> und <strong>GDPval<\/strong>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Coding: SWE\u2011Bench Pro und Terminal\u2011Bench 2.0<\/h3>\n\n\n\n<p>Bei <strong>SWE\u2011Bench Pro<\/strong> spricht OpenAI von State\u2011of\u2011the\u2011Art. Der wichtige Kontext: W\u00e4hrend \u201eSWE\u2011bench Verified\u201c nur Python testet, deckt <strong>SWE\u2011Bench Pro vier Sprachen<\/strong> ab und soll gleichzeitig <strong>kontaminationsresistenter<\/strong>, herausfordernder, diverser und industrierelevanter sein. F\u00fcr uns als Web\u2011Dev\u2011Community ist das ein entscheidender Punkt: Es geht nicht um synthetische Puzzle\u2011Aufgaben, sondern um n\u00e4her an der Realit\u00e4t liegende Software\u2011Engineering\u2011Arbeit.<\/p>\n\n\n\n<p>Zus\u00e4tzlich hebt OpenAI <strong>Terminal\u2011Bench 2.0<\/strong> hervor \u2013 ein Benchmark, der gezielt Terminal\u2011Skills misst, die ein Agent wie Codex in der Praxis braucht (z. B. Navigieren, Ausf\u00fchren, Interpretieren, Fixen). Bemerkenswert: GPT\u20115.3\u2011Codex erreicht diese Werte laut OpenAI <strong>mit weniger Tokens als fr\u00fchere Modelle<\/strong>, was in der Praxis bedeutet, dass mehr \u201eBudget\u201c f\u00fcr tats\u00e4chliche Arbeit \u00fcbrig bleibt.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Webentwicklung: Langl\u00e4ufer-Aufgaben \u00fcber Millionen Tokens<\/h3>\n\n\n\n<p>F\u00fcr Webentwicklung und \u201elong\u2011running agentic capabilities\u201c hat OpenAI einen praxisn\u00e4heren Test gew\u00e4hlt: GPT\u20115.3\u2011Codex sollte <strong>zwei Browser\u2011Games<\/strong> bauen und \u00fcber l\u00e4ngere Zeit weiterentwickeln \u2013 mit einem vordefinierten Skill (\u201edevelop web game\u201c) und generischen Folgeprompts wie \u201efix the bug\u201c oder \u201eimprove the game\u201c. Das Modell iterierte dabei <strong>autonom \u00fcber Millionen Tokens<\/strong> und soll die Games \u00fcber Tage hinweg von Grund auf zu komplexen, funktionalen Apps ausgebaut haben \u2013 inklusive besserer \u00c4sthetik und Kompaktheit (\u201ecompaction\u201c).<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Racing Game v2: mehrere Fahrer, acht Maps und Items, die per Spacebar genutzt werden k\u00f6nnen. Spielbar unter: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/racing_v2.html<\/li>\n\n\n<li>Diving Game: Riffe erkunden, sammeln, um ein \u201eFish Codex\u201c zu vervollst\u00e4ndigen; gleichzeitig Sauerstoff, Druck und Gefahren managen. Spielbar unter: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/diving_game.html<\/li>\n\n<\/ul>\n\n\n\n<p>Au\u00dferdem claimt OpenAI, dass GPT\u20115.3\u2011Codex im Alltags\u2011Webdesign <strong>Absichten besser versteht<\/strong> als GPT\u20115.2\u2011Codex. Unter-spezifizierte Prompts sollen h\u00e4ufiger zu Seiten f\u00fchren, die sofort mehr sinnvolle Defaults mitbringen. Das Beispiel im Post: Bei einer Landing\u2011Page\u2011Aufgabe hat GPT\u20115.3\u2011Codex automatisch eine Jahresoption als rabattierten Monatsbetrag dargestellt (statt schlicht den Jahrestotalbetrag zu verteilen) und zus\u00e4tzlich ein automatisch rotierendes Testimonial\u2011Carousel mit <strong>drei unterschiedlichen Quotes<\/strong> erzeugt \u2013 also ein \u201eproduction\u2011ready\u201c wirkenderes Ergebnis ohne extra Prompting.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Beyond Coding: Wissenarbeit und \u201eComputer Use\u201c<\/h3>\n\n\n\n<p>Ein wichtiger Teil der Ank\u00fcndigung: GPT\u20115.3\u2011Codex soll nicht nur Engineers unterst\u00fctzen, sondern den gesamten Software\u2011Lifecycle abdecken \u2013 <strong>Debugging, Deploying, Monitoring, PRDs schreiben, Copy bearbeiten, User Research, Tests, Metrics<\/strong> und mehr. Und es endet nicht bei Software: Der Agent soll auch in klassischen Knowledge\u2011Work\u2011Artefakten helfen \u2013 von Slide\u2011Decks bis zu Spreadsheet\u2011Analysen.<\/p>\n\n\n\n<p>Hier taucht <strong>GDPval<\/strong> auf: eine 2025 ver\u00f6ffentlichte Evaluation, die die Performance auf gut spezifizierten Knowledge\u2011Work\u2011Tasks \u00fcber <strong>44 Berufe<\/strong> misst. OpenAI schreibt, GPT\u20115.3\u2011Codex zeige dort (mit Custom Skills wie in fr\u00fcheren GDPval\u2011Ergebnissen) starke Performance und <strong>matcht GPT\u20115.2<\/strong> in GDPval.<\/p>\n\n\n\n<p>Daneben ist <strong>OSWorld<\/strong> zentral: ein agentischer Computer\u2011Use\u2011Benchmark, bei dem der Agent Produktivit\u00e4tsaufgaben in einer visuellen Desktop\u2011Umgebung erledigen muss. OpenAI sagt, GPT\u20115.3\u2011Codex zeige dort <strong>deutlich st\u00e4rkere Computer\u2011Use\u2011F\u00e4higkeiten<\/strong> als fr\u00fchere GPT\u2011Modelle.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Ein interaktiver Kollaborateur: Arbeiten, w\u00e4hrend der Agent arbeitet<\/h2>\n\n\n\n<p>Mit leistungsf\u00e4higeren Agenten verschiebt sich das Problem laut OpenAI zunehmend: weniger \u201ekann der Agent das?\u201c, mehr \u201ewie gut kann ich mehrere Agenten parallel steuern und \u00fcberwachen?\u201c. Genau hier setzt die Codex\u2011App an \u2013 und GPT\u20115.3\u2011Codex soll das Interaktionsmodell nochmals verbessern.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Codex liefert <strong>h\u00e4ufigere Updates<\/strong>, damit du wichtige Entscheidungen und Fortschritt w\u00e4hrend der Ausf\u00fchrung nachvollziehen kannst.<\/li>\n\n\n<li>Statt nur auf ein finales Ergebnis zu warten, kannst du <strong>in Echtzeit<\/strong> eingreifen: Fragen stellen, Ans\u00e4tze diskutieren, Richtung \u00e4ndern.<\/li>\n\n\n<li>GPT\u20115.3\u2011Codex \u201espricht\u201c durch, was es tut, reagiert auf Feedback und h\u00e4lt dich von Anfang bis Ende auf dem Laufenden.<\/li>\n\n<\/ul>\n\n\n\n<p>Wichtiges Detail f\u00fcr die Praxis: Das \u201eSteering while the model works\u201c l\u00e4sst sich in der App aktivieren \u00fcber <strong>Settings > General > Follow-up behavior<\/strong>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Wie OpenAI Codex genutzt hat, um GPT\u20115.3\u2011Codex zu trainieren und zu deployen<\/h2>\n\n\n\n<p>Der bemerkenswerteste Teil der Story ist fast schon meta: GPT\u20115.3\u2011Codex ist laut OpenAI das <strong>erste Modell<\/strong>, das \u201einstrumental\u201c dabei war, <strong>sich selbst zu erschaffen<\/strong>. Das Codex\u2011Team nutzte fr\u00fche Versionen, um das eigene Training zu debuggen, Deployments zu managen sowie Testergebnisse und Evaluations zu diagnostizieren \u2013 und war laut OpenAI selbst \u00fcberrascht, wie stark Codex die eigene Entwicklung beschleunigt.<\/p>\n\n\n\n<p>OpenAI betont, dass die schnellen Verbesserungen Ergebnis von Forschungsprojekten sind, die \u00fcber Monate oder Jahre liefen \u2013 aber dass diese Projekte inzwischen durch Codex nochmals schneller vorankommen. Einige Teams beschreiben laut OpenAI, dass sich ihr Job heute fundamental von dem unterscheidet, was sie \u201evor zwei Monaten\u201c gemacht haben.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Konkrete Beispiele aus Research und Engineering<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Research: Codex wurde genutzt, um Trainingsl\u00e4ufe f\u00fcr dieses Release zu <strong>monitoren und zu debuggen<\/strong> \u2013 nicht nur Infrastrukturprobleme, sondern auch Muster \u00fcber den Trainingsverlauf hinweg.<\/li>\n\n\n<li>Research: Codex lieferte <strong>Deep\u2011Analysen zur Interaction Quality<\/strong>, schlug Fixes vor und baute reichhaltige Apps, um Unterschiede im Modellverhalten gegen\u00fcber Vorg\u00e4ngern pr\u00e4zise sichtbar zu machen.<\/li>\n\n\n<li>Engineering: Codex half, den <strong>Harness<\/strong> (Test-\/Ausf\u00fchrungsrahmen) f\u00fcr GPT\u20115.3\u2011Codex zu optimieren und anzupassen.<\/li>\n\n\n<li>Engineering: Bei ungew\u00f6hnlichen Edge\u2011Cases wurden mit Codex <strong>Context\u2011Rendering\u2011Bugs<\/strong> identifiziert sowie die Ursache f\u00fcr <strong>niedrige Cache\u2011Hit\u2011Rates<\/strong> analysiert.<\/li>\n\n\n<li>Launch-Betrieb: GPT\u20115.3\u2011Codex hilft w\u00e4hrend des Launches, <strong>GPU\u2011Cluster dynamisch zu skalieren<\/strong>, auf Traffic\u2011Spitzen zu reagieren und die <strong>Latenz stabil<\/strong> zu halten.<\/li>\n\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Alpha-Testing: Produktivit\u00e4t messbar machen<\/h3>\n\n\n\n<p>Im Alpha\u2011Testing wollte ein Researcher quantifizieren, wie viel zus\u00e4tzliche Arbeit GPT\u20115.3\u2011Codex \u201epro Turn\u201c erledigt \u2013 und wie sich Produktivit\u00e4t ver\u00e4ndert. Laut OpenAI hat GPT\u20115.3\u2011Codex daf\u00fcr mehrere einfache <strong>Regex\u2011Classifier<\/strong> entworfen, um in Session\u2011Logs u. a. Folgendes zu sch\u00e4tzen: H\u00e4ufigkeit von Klarstellungen, positive\/negative User\u2011Antworten und Task\u2011Progress. Diese Classifier wurden dann skalierbar \u00fcber die Logs gefahren und als Report zusammengefasst.<\/p>\n\n\n\n<p>Die daraus gezogenen Beobachtungen: Teams, die mit Codex bauen, waren zufriedener, weil der Agent die Intent besser verstand, pro Turn mehr Fortschritt machte und <strong>weniger R\u00fcckfragen<\/strong> stellte.<\/p>\n\n\n\n<p>Weil GPT\u20115.3\u2011Codex sich deutlich von den Vorg\u00e4ngern unterscheidet, gab es in den Alpha\u2011Daten laut OpenAI viele ungew\u00f6hnliche, kontraintuitive Ergebnisse. Eine Data Scientist arbeitete mit GPT\u20115.3\u2011Codex daran, <strong>neue Data Pipelines<\/strong> zu bauen und Resultate <strong>reichhaltiger zu visualisieren<\/strong> als es Standard\u2011Dashboarding hergab. Die Co\u2011Analyse mit Codex endete in einer kompakten Zusammenfassung zentraler Insights \u00fcber <strong>tausende Datenpunkte in unter drei Minuten<\/strong>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Cybersecurity: \u201eHigh capability\u201c und eine versch\u00e4rfte Safety-Stack-Strategie<\/h2>\n\n\n\n<p>OpenAI berichtet \u00fcber sp\u00fcrbare Performance\u2011Gewinne bei Cybersecurity\u2011Tasks in den letzten Monaten \u2013 relevant sowohl f\u00fcr Entwickler:innen als auch Security\u2011Teams. Parallel hat OpenAI laut Post an <strong>verst\u00e4rkten Cyber\u2011Safeguards<\/strong> gearbeitet, um defensive Nutzung zu unterst\u00fctzen und die Resilienz des \u00d6kosystems zu erh\u00f6hen.<\/p>\n\n\n\n<p>GPT\u20115.3\u2011Codex ist dabei ein Einschnitt: Es ist das <strong>erste Modell<\/strong>, das OpenAI unter dem <strong>Preparedness Framework<\/strong> als <strong>\u201eHigh capability\u201c<\/strong> f\u00fcr cybersecurity\u2011bezogene Aufgaben klassifiziert, und gleichzeitig das erste, das <strong>direkt darauf trainiert<\/strong> wurde, <strong>Software\u2011Vulnerabilities zu identifizieren<\/strong>.<\/p>\n\n\n\n<p>OpenAI schreibt auch sehr explizit: Man habe <strong>keinen definitiven Nachweis<\/strong>, dass das Modell Cyberangriffe end\u2011to\u2011end automatisieren kann \u2013 trotzdem f\u00e4hrt OpenAI einen <strong>vorsorglichen Ansatz<\/strong> und deployt die bisher umfassendste Cybersecurity\u2011Safety\u2011Stack\u2011Variante. Genannt werden:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Safety Training<\/li>\n\n\n<li>Automated Monitoring<\/li>\n\n\n<li>Trusted Access f\u00fcr fortgeschrittene Capabilities<\/li>\n\n\n<li>Enforcement Pipelines inklusive Threat Intelligence<\/li>\n\n<\/ul>\n\n\n\n<p>Weil Cybersecurity inh\u00e4rent Dual\u2011Use ist, will OpenAI evidenzbasiert und iterativ vorgehen: Defender schneller machen beim Finden und Fixen von Schwachstellen, Missbrauch aber bremsen. Dazu startet OpenAI <strong>Trusted Access for Cyber<\/strong> als Pilotprogramm, um Cyber\u2011Defense\u2011Research zu beschleunigen.<\/p>\n\n\n\n<p>Zus\u00e4tzlich investiert OpenAI in \u201eEcosystem Safeguards\u201c: Die private Beta von <strong>Aardvark<\/strong> (Security\u2011Research\u2011Agent) wird erweitert \u2013 als erstes Angebot in einer Suite von <strong>Codex Security<\/strong>\u2011Produkten und Tools. Au\u00dferdem nennt OpenAI Partnerschaften mit Open\u2011Source\u2011Maintainers, um <strong>kostenloses Codebase\u2011Scanning<\/strong> f\u00fcr weit verbreitete Projekte bereitzustellen, z. B. <strong>Next.js<\/strong>. Als Beleg wird ein Fall genannt, in dem ein Security\u2011Researcher mit Codex Schwachstellen fand, die laut Quelle letzte Woche disclosed wurden.<\/p>\n\n\n\n<p>Finanziell baut OpenAI zudem auf dem <strong>$1M Cybersecurity Grant Program<\/strong> (gestartet 2023) auf und commitet zus\u00e4tzlich <strong>$10M in API Credits<\/strong>, um Cyber\u2011Defense mit den f\u00e4higsten Modellen zu beschleunigen \u2013 besonders f\u00fcr Open Source und kritische Infrastruktursysteme. Organisationen, die \u201egood\u2011faith\u201c Security\u2011Research betreiben, k\u00f6nnen API Credits und Support \u00fcber das Cybersecurity\u2011Grant\u2011Programm beantragen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Verf\u00fcgbarkeit &#038; technische Details<\/h2>\n\n\n\n<p>GPT\u20115.3\u2011Codex ist laut OpenAI <strong>in bezahlten ChatGPT\u2011Pl\u00e4nen<\/strong> verf\u00fcgbar \u2013 \u00fcberall dort, wo man Codex nutzen kann: <strong>App, CLI, IDE\u2011Extension und Web<\/strong>. <strong>API Access<\/strong> ist noch nicht allgemein freigeschaltet; OpenAI schreibt, man arbeite daran, ihn \u201ebald\u201c sicher zu erm\u00f6glichen.<\/p>\n\n\n\n<p>Mit dem Update l\u00e4uft GPT\u20115.3\u2011Codex f\u00fcr Codex\u2011User <strong>25% schneller<\/strong>, begr\u00fcndet durch Verbesserungen in Infrastruktur und Inference\u2011Stack. Praktisch hei\u00dft das: schnellere Interaktionen und schnellere Ergebnisse \u2013 gerade bei agentischen Loops ein sp\u00fcrbarer Multiplikator.<\/p>\n\n\n\n<p>Hardwareseitig wurde GPT\u20115.3\u2011Codex laut OpenAI <strong>co\u2011designed<\/strong>, <strong>trainiert<\/strong> und <strong>serviert<\/strong> auf <strong>NVIDIA GB200 NVL72<\/strong>\u2011Systemen; OpenAI bedankt sich ausdr\u00fccklich f\u00fcr die Partnerschaft mit NVIDIA.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Was OpenAI als n\u00e4chsten Schritt sieht<\/h2>\n\n\n\n<p>OpenAI beschreibt die Richtung als klaren Shift: Mit GPT\u20115.3\u2011Codex geht Codex \u201ebeyond writing code\u201c \u2013 Code wird zum Tool, um den Computer zu bedienen und Arbeit <strong>end\u2011to\u2011end<\/strong> zu erledigen. Das soll nicht nur Software\u2011Build\u2011und\u2011Deploy\u2011Workflows verbessern, sondern auch eine breitere Klasse von Knowledge\u2011Work erschlie\u00dfen: recherchieren, analysieren, ausf\u00fchren \u2013 inklusive komplexer Aufgabenketten.<\/p>\n\n\n\n<p>Aus einem Projekt, das als \u201ebester Coding\u2011Agent\u201c gestartet ist, wird damit laut OpenAI die Grundlage f\u00fcr einen allgemeineren \u201eCollaborator\u201c am Computer \u2013 und erweitert sowohl, <em>wer<\/em> bauen kann, als auch, <em>was<\/em> mit Codex m\u00f6glich wird.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Appendix: Alle im Post genannten Benchmarkwerte (xhigh)<\/h2>\n\n\n\n<p>OpenAI listet im Anhang eine Tabelle mit Ergebnissen f\u00fcr drei Modelle. Alle Evaluations wurden laut Fu\u00dfnote mit <strong>xhigh reasoning effort<\/strong> f\u00fcr GPT\u20115.3\u2011Codex ausgef\u00fchrt.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>SWE\u2011Bench Pro (Public): GPT\u20115.3\u2011Codex (xhigh) 56.8% \u00b7 GPT\u20115.2\u2011Codex (xhigh) 56.4% \u00b7 GPT\u20115.2 (xhigh) 55.6%<\/li>\n\n\n<li>Terminal\u2011Bench 2.0: GPT\u20115.3\u2011Codex (xhigh) 77.3% \u00b7 GPT\u20115.2\u2011Codex (xhigh) 64.0% \u00b7 GPT\u20115.2 (xhigh) 62.2%<\/li>\n\n\n<li>OSWorld\u2011Verified: GPT\u20115.3\u2011Codex (xhigh) 64.7% \u00b7 GPT\u20115.2\u2011Codex (xhigh) 38.2% \u00b7 GPT\u20115.2 (xhigh) 37.9%<\/li>\n\n\n<li>GDPval (wins or ties): GPT\u20115.3\u2011Codex (xhigh) 70.9% \u00b7 GPT\u20115.2\u2011Codex (xhigh) \u2013 \u00b7 GPT\u20115.2 (xhigh) 70.9% (high)<\/li>\n\n\n<li>Cybersecurity Capture The Flag Challenges: GPT\u20115.3\u2011Codex (xhigh) 77.6% \u00b7 GPT\u20115.2\u2011Codex (xhigh) 67.4% \u00b7 GPT\u20115.2 (xhigh) 67.7%<\/li>\n\n\n<li>SWE\u2011Lancer IC Diamond: GPT\u20115.3\u2011Codex (xhigh) 81.4% \u00b7 GPT\u20115.2\u2011Codex (xhigh) 76.0% \u00b7 GPT\u20115.2 (xhigh) 74.6%<\/li>\n\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Codex-App: Direkt ausprobieren<\/h2>\n\n\n<a href=\"https:\/\/persistent.oaistatic.com\/codex-app-prod\/Codex.dmg\" class=\"download-card\" download>\n                <span class=\"download-icon\"><i class=\"fa-duotone fa-file-arrow-down\"><\/i><\/span>\n                <span class=\"download-info\">\n                    <span class=\"download-title\">Codex app (macOS) herunterladen<\/span>\n                    <span class=\"download-meta\"><span class=\"download-filename\">Codex.dmg<\/span><span class=\"download-size\">&#8211;<\/span><\/span>\n                <\/span>\n                <span class=\"download-action\"><i class=\"fa-duotone fa-arrow-down-to-line\"><\/i><\/span>\n            <\/a>\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2560\" height=\"1337\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp\" alt=\"Beispielausgabe von GPT\u20115.3\u2011Codex: Screenshot eines Slide-Decks aus einer GDPval-Aufgabe\" class=\"wp-image-211\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp 2560w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-300x157.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1024x535.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-768x401.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1536x802.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-2048x1069.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-400x209.webp 400w\" sizes=\"auto, (max-width: 2560px) 100vw, 2560px\" \/><figcaption class=\"wp-element-caption\">OpenAI zeigt als Beispiel eine von GPT\u20115.3\u2011Codex erstellte Pr\u00e4sentation im Kontext einer GDPval-\u00e4hnlichen Knowledge-Work-Aufgabe. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art.webp\" alt=\"Key Visual zur GPT-5.3-Codex System Card\" class=\"wp-image-212\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/System_Card_Art-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\">Im Post wird auf die System Card zu GPT\u20115.3\u2011Codex verwiesen. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2400\" height=\"1260\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Codex_Landing_Page_SEO.webp\" alt=\"Visual zur Codex-Landing-Page (SEO-Karte)\" class=\"wp-image-213\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Codex_Landing_Page_SEO.webp 2400w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Codex_Landing_Page_SEO-300x158.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Codex_Landing_Page_SEO-1024x538.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Codex_Landing_Page_SEO-768x403.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Codex_Landing_Page_SEO-1536x806.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Codex_Landing_Page_SEO-2048x1075.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/Codex_Landing_Page_SEO-400x210.webp 400w\" sizes=\"auto, (max-width: 2400px) 100vw, 2400px\" \/><figcaption class=\"wp-element-caption\">OpenAI verweist im \u201eKeep reading\u201c-Bereich auf die Codex-App-Ank\u00fcndigung. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp\" alt=\"Visual zur Ank\u00fcndigung von GPT-5.2-Codex\" class=\"wp-image-214\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/3\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\">Im \u201eKeep reading\u201c-Bereich wird auch auf GPT\u20115.2\u2011Codex verwiesen. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n<div class=\"references-section\">\n                <h2>Referenzen \/ Quellen<\/h2>\n                <ul class=\"references-list\"><li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-3-codex\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing GPT-5.3-Codex<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-the-codex-app\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing the Codex app<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gdpval\/\" target=\"_blank\" rel=\"noopener noreferrer\">GDPval<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/strengthening-cyber-resilience\/\" target=\"_blank\" rel=\"noopener noreferrer\">Strengthening cyber resilience<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gpt-5-3-codex-system-card\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPT-5.3-Codex System Card<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/updating-our-preparedness-framework\/\" target=\"_blank\" rel=\"noopener noreferrer\">Updating our Preparedness Framework<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/trusted-access-for-cyber\/\" target=\"_blank\" rel=\"noopener noreferrer\">Trusted Access for Cyber<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-aardvark\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing Aardvark<\/a><\/li><li><a href=\"https:\/\/vercel.com\/changelog\/summaries-of-cve-2025-59471-and-cve-2025-59472\" target=\"_blank\" rel=\"noopener noreferrer\">Summaries of CVE-2025-59471 and CVE-2025-59472<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/openai-cybersecurity-grant-program\/\" target=\"_blank\" rel=\"noopener noreferrer\">OpenAI Cybersecurity Grant Program<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-2-codex\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing GPT-5.2-Codex<\/a><\/li><\/ul>\n            <\/div>","protected":false},"excerpt":{"rendered":"<p>OpenAI schiebt Codex mit GPT\u20115.3\u2011Codex in Richtung \u201eAllround\u2011Agent\u201c: schneller, interaktiver und stark genug f\u00fcr lange Aufgabenketten mit Tools, Terminal und Desktop-Workflows.<\/p>\n","protected":false},"author":9,"featured_media":210,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[101],"tags":[104,102,106,103,105],"class_list":["post-215","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tools","tag-ai-agents","tag-codex","tag-cybersecurity","tag-openai","tag-software-engineering"],"_links":{"self":[{"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/posts\/215","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/comments?post=215"}],"version-history":[{"count":0,"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/posts\/215\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/media\/210"}],"wp:attachment":[{"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/media?parent=215"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/categories?post=215"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/helloblog.io\/de\/wp-json\/wp\/v2\/tags?post=215"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}