{"id":191,"date":"2026-02-05T20:33:53","date_gmt":"2026-02-05T19:33:53","guid":{"rendered":"https:\/\/helloblog.io\/pl\/gpt-5-3-codex-codex-agent-do-pracy-na-komputerze\/"},"modified":"2026-02-05T20:33:53","modified_gmt":"2026-02-05T19:33:53","slug":"gpt-5-3-codex-codex-agent-do-pracy-na-komputerze","status":"publish","type":"post","link":"https:\/\/helloblog.io\/pl\/gpt-5-3-codex-codex-agent-do-pracy-na-komputerze\/","title":{"rendered":"GPT-5.3-Codex: Codex przestaje by\u0107 \u201eagentem do kodu\u201d i zaczyna ogarnia\u0107 ca\u0142\u0105 prac\u0119 na komputerze"},"content":{"rendered":"\n<p>OpenAI zaprezentowa\u0142o GPT\u20115.3\u2011Codex jako kolejny krok w rozwoju Codex &#8211; z narz\u0119dzia do generowania i przegl\u0105dania kodu do agenta (czyli modelu potrafi\u0105cego planowa\u0107, korzysta\u0107 z narz\u0119dzi i wykonywa\u0107 zadania) obejmuj\u0105cego praktycznie pe\u0142ne spektrum profesjonalnej pracy na komputerze. W praktyce chodzi o d\u0142ugie runy: research, iteracje, uruchamianie polece\u0144 w terminalu, naprawy w projekcie, budow\u0119 aplikacji czy przygotowanie materia\u0142\u00f3w (slajdy, arkusze, dokumenty) &#8211; z mo\u017cliwo\u015bci\u0105 bie\u017c\u0105cego sterowania w trakcie, bez gubienia kontekstu.<\/p>\n\n\n\n<p>W tym wydaniu s\u0105 trzy rzeczy, kt\u00f3re szczeg\u00f3lnie warto odnotowa\u0107 z perspektywy dev\u00f3w: (1) skok w benchmarkach \u201eagentowych\u201d i terminalowych, (2) nacisk na interaktywn\u0105 wsp\u00f3\u0142prac\u0119 w Codex app (cz\u0119ste update\u2019y, mo\u017cliwo\u015b\u0107 dopytywania i korygowania kursu w locie), oraz (3) mocne postawienie tematu cyberbezpiecze\u0144stwa &#8211; model jest klasyfikowany jako \u201eHigh capability\u201d dla zada\u0144 security w ramach Preparedness Framework, a wdro\u017cenie ma najpe\u0142niejszy dot\u0105d pakiet zabezpiecze\u0144.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Co w\u0142a\u015bciwie wnosi GPT\u20115.3\u2011Codex (w skr\u00f3cie)<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>To najnowszy, \u201enajbardziej agentowy\u201d model koduj\u0105cy w rodzinie Codex: \u0142\u0105czy frontierow\u0105 skuteczno\u015b\u0107 GPT\u20115.2\u2011Codex w zadaniach stricte in\u017cynierskich z rozumowaniem i wiedz\u0105 zawodow\u0105 GPT\u20115.2 &#8211; w jednym modelu.<\/li>\n\n\n<li>Wed\u0142ug og\u0142oszenia dzia\u0142a ok. 25% szybciej (lepsza infrastruktura i inference stack), co ma realne znaczenie przy d\u0142ugich sesjach i wielu iteracjach.<\/li>\n\n\n<li>Jest projektowany pod d\u0142ugotrwa\u0142e zadania: research + u\u017cycie narz\u0119dzi + z\u0142o\u017cona egzekucja (a nie tylko \u201ewygeneruj snippet\u201d).<\/li>\n\n\n<li>Mo\u017cesz prowadzi\u0107 model jak wsp\u00f3\u0142pracownika: w trakcie pracy dostajesz cz\u0119ste aktualizacje i mo\u017cesz zmienia\u0107 kierunek bez zrywania kontekstu.<\/li>\n\n\n<li>To pierwszy model, kt\u00f3ry by\u0142 \u201einstrumentalny\u201d w stworzeniu samego siebie: zesp\u00f3\u0142 Codex u\u017cywa\u0142 wczesnych wersji do debugowania treningu, zarz\u0105dzania wdro\u017ceniem i diagnozy test\u00f3w oraz ewaluacji.<\/li>\n\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Frontier agentic capabilities: benchmarki, kt\u00f3re OpenAI podkre\u015bla<\/h2>\n\n\n\n<p>OpenAI opisuje GPT\u20115.3\u2011Codex jako nowy \u201eindustry high\u201d na SWE\u2011Bench Pro i Terminal\u2011Bench oraz mocny wynik na OSWorld i GDPval. Te cztery benchmarki maj\u0105 mierzy\u0107 odpowiednio: realne zadania in\u017cynierskie, umiej\u0119tno\u015bci terminalowe agenta, zdolno\u015b\u0107 pracy w wizualnym \u015brodowisku desktopowym oraz wiedz\u0119\/prac\u0119 zawodow\u0105 w dobrze zdefiniowanych taskach.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Coding: SWE\u2011Bench Pro i Terminal\u2011Bench 2.0<\/h3>\n\n\n\n<p>W warstwie stricte programistycznej GPT\u20115.3\u2011Codex ma osi\u0105ga\u0107 state\u2011of\u2011the\u2011art na SWE\u2011Bench Pro. OpenAI zwraca uwag\u0119 na r\u00f3\u017cnic\u0119 w stosunku do SWE\u2011bench Verified: Verified testuje tylko Python, natomiast SWE\u2011Bench Pro obejmuje cztery j\u0119zyki, ma by\u0107 bardziej odporne na \u201econtamination\u201d (zanieczyszczenie danymi), a przy tym trudniejsze, bardziej zr\u00f3\u017cnicowane i bli\u017csze realiom bran\u017cowym.<\/p>\n\n\n\n<p>Drugi wa\u017cny punkt to Terminal\u2011Bench 2.0, czyli test praktycznych umiej\u0119tno\u015bci terminalowych (tego, czego realnie potrzebuje agent w stylu Codex: poruszanie si\u0119 po repo, uruchamianie polece\u0144, diagnostyka). OpenAI podkre\u015bla te\u017c, \u017ce GPT\u20115.3\u2011Codex osi\u0105ga te wyniki u\u017cywaj\u0105c mniejszej liczby token\u00f3w ni\u017c wcze\u015bniejsze modele &#8211; co w praktyce ma zostawia\u0107 wi\u0119cej \u201ebud\u017cetu\u201d na to, co u\u017cytkownik chce zbudowa\u0107.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Web development: d\u0142ugie, autonomiczne iteracje (gry w przegl\u0105darce)<\/h3>\n\n\n\n<p>Ciekawy fragment og\u0142oszenia dotyczy webdevu i \u201elong\u2011running agentic capabilities\u201d. \u017beby przetestowa\u0107, czy model potrafi przez d\u0142u\u017cszy czas iterowa\u0107 nad projektem, OpenAI zleci\u0142o mu zbudowanie dw\u00f3ch gier od zera: (1) drugiej wersji gry wy\u015bcigowej znanej z premiery Codex app oraz (2) gry o nurkowaniu. Model korzysta\u0142 ze skillu \u201edevelop web game\u201d i dostawa\u0142 proste, generyczne prompty follow\u2011up w stylu \u201efix the bug\u201d albo \u201eimprove the game\u201d. Nast\u0119pnie iterowa\u0142 autonomicznie przez miliony token\u00f3w.<\/p>\n\n\n\n<p>Efekt ma by\u0107 na tyle dojrza\u0142y, \u017ce OpenAI publikuje gry do samodzielnego uruchomienia w przegl\u0105darce:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Gra wy\u015bcigowa: r\u00f3\u017cni zawodnicy, osiem map i przedmioty u\u017cywane spacj\u0105 &#8211; wersja v2: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/racing_v2.html<\/li>\n\n\n<li>Gra o nurkowaniu: eksploracja raf, kolekcjonowanie (fish codex), zarz\u0105dzanie tlenem, ci\u015bnieniem i zagro\u017ceniami: https:\/\/cdn.openai.com\/gpt-examples\/7fc9a6cb-887c-4db6-98ff-df3fd1612c78\/diving_game.html<\/li>\n\n<\/ul>\n\n\n\n<p>W codziennym budowaniu stron (landing page, prosta strona marketingowa) OpenAI twierdzi te\u017c, \u017ce GPT\u20115.3\u2011Codex lepiej odczytuje intencj\u0119 i sensownie uzupe\u0142nia braki w promptach: gdy polecenie jest proste albo niedookre\u015blone, model ma domy\u015blnie proponowa\u0107 bardziej funkcjonaln\u0105 stron\u0119 i lepsze \u201esensible defaults\u201d, \u017ceby startowy \u201ecanvas\u201d by\u0142 bli\u017cszy produkcyjnemu.<\/p>\n\n\n\n<p>W przyk\u0142adzie z dwiema stronami landingowymi (GPT\u20115.3\u2011Codex vs GPT\u20115.2\u2011Codex) zwr\u00f3cono uwag\u0119 na dwa detale UX, kt\u00f3re pojawi\u0142y si\u0119 automatycznie w wersji 5.3: pokazywanie planu rocznego jako zdyskontowanej ceny miesi\u0119cznej (zamiast mno\u017cenia rocznej sumy) oraz automatycznie przewijany carousel z trzema r\u00f3\u017cnymi opiniami u\u017cytkownik\u00f3w (zamiast jednej), co daje wra\u017cenie bardziej kompletnej strony ju\u017c \u201ez pude\u0142ka\u201d.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Beyond coding: PRD, testy, metryki, slajdy, arkusze i \u201eknowledge work\u201d<\/h3>\n\n\n\n<p>OpenAI mocno akcentuje, \u017ce realna praca wytw\u00f3rcza nie ko\u0144czy si\u0119 na generowaniu kodu. GPT\u20115.3\u2011Codex ma wspiera\u0107 pe\u0142en cykl \u017cycia oprogramowania: debugging, deployment, monitoring, pisanie PRD (Product Requirements Document), redakcj\u0119 copy, user research, testy, metryki i inne elementy, kt\u00f3re w praktyce zajmuj\u0105 zespo\u0142om r\u00f3wnie du\u017co czasu co same implementacje.<\/p>\n\n\n\n<p>Jednocze\u015bnie agent ma wychodzi\u0107 poza software: mo\u017ce tworzy\u0107 prezentacje, analizowa\u0107 dane w arkuszach i generowa\u0107 r\u00f3\u017cne \u201ework products\u201d. OpenAI odnosi to do GDPval &#8211; ewaluacji opublikowanej w 2025 roku, mierz\u0105cej wykonanie dobrze zdefiniowanych zada\u0144 wiedzo\u2011pracowych w 44 zawodach. W tym uj\u0119ciu GPT\u20115.3\u2011Codex ma wypada\u0107 mocno i (w wynikach \u201ewins or ties\u201d) dopasowywa\u0107 si\u0119 do poziomu GPT\u20115.2.<\/p>\n\n\n\n<p>W materiale pokazano przyk\u0142ady artefakt\u00f3w, kt\u00f3re agent potrafi wygenerowa\u0107 (slajdy doradztwa finansowego, dokument szkoleniowy dla retailu, arkusz analizy NPV, PDF z prezentacj\u0105 modow\u0105). W jednym z opisanych scenariuszy prompt udawa\u0142 zadanie doradcy finansowego przygotowuj\u0105cego 10\u2011slajdow\u0105 prezentacj\u0119 wewn\u0119trzn\u0105 dla field advisor\u00f3w: dlaczego &#8211; jako fiduciaries &#8211; powinni odradza\u0107 rolowanie certyfikat\u00f3w depozytowych (CDs) w variable annuities. Wymagania obejmowa\u0142y m.in. por\u00f3wnanie cech produkt\u00f3w, analiz\u0119 ryzyko\/zwrot i wp\u0142ywu na wzrost, r\u00f3\u017cnice w karach\/penalties, suitability i risk tolerance z odniesieniem do NAIC Best Interest Regulations oraz wskazanie obaw FINRA i kwestii regulacyjnych NAIC. W tre\u015bci prompta podano te\u017c konkretne \u017ar\u00f3d\u0142a webowe (NAIC i FINRA), kt\u00f3re nale\u017ca\u0142o uwzgl\u0119dni\u0107.<\/p>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2560\" height=\"1337\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp\" alt=\"Zrzut ekranu z przyk\u0142adowej prezentacji wygenerowanej przez GPT-5.3-Codex w zadaniu typu GDPval (doradztwo finansowe)\" class=\"wp-image-187\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-scaled.webp 2560w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-300x157.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1024x535.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-768x401.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-1536x802.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-2048x1069.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Screenshot_2026-02-04_at_10.16.15C3A2__AM-400x209.webp 400w\" sizes=\"auto, (max-width: 2560px) 100vw, 2560px\" \/><figcaption class=\"wp-element-caption\">Przyk\u0142ad artefaktu \u201eknowledge work\u201d (slajdy) wygenerowanego przez GPT\u20115.3\u2011Codex w ramach opisywanego zadania. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">OSWorld: praca w \u201eprawdziwym\u201d desktopie (z vision)<\/h3>\n\n\n\n<p>OSWorld to benchmark, w kt\u00f3rym agent ma wykonywa\u0107 zadania produktywno\u015bci w wizualnym \u015brodowisku desktopowym (czyli nie tylko tekst\/terminal, ale te\u017c interfejsy). OpenAI wskazuje, \u017ce GPT\u20115.3\u2011Codex prezentuje \u201efar stronger computer use capabilities\u201d ni\u017c poprzednie modele GPT. W wersji OSWorld\u2011Verified modele korzystaj\u0105 z vision do wykonywania zr\u00f3\u017cnicowanych zada\u0144 komputerowych, a w materiale pojawia si\u0119 kontekst, \u017ce ludzie osi\u0105gaj\u0105 ok. 72%.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">\u201eInteraktywny wsp\u00f3\u0142pracownik\u201d: co zmienia Codex app z GPT\u20115.3\u2011Codex<\/h2>\n\n\n\n<p>Wraz ze wzrostem mo\u017cliwo\u015bci agent\u00f3w ro\u015bnie inny problem: nie \u201eczy agent potrafi\u201d, tylko \u201eczy cz\u0142owiek potrafi go skutecznie poprowadzi\u0107 i nadzorowa\u0107\u201d, zw\u0142aszcza gdy pracuje r\u00f3wnolegle wiele agent\u00f3w. OpenAI opisuje Codex app jako element, kt\u00f3ry ma upraszcza\u0107 zarz\u0105dzanie i kierowanie agentami &#8211; a z GPT\u20115.3\u2011Codex aplikacja ma sta\u0107 si\u0119 wyra\u017anie bardziej interaktywna.<\/p>\n\n\n\n<p>Kluczowe zachowanie: zamiast czeka\u0107 na finalny wynik, dostajesz cz\u0119ste aktualizacje o post\u0119pie i decyzjach. Mo\u017cesz wchodzi\u0107 w dialog w czasie rzeczywistym &#8211; zadawa\u0107 pytania, dyskutowa\u0107 podej\u015bcie i korygowa\u0107 kierunek rozwi\u0105zania. Model ma \u201em\u00f3wi\u0107 na g\u0142os\u201d, co robi, reagowa\u0107 na feedback i trzyma\u0107 Ci\u0119 na bie\u017c\u0105co od startu do ko\u0144ca.<\/p>\n\n\n\n<p>Je\u015bli chcesz, \u017ceby agent reagowa\u0142 na follow\u2011upy w trakcie pracy, opcj\u0119 sterowania w locie w\u0142\u0105cza si\u0119 w aplikacji: Settings > General > Follow\u2011up behavior.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Jak OpenAI u\u017cywa\u0142o Codex do trenowania i wdro\u017cenia GPT\u20115.3\u2011Codex<\/h2>\n\n\n\n<p>W og\u0142oszeniu jest sporo \u201ekuchni\u201d procesu. OpenAI podkre\u015bla, \u017ce szybkie ulepszenia Codex s\u0105 wynikiem projekt\u00f3w badawczych trwaj\u0105cych miesi\u0105cami lub latami, ale te projekty s\u0105 teraz przyspieszane przez Codex. Pojawia si\u0119 nawet teza, \u017ce wielu badaczy i in\u017cynier\u00f3w odczuwa, i\u017c ich praca dzi\u015b wygl\u0105da \u201efundamentally different\u201d ni\u017c dwa miesi\u0105ce temu &#8211; w\u0142a\u015bnie przez to, jak bardzo agent automatyzuje i skraca p\u0119tle feedbacku.<\/p>\n\n\n\n<p>Co istotne: nawet wczesne wersje GPT\u20115.3\u2011Codex mia\u0142y na tyle du\u017ce mo\u017cliwo\u015bci, \u017ce zesp\u00f3\u0142 u\u017cywa\u0142 ich do usprawniania treningu i wspierania p\u00f3\u017aniejszych etap\u00f3w wdro\u017cenia. Konkretne przyk\u0142ady z materia\u0142u:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>Zesp\u00f3\u0142 badawczy u\u017cywa\u0142 Codex do monitorowania i debugowania runu treningowego. Nie ogranicza\u0142o si\u0119 to do infrastruktury: Codex mia\u0142 pomaga\u0107 \u015bledzi\u0107 wzorce w trakcie treningu, robi\u0107 g\u0142\u0119bok\u0105 analiz\u0119 jako\u015bci interakcji, proponowa\u0107 poprawki oraz budowa\u0107 aplikacje u\u0142atwiaj\u0105ce ludziom precyzyjne zrozumienie r\u00f3\u017cnic zachowania modelu wzgl\u0119dem poprzednik\u00f3w.<\/li>\n\n\n<li>Zesp\u00f3\u0142 in\u017cynierski u\u017cywa\u0142 Codex do optymalizacji i adaptacji harnessu dla GPT\u20115.3\u2011Codex. Gdy zacz\u0119\u0142y pojawia\u0107 si\u0119 dziwne edge case\u2019y wp\u0142ywaj\u0105ce na u\u017cytkownik\u00f3w, Codex mia\u0142 pom\u00f3c znale\u017a\u0107 b\u0142\u0119dy renderowania kontekstu oraz zdiagnozowa\u0107 przyczyn\u0119 niskich cache hit rates.<\/li>\n\n\n<li>Podczas launchu GPT\u20115.3\u2011Codex ma dalej pomaga\u0107 operacyjnie: dynamicznie skaluje klastry GPU pod skoki ruchu i stabilizuje latency.<\/li>\n\n\n<li>W alpha testach jeden z badaczy chcia\u0142 oszacowa\u0107, ile \u201edodatkowej pracy\u201d model wykonuje per turn i jak zmienia si\u0119 produktywno\u015b\u0107. GPT\u20115.3\u2011Codex zaproponowa\u0142 proste klasyfikatory regex do estymowania cz\u0119stotliwo\u015bci doprecyzowa\u0144, pozytywnych\/negatywnych reakcji u\u017cytkownik\u00f3w oraz post\u0119pu zadania; nast\u0119pnie uruchomi\u0142 je skalowalnie na logach sesji i przygotowa\u0142 raport z wnioskami. Wniosek w materiale: u\u017cytkownicy byli bardziej zadowoleni, bo agent lepiej rozumia\u0142 intencj\u0119, robi\u0142 wi\u0119kszy post\u0119p na tur\u0119 i zadawa\u0142 mniej pyta\u0144 doprecyzowuj\u0105cych.<\/li>\n\n\n<li>Poniewa\u017c GPT\u20115.3\u2011Codex jest \u201etak r\u00f3\u017cny\u201d od poprzednik\u00f3w, dane z alfy zawiera\u0142y wiele nietypowych i kontraintuicyjnych wynik\u00f3w. Data scientist z zespo\u0142u mia\u0142 zbudowa\u0107 z Codex nowe pipeline\u2019y danych i bogatsze wizualizacje ni\u017c standardowe narz\u0119dzia dashboardowe. Wyniki by\u0142y wsp\u00f3\u0142analizowane z Codex, kt\u00f3ry stre\u015bci\u0142 kluczowe insighty z tysi\u0119cy punkt\u00f3w danych w mniej ni\u017c trzy minuty.<\/li>\n\n<\/ul>\n\n\n\n<p>Wsp\u00f3lny mianownik: OpenAI przedstawia to nie jako pojedyncze, efektowne demo, tylko jako systematyczne skr\u00f3cenie czasu od obserwacji problemu \u2192 diagnostyka \u2192 poprawka \u2192 weryfikacja, zar\u00f3wno w researchu, jak i w in\u017cynierii oraz produkcie.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Cyberbezpiecze\u0144stwo: \u201eHigh capability\u201d, trening pod podatno\u015bci i nowe programy<\/h2>\n\n\n\n<p>W ostatnich miesi\u0105cach (wg materia\u0142u) OpenAI obserwowa\u0142o znacz\u0105ce poprawy modeli w zadaniach cybersecurity &#8211; z korzy\u015bci\u0105 dla developer\u00f3w i specjalist\u00f3w security. R\u00f3wnolegle przygotowano wzmocnione zabezpieczenia ekosystemowe (w og\u0142oszeniu pojawia si\u0119 odno\u015bnik do inicjatywy \u201estrengthened cyber safeguards\u201d).<\/p>\n\n\n\n<p>Najwa\u017cniejsze deklaracje wprost:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>GPT\u20115.3\u2011Codex to pierwszy model sklasyfikowany przez OpenAI jako \u201eHigh capability\u201d dla zada\u0144 cybersecurity w ramach Preparedness Framework (z linkiem do system card).<\/li>\n\n\n<li>To r\u00f3wnie\u017c pierwszy model, kt\u00f3ry zosta\u0142 bezpo\u015brednio trenowany do identyfikowania podatno\u015bci (software vulnerabilities).<\/li>\n\n\n<li>OpenAI zaznacza, \u017ce nie ma definitywnego dowodu, i\u017c model potrafi zautomatyzowa\u0107 cyberataki end\u2011to\u2011end, ale przyjmuje podej\u015bcie ostro\u017cno\u015bciowe i wdra\u017ca najbardziej kompleksowy dot\u0105d cybersecurity safety stack.<\/li>\n\n\n<li>Wymienione elementy mitigacji obejmuj\u0105: safety training, automated monitoring, trusted access dla zaawansowanych mo\u017cliwo\u015bci oraz enforcement pipelines z threat intelligence.<\/li>\n\n\n<li>Poniewa\u017c cybersecurity jest obszarem dual\u2011use, podej\u015bcie ma by\u0107 evidence\u2011based i iteracyjne: przyspiesza\u0107 prac\u0119 obro\u0144c\u00f3w (znajdowanie i \u0142atanie podatno\u015bci), a spowalnia\u0107 nadu\u017cycia.<\/li>\n\n<\/ul>\n\n\n\n<p>W tym kontek\u015bcie OpenAI uruchamia Trusted Access for Cyber &#8211; pilota\u017c maj\u0105cy przyspiesza\u0107 badania w obszarze cyber defense.<\/p>\n\n\n\n<p>R\u00f3wnolegle maj\u0105 i\u015b\u0107 inwestycje w zabezpieczenia ekosystemu: rozszerzanie prywatnej bety Aardvark (agent do bada\u0144 security) jako pierwszej oferty w pakiecie Codex Security produkt\u00f3w i narz\u0119dzi. W materiale pojawia si\u0119 te\u017c przyk\u0142ad wsp\u00f3\u0142pracy z maintainerami open source: darmowe skanowanie codebase\u2019\u00f3w dla szeroko u\u017cywanych projekt\u00f3w, takich jak Next.js &#8211; wraz z odno\u015bnikiem do publicznego disclosure podatno\u015bci (CVE) opublikowanego przez Vercel w zesz\u0142ym tygodniu.<\/p>\n\n\n\n<p>Na dok\u0142adk\u0119 OpenAI zwi\u0119ksza wsparcie grantowe. Po programie grantowym $1M z 2023 roku, teraz deklaruje $10M w API credits, aby przyspieszy\u0107 cyber defense z u\u017cyciem najbardziej zaawansowanych modeli, szczeg\u00f3lnie dla open source i system\u00f3w infrastruktury krytycznej. Organizacje prowadz\u0105ce badania bezpiecze\u0144stwa w dobrej wierze mog\u0105 aplikowa\u0107 o kredyty API i wsparcie w ramach Cybersecurity Grant Program.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Dost\u0119pno\u015b\u0107 i szczeg\u00f3\u0142y techniczne<\/h2>\n\n\n\n<p>GPT\u20115.3\u2011Codex jest dost\u0119pny w p\u0142atnych planach ChatGPT &#8211; wsz\u0119dzie tam, gdzie mo\u017cna u\u017cywa\u0107 Codex: w aplikacji, w CLI, w rozszerzeniu do IDE oraz w webie. Dost\u0119p przez API ma zosta\u0107 uruchomiony \u201ewkr\u00f3tce\u201d, z naciskiem na bezpieczne w\u0142\u0105czenie.<\/p>\n\n\n\n<p>OpenAI podaje te\u017c, \u017ce dla u\u017cytkownik\u00f3w Codex model jest uruchamiany 25% szybciej dzi\u0119ki usprawnieniom infrastruktury oraz inference stack, co ma przek\u0142ada\u0107 si\u0119 na szybsze interakcje i szybsze wyniki.<\/p>\n\n\n\n<p>Od strony sprz\u0119towej: GPT\u20115.3\u2011Codex by\u0142 wsp\u00f3\u0142projektowany pod, trenowany z i serwowany na systemach NVIDIA GB200 NVL72. OpenAI dzi\u0119kuje NVIDIA za partnerstwo.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Co dalej: od \u201episania kodu\u201d do \u201eu\u017cywania kodu do wykonania pracy\u201d<\/h2>\n\n\n\n<p>Najbardziej sp\u00f3jna my\u015bl z ca\u0142ego og\u0142oszenia jest taka: Codex przestaje by\u0107 narz\u0119dziem do wytwarzania kodu, a staje si\u0119 agentem, kt\u00f3ry u\u017cywa kodu jako jednego z narz\u0119dzi do tego, by domkn\u0105\u0107 zadanie end\u2011to\u2011end. Pchanie granicy w tym, co potrafi agent koduj\u0105cy, ma odblokowywa\u0107 szersz\u0105 klas\u0119 pracy wiedzo\u2011technicznej &#8211; od budowy i wdro\u017ce\u0144, po research, analiz\u0119 i realizacj\u0119 z\u0142o\u017conych proces\u00f3w.<\/p>\n\n\n\n<p>W uj\u0119ciu OpenAI to, co zacz\u0119\u0142o si\u0119 jako wy\u015bcig o \u201enajlepszego agenta do kodu\u201d, staje si\u0119 fundamentem bardziej og\u00f3lnego wsp\u00f3\u0142pracownika na komputerze: rozszerza zar\u00f3wno grono os\u00f3b, kt\u00f3re mog\u0105 budowa\u0107, jak i zakres tego, co da si\u0119 realnie \u201edowie\u017a\u0107\u201d z pomoc\u0105 Codex.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Appendix: wyniki benchmark\u00f3w (xhigh reasoning effort)<\/h2>\n\n\n\n<p>W stopce materia\u0142u OpenAI zaznacza, \u017ce wszystkie ewaluacje w po\u015bcie uruchomiono na GPT\u20115.3\u2011Codex z ustawieniem xhigh reasoning effort. W tabeli por\u00f3wnawczej podano:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n\n<li>SWE\u2011Bench Pro (Public): GPT\u20115.3\u2011Codex (xhigh) 56.8%, GPT\u20115.2\u2011Codex (xhigh) 56.4%, GPT\u20115.2 (xhigh) 55.6%<\/li>\n\n\n<li>Terminal\u2011Bench 2.0: GPT\u20115.3\u2011Codex 77.3%, GPT\u20115.2\u2011Codex 64.0%, GPT\u20115.2 62.2%<\/li>\n\n\n<li>OSWorld\u2011Verified: GPT\u20115.3\u2011Codex 64.7%, GPT\u20115.2\u2011Codex 38.2%, GPT\u20115.2 37.9%<\/li>\n\n\n<li>GDPval (wins or ties): GPT\u20115.3\u2011Codex 70.9%, GPT\u20115.2\u2011Codex \u2013 , GPT\u20115.2 70.9% (high)<\/li>\n\n\n<li>Cybersecurity Capture The Flag Challenges: GPT\u20115.3\u2011Codex 77.6%, GPT\u20115.2\u2011Codex 67.4%, GPT\u20115.2 67.7%<\/li>\n\n\n<li>SWE\u2011Lancer IC Diamond: GPT\u20115.3\u2011Codex 81.4%, GPT\u20115.2\u2011Codex 76.0%, GPT\u20115.2 74.6%<\/li>\n\n<\/ul>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art.webp\" alt=\"Grafika promuj\u0105ca \u201eSystem Card Art\u201d dla GPT-5.3-Codex\" class=\"wp-image-188\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/System_Card_Art-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\">Grafika towarzysz\u0105ca publikacji system card dla GPT\u20115.3\u2011Codex. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2400\" height=\"1260\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Codex_Landing_Page_SEO.webp\" alt=\"Grafika SEO dla strony Codex (Codex Landing Page SEO)\" class=\"wp-image-189\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Codex_Landing_Page_SEO.webp 2400w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Codex_Landing_Page_SEO-300x158.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Codex_Landing_Page_SEO-1024x538.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Codex_Landing_Page_SEO-768x403.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Codex_Landing_Page_SEO-1536x806.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Codex_Landing_Page_SEO-2048x1075.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/Codex_Landing_Page_SEO-400x210.webp 400w\" sizes=\"auto, (max-width: 2400px) 100vw, 2400px\" \/><figcaption class=\"wp-element-caption\">Grafika promocyjna zwi\u0105zana z Codex app. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"2160\" height=\"2160\" src=\"https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp\" alt=\"Karta graficzna artyku\u0142u o GPT-5.2-Codex\" class=\"wp-image-190\" srcset=\"https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1.webp 2160w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-300x300.webp 300w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1024x1024.webp 1024w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-150x150.webp 150w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-768x768.webp 768w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-1536x1536.webp 1536w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-2048x2048.webp 2048w, https:\/\/helloblog.io\/app\/uploads\/sites\/8\/2026\/02\/OAI_GPT-5.2-Codex_ArtCard_1x1-400x400.webp 400w\" sizes=\"auto, (max-width: 2160px) 100vw, 2160px\" \/><figcaption class=\"wp-element-caption\">Materia\u0142 graficzny odnosz\u0105cy si\u0119 do poprzedniej wersji modelu: GPT\u20115.2\u2011Codex. \u2014 <em>Forr\u00e1s: OpenAI<\/em><\/figcaption><\/figure>\n\n\n<div class=\"references-section\">\n                <h2>Odniesienia \/ \u0179r\u00f3d\u0142a<\/h2>\n                <ul class=\"references-list\"><li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-3-codex\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing GPT-5.3-Codex<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-the-codex-app\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing the Codex app<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gdpval\/\" target=\"_blank\" rel=\"noopener noreferrer\">GDPval<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/strengthening-cyber-resilience\/\" target=\"_blank\" rel=\"noopener noreferrer\">Strengthening cyber resilience<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/gpt-5-3-codex-system-card\/\" target=\"_blank\" rel=\"noopener noreferrer\">GPT-5.3-Codex System Card<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/updating-our-preparedness-framework\/\" target=\"_blank\" rel=\"noopener noreferrer\">Updating our Preparedness Framework<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/trusted-access-for-cyber\/\" target=\"_blank\" rel=\"noopener noreferrer\">Trusted Access for Cyber<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/introducing-aardvark\/\" target=\"_blank\" rel=\"noopener noreferrer\">Introducing Aardvark<\/a><\/li><li><a href=\"https:\/\/vercel.com\/changelog\/summaries-of-cve-2025-59471-and-cve-2025-59472\" target=\"_blank\" rel=\"noopener noreferrer\">Summaries of CVE-2025-59471 and CVE-2025-59472<\/a><\/li><li><a href=\"https:\/\/openai.com\/index\/openai-cybersecurity-grant-program\/\" target=\"_blank\" rel=\"noopener noreferrer\">OpenAI Cybersecurity Grant Program<\/a><\/li><li><a href=\"https:\/\/content.naic.org\/sites\/default\/files\/government-affairs-brief-annuity-suitability-best-interest-model.pdf\" target=\"_blank\" rel=\"noopener noreferrer\">government-affairs-brief-annuity-suitability-best-interest-model.pdf<\/a><\/li><li><a href=\"https:\/\/www.finra.org\/investors\/insights\/high-yield-cds\" target=\"_blank\" rel=\"noopener noreferrer\">High-yield CDs (FINRA)<\/a><\/li><\/ul>\n            <\/div>","protected":false},"excerpt":{"rendered":"<p>OpenAI wypu\u015bci\u0142o GPT-5.3-Codex &#8211; model, kt\u00f3ry nie tylko pisze i reviewuje kod, ale potrafi prowadzi\u0107 d\u0142ugie, wieloetapowe zadania z u\u017cyciem narz\u0119dzi i realn\u0105 egzekucj\u0105 na komputerze. Najciekawsze: to pierwszy model, kt\u00f3ry by\u0142 istotnym elementem\u2026 w\u0142asnego wytworzenia i wdro\u017cenia.<\/p>\n","protected":false},"author":26,"featured_media":186,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[106],"tags":[109,35,107,108,110],"class_list":["post-191","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai","tag-agentic-ai","tag-bezpieczenstwo","tag-codex","tag-gpt-5-3-codex","tag-programowanie"],"_links":{"self":[{"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/posts\/191","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/users\/26"}],"replies":[{"embeddable":true,"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/comments?post=191"}],"version-history":[{"count":0,"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/posts\/191\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/media\/186"}],"wp:attachment":[{"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/media?parent=191"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/categories?post=191"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/helloblog.io\/pl\/wp-json\/wp\/v2\/tags?post=191"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}