GPT-5.3-Codex: Codex no “rakstu kodu” pārtop par pilnvērtīgu aģentu darbam datorā
OpenAI ir izlaidis GPT-5.3-Codex – līdz šim jaudīgāko aģentisko kodēšanas modeli Codex saimē, un būtiskākais nav tikai “labāk raksta kodu”. Pēc paziņojuma, mērķis ir skaidrs: paplašināt Codex no programmēšanas palīga līdz aģentam, kas spēj izdarīt gandrīz jebko, ko izstrādātāji un citi profesionāļi dara datorā – ar izpildi, rīku lietošanu, izpēti, iterācijām un nepazaudētu kontekstu ilgstošā darbā.
Modelis apvieno divas līnijas vienā: GPT‑5.2‑Codex robežspējas kodēšanā un GPT‑5.2 spriestspēju (reasoning) un profesionālo zināšanu kapacitāti. Un tas viss ir arī par 25% ātrāk – tieši tas, kas aģentiskiem uzdevumiem ar lielu kontekstu un daudziem soļiem bieži izšķir, vai rīks ir izmantojams ikdienā.
Interesants fakts: OpenAI šo modeli sauc par pirmo, kas būtiski palīdzējis radīt pats sevi. Codex komanda izmantoja agrīnas GPT‑5.3‑Codex versijas, lai atkļūdotu pašu treniņu procesu, pārvaldītu izvēršanu (deployment) un diagnosticētu testu un novērtējumu rezultātus. Citiem vārdiem – modelis jau izlaiduma brīdī ir bijis paātrinātājs pašas attīstības ciklā.
Frontier aģentiskās spējas: kur GPT-5.3-Codex izceļas pēc mērījumiem
OpenAI izceļ četrus etalonus (benchmarks), ar kuriem viņi mēra kodēšanu, aģentiskumu un “reālās pasaules” datorlietošanu: SWE-Bench Pro, Terminal-Bench, OSWorld un GDPval. Pēc paziņojuma, GPT‑5.3‑Codex uzstāda jaunu industrijas latiņu SWE‑Bench Pro un Terminal‑Bench, un rāda spēcīgu sniegumu OSWorld un GDPval.
Kodēšana: SWE-Bench Pro un Terminal-Bench 2.0
SWE‑Bench Pro tiek pozicionēts kā stingrs “reālās programmatūras inženierijas” novērtējums. Atšķirībā no SWE‑bench Verified, kas testē tikai Python, SWE‑Bench Pro aptver četras valodas un ir veidots kā noturīgāks pret contamination (situācijām, kad modelis varētu būt “redzējis” uzdevumu vai tā daļas treniņa datos). OpenAI uzsver, ka tas ir izaicinošāks, daudzveidīgāks un industrijai relevantāks.
Papildus tam GPT‑5.3‑Codex krietni pārsniedz iepriekšējo state‑of‑the‑art rezultātu Terminal‑Bench 2.0, kas mēra tieši tās termināļa prasmes, kas nepieciešamas aģentam, kurš strādā kā Codex (komandas, failu operācijas, skripti, atkļūdošana u.c.). Vēl viena praktiska detaļa: OpenAI norāda, ka GPT‑5.3‑Codex to panāk ar mazāku tokenu patēriņu nekā iepriekšējie modeļi – lietotājam tas bieži nozīmē vairāk darba vienā sesijā, mazāk “konteksta nodokļa” un vienkāršāku iterāciju.
Web izstrāde un ilgstošas iterācijas miljonos tokenu
Web izstrādē OpenAI piesauc trīs lietas vienlaikus: frontier kodēšanu, uzlabotu aesthetics (vizuālo un UX izjūtu) un compaction (kompaktāku, lietderīgāku izteiksmi). Rezultāts – modelis spēj uzbūvēt funkcionāli sarežģītas spēles un aplikācijas “no nulles” vairākās dienās, autonomi iterējot.
Lai pārbaudītu tieši web izstrādes un ilgstoša aģentiska darba spējas, OpenAI lika GPT‑5.3‑Codex izveidot divas spēles: (1) sacīkšu spēles “v2” versiju, balstoties uz piemēru no Codex lietotnes palaišanas, un (2) niršanas spēli. Tika izmantota develop web game prasme un iepriekš sagatavoti, vispārīgi turpinājuma uzvedņi (follow‑up prompts) kā “fix the bug” vai “improve the game”. Modelis autonomi iterēja pār projektiem miljonos tokenu.
- Sacīkšu spēle ar vairākiem braucējiem, astoņām kartēm un pat itemiem, kurus var aktivizēt ar atstarpes taustiņu. Spēle pieejama šeit: https://cdn.openai.com/gpt-examples/7fc9a6cb-887c-4db6-98ff-df3fd1612c78/racing_v2.html
- Niršanas spēle, kur pēti rifus, kolekcionē atradumus, lai aizpildītu “fish codex”, un vienlaikus pārvaldi skābekli, spiedienu un riskus. Spēle pieejama šeit: https://cdn.openai.com/gpt-examples/7fc9a6cb-887c-4db6-98ff-df3fd1612c78/diving_game.html
Ikdienas web lapu ģenerēšanā OpenAI īpaši izceļ, ka GPT‑5.3‑Codex labāk saprot nodomu nekā GPT‑5.2‑Codex. Praktiski tas nozīmē: ja uzvednis ir vienkāršs vai nepilnīgi specifikēts, jaunais modelis biežāk izveido lapu ar jēdzīgiem noklusējumiem un lielāku funkcionalitāti kā “starta audeklu”.
Konkrētā piemērā ar divām “landing page” ģenerācijām GPT‑5.3‑Codex automātiski attēloja gada plānu kā diskontētu mēneša cenu (nevis vienkārši izrēķināja gada summu), padarot atlaidi saprotamāku. Tāpat tas izveidoja automātiski pārslēdzamu testimonials karuseli ar trim atšķirīgiem citātiem, nevis vienu, kā rezultātā lapa pēc noklusējuma izskatījās pilnīgāka un tuvāka “production‑ready” līmenim.
Ne tikai kods: pilns programmatūras dzīves cikls un profesionālais “knowledge work”
OpenAI atgādina acīmredzamo, ko mēs bieži aizmirstam, runājot par “kodēšanas modeļiem”: programmatūras inženieri, dizaineri, produktu vadītāji un datu zinātnieki dara daudz vairāk par koda ģenerēšanu. GPT‑5.3‑Codex ir būvēts, lai atbalstītu visu programmatūras dzīves ciklu: atkļūdošanu, izvēršanu (deploying), monitoringu, PRD rakstīšanu, teksta rediģēšanu, lietotāju izpēti, testus, metriku analīzi u.c.
Un aģentiskums nav ieslēgts tikai “software” rāmī – paziņojumā minēts, ka tas var palīdzēt arī ar tādiem darba produktiem kā slaidu prezentācijas vai datu analīze izklājlapās.
Šeit parādās GDPval – OpenAI 2025. gadā publicēts novērtējums, kas mēra modeļa sniegumu precīzi definētos zināšanu darba uzdevumos (well‑specified knowledge‑work tasks) across 44 profesijām. Tajā ietilpst, piemēram, prezentāciju un izklājlapu sagatavošana un citi līdzīgi rezultāti. OpenAI norāda, ka ar pielāgotām prasmēm (custom skills), līdzīgām tām, kas tika izmantotas iepriekšējiem GDPval rezultātiem, GPT‑5.3‑Codex rāda spēcīgu sniegumu profesionālajā darbā, pielīdzinoties GPT‑5.2.
Paziņojumā kā piemēri tiek minēti dažādi aģenta sagatavoti darba materiāli (piemēram, finanšu ieteikumu slaidi, mazumtirdzniecības apmācību dokuments, NPV analīzes izklājlapa, modes prezentācijas PDF). Viens no detalizētāk aprakstītajiem uzdevumiem: aģents darbojas kā finanšu konsultants wealth management uzņēmumā un sagatavo 10 slaidu PowerPoint par to, kāpēc fiduciary pienākumu ietvaros nevajadzētu ieteikt CD (certificates of deposits) pārvelšanu uz variable annuities, ar salīdzinājumiem, riska/ienesīguma analīzi, sodu atšķirībām, piemērotību un atsaucēm uz NAIC Best Interest Regulations, FINRA un NAIC bažām un regulējumu, izmantojot konkrētus avotus: https://content.naic.org/sites/default/files/government-affairs-brief-annuity-suitability-best-interest-model.pdf un https://www.finra.org/investors/insights/high-yield-cds.

Svarīga piebilde par GDPval: OpenAI uzsver, ka katru uzdevumu ir izstrādājis pieredzējis nozares profesionālis un tas atspoguļo reālu ikdienas darbu konkrētajā profesijā.
OSWorld: datora lietošana vizuālā darbvirsmas vidē
Vēl viens interesants signāls aģentiem: OSWorld ir “computer‑use” etalons, kur aģentam jāizpilda produktivitātes uzdevumi vizuālā darbvirsmas vidē (t.i., ne tikai teksts/CLI). OpenAI norāda, ka GPT‑5.3‑Codex demonstrē ievērojami spēcīgākas datora lietošanas spējas nekā iepriekšējie GPT modeļi.
OSWorld‑Verified konfigurācijā modeļi izmanto redzi (vision), lai izpildītu dažādus datoruzdevumus; paziņojumā minēts, ka cilvēku sniegums ir ap ~72%.
Interaktīvs līdzstrādnieks: vadāmība, uzraudzība un darbs “pa vidu”
Kad aģentu spējas kļūst jaudīgākas, šaurais kakls bieži vairs nav “vai modelis prot”, bet gan “vai cilvēks var ērti vadīt un uzraudzīt vairākus aģentus paralēli”. OpenAI šo pozicionē kā vienu no Codex lietotnes (Codex app) galvenajiem ieguvumiem, un ar GPT‑5.3‑Codex tas kļūst vēl izteiktāk: aģents sniedz biežākus statusa atjauninājumus, lai tu redzētu būtiskus lēmumus un progresu procesā.
Praktiskā atšķirība ikdienas darbā: tev nav jāgaida tikai gala rezultāts. Tu vari iejaukties reāllaikā – uzdot jautājumus, apspriest pieeju, pāradresēt risinājumu. OpenAI raksturo šo kā modeli, kas “izrunā”, ko dara, reaģē uz atgriezenisko saiti un notur tevi informētā stāvoklī no sākuma līdz beigām.
Kur ieslēgt “steering” Codex lietotnē
Codex app: Settings > General > Follow-up behavior. Tur var aktivizēt vadāmu turpinājumu (steering) laikā, kamēr modelis strādā.
Kā OpenAI izmantoja Codex, lai trenētu un izvērstu GPT-5.3-Codex
OpenAI saka tieši: pēdējie Codex uzlabojumi balstās pētniecības projektos, kas ilguši mēnešus vai pat gadus, un šos projektus tagad pats Codex būtiski paātrina. Viņi min, ka daudziem OpenAI pētniekiem un inženieriem darbs šodien ir fundamentāli citāds nekā pirms diviem mēnešiem, un pat agrīnās GPT‑5.3‑Codex versijas jau ļāva uzlabot treniņu un atbalstīt vēlākas versijas izvēršanu.
Tā kā Codex der ļoti plašam uzdevumu lokam, OpenAI atzīst, ka ir grūti izsmeļoši uzskaitīt visu, kā tas palīdz. Tomēr paziņojumā ir konkrēti piemēri gan pētniecībā, gan inženierijā, gan datu analīzē:
- Pētniecības komanda izmantoja Codex, lai monitorētu un atkļūdotu treniņa palaidienu (training run) šim izlaidumam.
- Codex palīdzēja ne tikai ar infrastruktūras problēmām, bet arī ar paternu izsekošanu treniņa gaitā, dziļu interaction quality analīzi, labojumu (fix) piedāvājumiem un bagātīgu aplikāciju uzbūvi pētniekiem, lai precīzi saprastu, kā jaunā modeļa uzvedība atšķiras no iepriekšējiem modeļiem.
- Inženierijas komanda izmantoja Codex, lai optimizētu un pielāgotu harness (testēšanas/izpildes ietvaru) GPT‑5.3‑Codex vajadzībām.
- Kad parādījās dīvaini “edge case” scenāriji, komandas dalībnieki izmantoja Codex, lai atrastu context rendering bugus un izsekotu zemu cache hit rate kā saknes cēloni.
- Pēc paziņojuma GPT‑5.3‑Codex turpina palīdzēt izlaiduma laikā, dinamiski mērogojot GPU klasterus, lai pielāgotos trafika pīķiem un noturētu stabilu latentumu.
- Alpha testēšanā viens pētnieks gribēja saprast, cik daudz papildu darba GPT‑5.3‑Codex paveic “per turn” un kā tas ietekmē produktivitāti. Modelis izdomāja vairākus vienkāršus regex klasifikatorus, lai novērtētu precizējošo jautājumu biežumu, pozitīvās/negatīvās lietotāju reakcijas un progresa indikatorus uzdevumā, palaida tos mērogojami pār sesiju logiem un sagatavoja atskaiti ar secinājumiem.
- OpenAI novēroja, ka cilvēkiem, kas būvē ar Codex, pieredze uzlabojās: aģents labāk saprata nodomu un panāca vairāk progresa ar mazāk precizējošiem jautājumiem.
- Tā kā GPT‑5.3‑Codex atšķiras no priekšgājējiem, alpha dati uzrādīja vairākus neparastus un pretintuitīvus rezultātus. Datu zinātnieks kopā ar GPT‑5.3‑Codex uzbūvēja jaunus data pipeline un vizualizācijas, bagātākas nekā standarta dashboard rīki.
- Rezultāti tika kopīgi analizēti ar Codex, kas spēja kodolīgi apkopot galvenos ieskatus pār tūkstošiem datu punktu mazāk nekā trīs minūtēs.
Kopsavilkums, ko OpenAI izvelk no šiem piemēriem: jaunās spējas kopā dod jūtamu paātrinājumu pētniecības, inženierijas un produktu komandām – nevis tikai atsevišķos “wow” gadījumos.
Kiberdrošība: “High capability”, ievainojamību atpazīšana un jauni aizsardzības slāņi
Pēdējos mēnešos OpenAI ziņo par nozīmīgiem uzlabojumiem modeļu sniegumā kiberdrošības uzdevumos, kas var palīdzēt gan izstrādātājiem, gan drošības speciālistiem. Paralēli viņi ir gatavojuši pastiprinātus drošības pasākumus, lai atbalstītu aizsardzības (defensive) pielietojumu un ekosistēmas noturību. Šeit ir svarīga saite uz viņu aprakstīto virzienu: https://openai.com/index/strengthening-cyber-resilience/.
GPT‑5.3‑Codex ir pirmais modelis, ko OpenAI kiberdrošības uzdevumiem klasificē kā “High capability” saskaņā ar viņu Preparedness Framework (https://openai.com/index/updating-our-preparedness-framework/), un pirmais, ko viņi ir tieši trenējuši programmatūras ievainojamību identificēšanai. Tajā pašā laikā OpenAI norāda, ka viņiem nav definitīvu pierādījumu, ka modelis spēj automatizēt kiberuzbrukumus “end‑to‑end”. Neskatoties uz to, izvēlēta piesardzīga pieeja un izvērsts līdz šim visaptverošākais kiberdrošības “safety stack”.
- Drošības treniņš (safety training).
- Automatizēta monitorēšana.
- Trusted access (uzticama piekļuve) uzlabotām spējām.
- Enforcement pipeline (ieviešanas/izpildes cauruļvadi), tostarp ar threat intelligence (draudu izlūkošanu).
Tā kā kiberdrošība pēc būtības ir dual‑use joma, OpenAI uzsver pierādījumos balstītu, iteratīvu pieeju: paātrināt aizstāvju spēju atrast un salabot ievainojamības, vienlaikus bremzējot ļaunprātīgu izmantošanu. Šī ietvarā tiek palaists Trusted Access for Cyber pilotprojekts, lai paātrinātu kiberaizsardzības pētniecību: https://openai.com/index/trusted-access-for-cyber/.
Papildus tam OpenAI investē ekosistēmas aizsardzībā. Paziņojumā minēts, ka viņi paplašina privāto beta Aardvark (drošības pētniecības aģents) kā pirmo piedāvājumu Codex Security produktu un rīku komplektā: https://openai.com/index/introducing-aardvark/.
Konkrēta partnerību līnija: OpenAI sadarbojas ar open‑source uzturētājiem, nodrošinot bezmaksas codebase skenēšanu plaši izmantotiem projektiem, piemēram, Next.js. Piemērs no paziņojuma: drošības pētnieks izmantoja Codex, lai atrastu ievainojamības, kas tika atklātas pagājušajā nedēļā (Vercel kopsavilkums): https://vercel.com/changelog/summaries-of-cve-2025-59471-and-cve-2025-59472.
Un vēl viens būtisks resurss aizsardzības pusei: balstoties uz $1M Cybersecurity Grant Program (uzsākta 2023. gadā), OpenAI tagad apņemas $10M API kredītos, lai paātrinātu kiberaizsardzību ar jaudīgākajiem modeļiem, īpaši open‑source programmatūrai un kritiskās infrastruktūras sistēmām. Organizācijas, kas veic “good‑faith” drošības pētniecību, var pieteikties API kredītiem un atbalstam caur programmu: https://openai.com/index/openai-cybersecurity-grant-program/.
Pieejamība, veiktspēja un infrastruktūra
GPT‑5.3‑Codex ir pieejams ar maksas ChatGPT plāniem visur, kur izmanto Codex: lietotnē, CLI, IDE paplašinājumā un web. OpenAI norāda, ka viņi strādā pie tā, lai droši iespējotu API piekļuvi “soon” (t.i., drīzumā), bet šobrīd tas vēl ir procesā.
Ar šo atjauninājumu OpenAI saka, ka Codex lietotājiem GPT‑5.3‑Codex darbojas par 25% ātrāk, pateicoties infrastruktūras un inference stack uzlabojumiem – praktiski tas nozīmē ātrāku interakciju un ātrākus rezultātus.
Aparatūras pusē: GPT‑5.3‑Codex ir kopīgi dizainēts, trenēts un servēts uz NVIDIA GB200 NVL72 sistēmām. OpenAI atsevišķi pateicas NVIDIA par partnerību.
Kas tālāk: no “kodēšanas aģenta” uz vispārīgu līdzstrādnieku datorā
OpenAI “What’s next” sadaļas vēstījums ir diezgan konsekvents ar visu paziņojumu: ar GPT‑5.3‑Codex Codex virzās tālāk par koda rakstīšanu – kods kļūst par instrumentu, ar kuru aģents operē datoru un pabeidz darbu “end‑to‑end”. Spiežot uz priekšu kodēšanas aģenta robežspējas, viņi vienlaikus atver plašāku knowledge work klasi: no programmatūras būvēšanas un izvēršanas līdz izpētei, analīzei un sarežģītu uzdevumu izpildei.
Paziņojums to noformulē kā evolūciju: sākumā fokuss bija būt “labākajam kodēšanas aģentam”, bet šis pamats tagad kļūst par platformu vispārīgākam sadarbības partnerim datorā, kas paplašina gan to, kas var būvēt, gan to, kas ar Codex ir iespējams.
Appendix: etalonu rezultāti (xhigh) vienuviet
OpenAI pielikumā ieliek tabulu ar rezultātiem, un ir vērts piefiksēt arī piezīmi: visi blogā minētie novērtējumi tika palaisti uz GPT‑5.3‑Codex ar xhigh reasoning effort.
- SWE-Bench Pro (Public): GPT‑5.3‑Codex (xhigh) 56.8% ; GPT‑5.2‑Codex (xhigh) 56.4% ; GPT‑5.2 (xhigh) 55.6%
- Terminal-Bench 2.0: GPT‑5.3‑Codex 77.3% ; GPT‑5.2‑Codex 64.0% ; GPT‑5.2 62.2%
- OSWorld-Verified: GPT‑5.3‑Codex 64.7% ; GPT‑5.2‑Codex 38.2% ; GPT‑5.2 37.9%
- GDPval (wins or ties): GPT‑5.3‑Codex 70.9% ; GPT‑5.2 (xhigh) 70.9% (high)
- Cybersecurity Capture The Flag Challenges: GPT‑5.3‑Codex 77.6% ; GPT‑5.2‑Codex 67.4% ; GPT‑5.2 67.7%
- SWE-Lancer IC Diamond: GPT‑5.3‑Codex 81.4% ; GPT‑5.2‑Codex 76.0% ; GPT‑5.2 74.6%
Noderīgas saites, kas parādās paziņojumā
- Codex app lejupielāde (macOS .dmg): https://persistent.oaistatic.com/codex-app-prod/Codex.dmg
- GPT-5.3-Codex System Card: https://openai.com/index/gpt-5-3-codex-system-card/
- Introducing the Codex app: https://openai.com/index/introducing-the-codex-app/
- Strengthening cyber resilience: https://openai.com/index/strengthening-cyber-resilience/
- Preparedness Framework (updating): https://openai.com/index/updating-our-preparedness-framework/
- Trusted Access for Cyber: https://openai.com/index/trusted-access-for-cyber/
- Introducing Aardvark: https://openai.com/index/introducing-aardvark/
- Vercel kopsavilkums par CVE: https://vercel.com/changelog/summaries-of-cve-2025-59471-and-cve-2025-59472
- OpenAI Cybersecurity Grant Program: https://openai.com/index/openai-cybersecurity-grant-program/
- GDPval: https://openai.com/index/gdpval/
Ieva Ozoliņa
E-pasta mārketinga un automatizācijas speciāliste. Klaviyo un mārketinga automatizācija ir mani favorīti. Personalizēta klientu pieredze visos kanālos.
Visas publikācijas