
OpenAI je naredil še en zavoj k svoji strategiji umetne inteligence z lansiranjem GPT-5.4Ta model ne obljublja le večje računalniške moči in boljših rezultatov na sintetičnih primerjalnih testih, temveč predstavlja tudi jasen korak k avtomatizaciji dela v resničnem svetu. Podjetje ta sistem predstavlja kot svoj najzmogljivejši in najučinkovitejši model doslej, s poudarkom na profesionalnih okoljih, dolgotrajnih nalogah in agentih, ki lahko delujejo, kot da bi bili oseba, ki sedi za računalnikom.
Objava prihaja tudi v občutljivem času za podjetje Sama Altmana, ki se je znašlo v krizi ugleda, povezani s sporazumi z ameriškim ministrstvom za obrambo in bojkotnimi kampanjami, kot je #QuitGPT. Predstavitev GPT-5.4, le nekaj dni po GPT-5.3 TakojšnjeDeluje tako kot tehnična kot politična poteza: razkazovanje tehnološke moči, hkrati pa poskuša ponovno pridobiti zaupanje uporabnikov in večjih strank.
Dve različici za različne profile: GPT-5.4 Thinking in GPT-5.4 Pro
OpenAI je izdal GPT-5.4 v dveh glavnih različicah. Po eni strani, Razmišljanje GPT-5.4, na voljo v plačljivih paketih ChatGPT (Plus, Team in Pro), namenjenih globoko in večstopenjsko sklepanjeTa model uporabniku prikazuje predogled, kako se bo naloga lotila, kar mu omogoča, da posreduje sredi odziva in preusmeri navodila, ne da bi moral začeti od začetka. Ta sposobnost »izreza in preusmeritve sklepanja«, ki jo OpenAI imenuje vodljivostZasnovan je za kompleksne probleme, kjer želi imeti uporabnik večji nadzor nad procesom.
Po drugi strani pa se zdi GPT-5.4 ProTa različica je namenjena velikim podjetjem in razvojnim projektom, kjer je trajnostna učinkovitost bistvenega pomena. intenzivne naloge in kompleksni delovni procesis posebnim poudarkom na agentih, ki delajo dalj časa, obdelujejo številne dokumente in morajo sprejemati zaporedne odločitve. V API-ju se lahko obe različici uporabljata kot mehanizma za izdelke po meri, integrirajo pa se tudi s platformo, usmerjeno v kodo, ki je naslednica Codexa.
Umetna inteligenca, ki upravlja računalnik kot človeški uporabnik.
Največ naslovnic je v medijih, saj je GPT-5.4 prvi splošni model OpenAI z zmogljivosti uporabe izvornega računalnikaPodjetje uporablja izraz »uporaba računalnika« za način, pri katerem sistem ni omejen na ustvarjanje besedila, temveč Interpretira, kar vidi na zaslonu (z zajemanjem in ogledovanjem v visoki ločljivosti) in oddaja dejanja miške in tipkovnice za dokončanje nalog.
V praksi nam to omogoča, da razmislimo o scenarijih, ki so se do nedavnega slišali kot vsakdanja znanstvena fantastika: prositi umetno inteligenco, da odpre e-pošto, prenese račune, izvleče ključne podatke in jih prilepi v preglednico ali pa se pomika po različnih poslovnih aplikacijah za izpolnjevanje obrazcev, poizvedovanje po bazah podatkov ali ustvarjanje poročil. Glede na interne primerjalne teste je v testu OSWorld-Preverjenoki meri natančno to sposobnost upravljanja namiznega okolja, GPT-5.4 doseže 75-odstotna stopnja uspešnosti, nad 47,3 % GPT-5.2 in tudi povprečne človeške zmogljivosti, določene na 72,4%.
Te vrste veščin se popolnoma ujemajo s trendom Umetna inteligenca na osnovi agentovOrodja, kot je agent OpenClaw, zasnovan za "prevzem nadzora" nad uporabnikovim računalnikom za avtomatizacijo ponavljajočih se opravil, neposredno izkoriščajo model, ki je vnaprej konfiguriran za interpretiranje zaslona in izvajanje celotnih zaporedij dejanj. Za evropska podjetja, ki testirajo agente v administraciji, financah ali oddelkih za tehnično podporo, je razlika med klepetalnim robotom, ki se zgolj odziva, in modelom, ki dejansko deluje, precejšnja.
Kontekstno okno za do milijon žetonov
Druga pomembna prednost GPT-5.4 je njegova kratkoročna pomnilniška zmogljivost. V API-ju in integraciji s Codexom model podpira kontekstna okna do enega milijona žetonovTo več kot podvoji operacijski pomnilnik, povezan z GPT-5.2, ki je znašal približno 400.000 žetonov, in predstavlja pomemben preskok za tiste, ki delajo z ogromnimi količinami informacij: pogodbami na stotine strani, obsežnimi repozitoriji kode, bazami podatkov o strankah ali letnimi finančnimi poročili.
Za evropska podjetja in odvetniške pisarne, ki so vajene obsežne regulacije, od bančnih predpisov do dokumentacije o skladnosti, kot je RGPDTa razširjeni kontekst omogoča obdelavo celih sklopov dokumentov, ne da bi jih bilo treba umetno fragmentirati. Neposredna posledica je, da Izgubi se manj konteksta, zmanjšajo se napake zaradi opustitve in bolje se ohranja koherenca. pri nalogah, ki zahtevajo sledenje natančnim navodilom skozi več korakov.
Poleg pomnilnika GPT-5.4 uvaja tisto, kar nekateri viri opisujejo kot način "Skrajno sklepanje"Ta pristop omogoča, da se kompleksnim vprašanjem nameni bistveno več računalniške moči, pri čemer se izvajajo procesi, ki lahko trajajo ure namesto sekund. Ne gre le za hitro odzivanje, temveč za sposobnost ohraniti dolgotrajno analizo z večjo globino in doslednostjoTo je še posebej pomembno za svetovalna podjetja, revizorje ali raziskovalne skupine, ki delujejo v Evropi z dolgoročnimi projekti.
Iskanje orodij in učinkovitost uporabe orodij
Za razvijalce, ki gradijo na API-ju, je ena najbolj praktičnih novih funkcij Iskanje orodijDo sedaj so morali modeli prejeti definicijo vseh razpoložljivih orodij znotraj konteksta, kar je znatno povečalo porabo žetonov v sistemih, bogatih s funkcijami. Z iskanjem orodij lahko GPT-5.4 dinamično iskanje orodja, ki ga potrebujete vedno se posvetujte le z bistvenimi informacijami.
V testih z 250 primerjalnimi nalogami MCP Atlas, pri katerih je bilo uporabljenih 36 različnih strežnikov orodij, je ta oblika dinamičnega dostopa dosegla zmanjšati skupno porabo žetonov za približno 47 %hkrati pa ohranja enako raven natančnosti. Za evropska podjetja, ki oblikujejo platforme za agente z ducati mikrostoritev, od sistemov za obračunavanje do internih CRM in ERP, se ta izboljšava odraža v Nižji obratovalni stroški in hitrejši odzivni časibrez žrtvovanja kompleksnosti delovnih procesov.
Profesionalna uspešnost: iz pisarne v preglednico
Poleg tehničnih naslovov je GPT-5.4 izrecno zasnovan za naloge strokovno znanjeV testu BDPval, ki meri sposobnost agentov umetne inteligence za opravljanje resničnega dela v 44 različnih poklicih, novi model v 83 % primerjav doseže ali preseže človeške strokovnjakeTe vrste nalog segajo od priprave poslovnih predstavitev do osnovnih finančnih analiz ali pisanja pravnih dokumentov.
OpenAI še posebej izpostavlja izboljšave pri delu s preglednicami in predstavitvami. V internem primerjalnem testu finančnega modeliranja GPT-5.4 dosega rezultat 87,3 %, pred 68,4 % GPT-5.2Za evropske banke, zavarovalnice ali fintech podjetja, ki obdelujejo kompleksne modele v Excelu ali enakovrednih orodjih, lahko ta razlika pomeni preskok med podpornim orodjem in asistentom, ki je sposoben opravljati naloge mlajšega analitika z omejenim nadzorom.
Na področju predstavitev so človeški ocenjevalci dajali prednost V 68 % primerov so bili diapozitivi ustvarjeni z GPT-5.4 V primerjavi s predhodnikom ponuja znatne izboljšave tako v estetiki kot vizualni raznolikosti. Tovrstne izboljšave so popolnoma primerne za vsakodnevno delo prodajnih, marketinških in svetovalnih ekip v Španiji, kjer lahko priprava jasne in dobro strukturirane predstavitve zahteva veliko ur dela.
Manj napak, večja zanesljivost pri dolgih odgovorih
Ena od pogostih kritik prejšnjih modelov je bila njihova nagnjenost k "halucinacijam", torej k izmišljanju podatkov ali nezanesljivemu mešanju virov. OpenAI trdi, da je GPT-5.4 33 % manj verjetno je, da bodo dajali lažne izjave da GPT-5.2 in da so njegovi popolni odgovori 18 % manjša verjetnost, da bodo vsebovale napakeTe številke, čeprav izhajajo iz internih testov, kažejo, da je umetna inteligenca bolj primerna za regulirane sektorje, kot so ... finančne ali zdravstvenekjer lahko vsaka napačna informacija povzroči resen problem.
Kombinacija veliko širšega kontekstualnega okna, razširjenega načina sklepanja in možnosti prekinitve procesa sredi postopka za njegovo korekcijo prispeva k večji zanesljivosti. Za odvetniško pisarno v Madridu ali svetovalno podjetje v Bruslju možnost pregleda "načrta napada" modela, preden konča s pripravo celotnega poročila, omogoča pravočasno odkriti odstopanja ali slabe pristopebrez zapravljanja virov ali časa za naknadni pregled.
Programiranje in zmogljivost v tehničnih merilih uspešnosti
Na področju razvoja programske opreme GPT-5.4 podeduje zmogljivosti GPT-5.3-Kodeks In po mnenju OpenAI se v zahtevnih testih, kot so ..., izenačuje ali celo prekaša. SWE-Bench Pro z nižjo zakasnitvijo. Izboljšave rezultatov niso spektakularne (govorimo o zmernem skoku v odstotku rešenih incidentov), vendar kombinacija kode, sklepanja in uporabe izvornega računalnika v enem samem modelu predstavlja zanimiv scenarij: agenti, ki Berejo repozitorije kode, spreminjajo datoteke in testirajo spremembe v resničnih okoljih.vse znotraj istega toka.
Za evropske razvijalce, ki integrirajo GPT-5.4 prek API-ja, morda ključ ni toliko natančna referenčna vrednost, temveč dejstvo, da model rešuje podobne naloge z uporabo manj žetonovOpenAI vztraja, da je GPT-5.4 njihov doslej najučinkovitejši sistem sklepanja z vidika žetonov, kar pomeni, da lahko do istega zaključka pride z manj "internimi besedami". Za podjetja, ki plačujejo na žeton, lahko ta učinkovitost več kot izravna povečano pristojbino na milijon žetonov.
Brskanje po spletu in kompleksna iskanja
Drugo področje, kjer GPT-5.4 izboljšuje svoje predhodnike, je spletna interakcija. V primerjalnih testih, kot so Brskaj po CompuNovi model, osredotočen na spletno iskanje in raziskovalne naloge, dosega približno 82,7%, pred 65,8 % GPT-5.2OpenAI trdi, da je GPT-5.4 še posebej dober pri ... prepoznati ustrezne informacije med velikimi količinami podatkov, tako imenovanimi poizvedbami "igla v senu".
Za evropske novinarje, tržne analitike in raziskovalce ta zmogljivost pomeni, da lahko del dela pri pregledovanju informacij prenesejo na umetno inteligenco, hkrati pa ohranijo nadzorno in končno preverjalno vlogo. Model lahko sledi več virom, izbere tiste, ki se zdijo najbolj zanesljivi, in ponudi utemeljen povzetek, s čimer skrajša čas, porabljen za ponavljajoča se iskanja.
Višje cene, a tudi večja učinkovitost
Kar zadeva ceno, je GPT-5.4 v primerjavi z GPT-5.2 dražji. Standardni model stane 2,50 $ na milijon vhodnih žetonov in 15 $ na milijon izhodnih žetonov, v primerjavi z 1,75 USD oziroma 14 USD za GPT-5.2. Različica GPT-5.4 Pro Je precej dražje: 30 $ na milijon vhodnih žetonov in 180 $ na milijon izhodnih žetonov, številke so očitno usmerjene v poslovne projekte z visoko dodano vrednostjo.
OpenAI te pristojbine brani s sklicevanjem na večja učinkovitost pri porabi žetonov in pri zmanjševanju napak. Če model za opravljanje iste naloge zahteva bistveno manj žetonov in hkrati naredi manj napak, ki zahtevajo ročno popravljanje, so lahko skupni stroški na projekt nižji tudi z višjo ceno žetona. Za velike račune v Evropi, od sistemskih bank do večjih industrijskih skupin, razprava ni več toliko o nominalni ceni na milijon žetonov, temveč o skupnih stroških avtomatizacije procesov z zagotovljenimi rezultati.
Izstrelitev sredi polemik in hude konkurence
GPT-5.4 se ne pojavi iznenada. Pride sredi zelo tesna konkurenca z Anthropicem in GooglomSredi medijske mrzlice okoli sporazumov OpenAI s Pentagonom, medtem ko si je Anthropic pridobil na veljavi v poslovnem segmentu z modeli, kot je Claude Opus 4.6, in bolj varnostno osredotočenim pristopom, Google konkurira s svojo družino Gemini in naprednimi multimodalnimi zmogljivostmi. V tem kontekstu si GPT-5.4 prizadeva, da bi se pozicioniral kot referenčni model v agentna zmogljivost, uporaba računalnika in dolgoročni kontekst.
Hkrati gibanje sledi kampanjam, kot je #PrekličiKlepetGPT in Izhod izGPTZaradi teh dejanj so več sto tisoč ljudi preklicali svoje naročnine ali na družbenih omrežjih napovedali bojkot. Zaznavanje, da je OpenAI sprejel vojaško pogodbo brez zadostnih zaščitnih ukrepov, medtem ko jo je Anthropic zavrnil, je spodkopalo del ugleda podjetja. V Evropi, kjer razprava o etični uporabi umetne inteligence in njeni regulaciji napreduje z okviri, kot je prihajajoči zakon o umetni inteligenci, se ti sporazumi spremljajo s posebno pozornostjo.
Stroški infrastrukture in pritisk na dobičkonosnost
Za vsako novo različico GPT se skriva manj vidna resničnost: stroški delovanja vedno večjih modelov z gigantskimi kontekstnimi okni. OpenAI obravnava večmilijonske številke v izdatki za infrastrukturo in računalništvoz napovedmi znatnih izgub v prihodnjih letih kljub znatni rasti prihodkov. Model, kot je GPT-5.4, ki lahko obdela do milijon žetonov in ima načine sklepanja, ki lahko trajajo več ur, zahteva precejšnjo računalniško moč na zahtevo.
Da bi omejili te stroške, podjetje stavi na lastniška ali specializirana strojna oprema in prek sporazumov z večjimi ponudniki storitev v oblaku. Prav tako segmentira svoj katalog v več nivojev (Instant, Thinking, Pro, Codex), da prilagodi, koliko procesne moči dodeli posamezni vrsti zahteve. Uvedba nastavljivih načinov v GPT-5.4, ki uporabnikom omogočajo izbiro med hitrejšimi, cenejšimi odgovori ali poglobljeno analizo, je skladna s tem poskusom uravnoteženja zmogljivosti in stroškovne učinkovitosti. V Evropi, kjer so podatkovni centri in poraba električne energije pod regulativnim nadzorom, ta vrsta modela ponovno spodbuja razpravo o vplivu umetne inteligence na energijo.
Proti novi normalnosti: agenti, varnost in nenehne spremembe
Poleg tehničnih specifikacij GPT-5.4 krepi trend, ki se je že pojavljal: prehod s klepetalnih robotov na avtonomne agenteKombinacija izvorne uporabe računalnika, dolgoročnega upravljanja konteksta in dinamičnih orodij kaže na sisteme, ki so sposobni upravljati celotne procese z občasnim človeškim posredovanjem. Analitska podjetja napovedujejo, da bo do konca leta 2026 znaten del velikih korporacij uporabljal arhitekture, ki temeljijo na agentih, iz serije GPT-5.x za kritične naloge, od storitev za stranke do notranjega upravljanja dokumentov.
Ta poteza prinaša neprijetna vprašanja o varnost in nadzorČe lahko model deluje več ur, pri čemer je treba pregledovati občutljive podatke in izvajati ukrepe v notranjih sistemih, morajo biti mehanizmi spremljanja in varnostne ovire veliko bolj robustni. Glasovi znotraj in zunaj industrije, vključno z evropsko raziskovalno skupnostjo, že dolgo opozarjajo, da tekma za izdajo vse zmogljivejših modelov ne more prehiteti razvoja učinkovitih zaščitnih ukrepov.
Z GPT-5.4 poskuša OpenAI dokazati, da lahko ponudi več moči, večjo avtonomijo in večjo učinkovitost brez ogrožanja zanesljivosti. Model se izboljšuje v merilih uspešnosti, zmanjšuje napake, uporablja manj žetonov in je sposoben nemoteno upravljati računalnik, vendar se sooča tudi z etičnimi dilemami, konkurenčnim pritiskom in dvomi o ekonomski vzdržnosti tega tempa inovacij. Za podjetja in strokovnjake v Španiji in preostali Evropi vprašanje ni več le, ali je tehnologija impresivna, ampak ... kako ga odgovorno vključiti v svoje vsakdanje življenje, z jasnimi koristmi in obvladljivimi tveganji.
