OpenAI udruller GPT-4.1 og dens "mini"-version i ChatGPT. På programmet: en AI, der er mere dygtig til kode, som går lige til sagen og som svarer til professionelles behov, alt sammen baseret på brugernes feedback.
Er du træt af kunstig intelligens, der, når du beder dem om hjælp til kodning, begynder at give endeløse forklaringer eller taber sig i gisninger? OpenAI, virksomheden bag ChatGPT, ser ud til at have hørt udviklernes og virksomhedernes bønner om effektivitet. De har netop integreret GPT-4.1 og dens lillebror, GPT-4.1 mini, i deres berømte chatbot. Og løftet er tiltrækkende: en mere effektiv AI, mere direkte, og ikke mindst designet til de konkrete behov i den professionelle verden. Vi gennemgår det for dig.
24/05/2025 14:48 JérômeOprindeligt var GPT-4.1 lidt som et professionelt værktøj, reserveret til udviklere, der brugte det via en såkaldt API (Application Programming Interface – forestil dig en slags speciel stik, der gør det muligt for forskellige programmer at kommunikere og arbejde sammen). Men man havde ikke regnet med testernes entusiasme! Michelle Pokrass, ansvarlig for efteruddannelsesforskning hos OpenAI, bekræftede det på X (tidligere Twitter): »Vi havde oprindeligt planlagt at beholde denne model kun til API'en, men I ville alle have den i ChatGPT :) god kodning!«. Et fint eksempel på, hvordan brugerfeedback kan påvirke strategien hos en tech-gigant.
Således er GPT-4.1 nu tilgængelig for betalende abonnenter af ChatGPT (Plus, Pro og Team), og GPT-4.1 mini bliver endda standardmodellen for alle, inklusive brugere af den gratis version, og erstatter den tidligere GPT-4o mini.
Google I/O 2025: Når AI rydder din indbakke og handler for dig
GPT-4.1's store styrke er dens evne til at »følge instruktioner« og at udmærke sig i »kodningsopgaver«, som Kevin Weil, produktchef hos OpenAI, har understreget. Og tallene taler for sig selv: ifølge offentliggjorte data viser GPT-4.1 en forbedring på 21,4 point sammenlignet med GPT-4o på SWE-bench Verified (en standardiseret test til evaluering af softwareingeniørkompetencer) og en stigning på 10,5 point på Scale MultiChallenge for instruktionsfølgelse.
En anden fordel, og ikke den mindste for dem, der søger korte svar: GPT-4.1 skulle være 50 % mindre »ordrig« end andre modeller. Slut med unødvendigt »pladder« – AI'en kommer direkte til sagen! Det er i øvrigt en egenskab, som virksomhedsbrugere særligt skulle have sat pris på under de foreløbige tests. Denne model betegnes som »ikke-ræsonnerende«, hvilket betyder, at den er optimeret til effektivitet og præcision i udførelsen af specifikke opgaver, snarere end bred tænkning eller ukontrolleret kreativitet. Det er lidt som den ideelle medarbejder: flittig og direkte.
For at forstå, hvordan denne AI fungerer, er vi nødt til at tale om tokens og kontekstvindue. Tokens er lidt som AI'ens sprogklodser – stykker af ord eller sætninger. Kontekstvinduet er den mængde af disse tokens, som AI'en kan »huske« under en samtale for at forstå og svare sammenhængende. I ChatGPT bruger GPT-4.1 standardkontekstvinduer: 8.000 tokens for gratisbrugere, 32.000 for Plus-abonnenter og 128.000 for Pro-brugere. Interessant nok kan API-versionen af GPT-4.1 håndtere op til en million tokens – en kapacitet, der måske en dag kan komme til ChatGPT og muliggøre analyse af enorme dokumenter eller kodedatabaser.
På sikkerhedssiden har OpenAI lanceret et »Safety Evaluations Hub« for større gennemsigtighed. GPT-4.1 viser gode resultater her, blandt andet med en score på 0,99 på OpenAI's »not unsafe«-mål (ikke farlig) og 0,86 på mere udfordrende forespørgsler. Den opnår en solid 0,96 mod forsøg på jailbreak (teknikker til at tvinge AI'en til at omgå sine sikkerhedsregler) fra mennesker. Den er dog mindre effektiv (0,23) på en meget specifik akademisk jailbreak-test kaldet StrongReject, hvilket indikerer en udviklingsmulighed under ekstreme forhold.
Capgemini, SAP og Mistral AI: den nye alliance for generativ AI under strengt opsyn
Denne nye version kommer efter GPT-4.5, en model, der trods at være mere avanceret på nogle områder som reduktion af »hallucinationer« (når AI'en opfinder fakta), var blevet kritiseret for sin høje pris og kodepræstationer, som nogle fandt skuffende i forhold til andre OpenAI-modeller. GPT-4.1 positionerer sig derfor som et hurtigere og mere målrettet alternativ, især til udvikling.
På prissiden tilbydes GPT-4.1 via API'en til 2,00 USD pr. million tokens i input og 8,00 USD i output, mens mini-versionen er langt mere overkommelig. Det er dyrere end nogle konkurrenter som Googles Flash-modeller, men OpenAI fremhæver de overlegne præstationer på kodetests og præcis instruktionsfølgelse, hvilket potentielt er afgørende for virksomheder.
Vidste du det?
GPT-4.1's særpræg er, at den er en såkaldt »ikke-ræsonnerende« model. I modsætning til AI'er designet til at udforske ideer eller generere meget kreativ tekst, er GPT-4.1 optimeret til at følge præcise instruktioner og levere faktuelle og direkte resultater, især inden for kodning. Det er lidt forskellen mellem en alsidig kunstner og en højt specialiseret og effektiv håndværker inden for sit felt.
Overdrevne høflige AI? Den nye benchmark, der måler deres tilbøjelighed til at smigre.
Ankomsten af GPT-4.1 er gode nyheder for flere tech-fag:
Kort sagt præsenterer GPT-4.1 sig som en solid mulighed for virksomheder, der ønsker at balancere præstation og operationelle krav.
Med GPT-4.1 søger OpenAI ikke nødvendigvis at skabe den mest »intelligente« model i bred forstand, men snarere den mest nyttige og effektive til specifikke opgaver, især i erhvervslivet. Det illustrerer en mere generel tendens: at gøre avanceret AI mere tilgængelig, tilpasningsdygtig og klar til produktion. Ved at fokusere på præcision, effektivitet og omkostninger tilbyder OpenAI en klarere vej til integration af AI i virksomheders daglige drift.
Så, er du klar til at briefe din nye virtuelle kollega GPT-4.1, så den kan producere fejlfrie kodelinjer uden at gøre noget væsen af det? Det ser ud til, at AI'en er mindre og mindre af en diva og mere og mere en flittig håndværker!
Jerome
Ekspert i webudvikling, SEO og kunstig intelligens, min praktiske erfaring med at skabe automatiserede systemer går tilbage til 2009. I dag, udover at skrive artikler for at afkode aktualiteter og udfordringer inden for AI, designer jeg skræddersyede løsninger og fungerer som konsulent og underviser for en etisk, effektiv og ansvarlig AI.