En bølge af nye funktioner fra Google: dens AI-genererede billeder, videoer med lyd og musik på kommando. Et helt kreativt værksted i din computer? Hold fast, det er virkelig revolutionerende!
Kan du huske tiden (ikke så længe siden), hvor det at lave en poleret video krævede timer af redigering, eller at komponere original musik næsten krævede en medfødt talente og år af musikteori? Glem (næsten) alt det! Under sin årlige store begivenhed, Google I/O 2025, præsenterede kæmpen fra Mountain View en hel arsenal af kunstig intelligens (AI)-værktøjer, der er klar til at forvandle vores kreative indfald til næsten øjeblikkelige værker. Så, er AI det nye magiske pensel i det 21. århundrede? Vi fortæller dig alt.
24/05/2025 19:48 JérômeLad os starte fra begyndelsen: billedet. Google har præsenteret Billede 4, deres nye flagskib inden for AI-genererede billeder. Ifølge oplysninger fra TechCrunch og The Verge, overgår denne version sine forgængere, især i sin evne til at forstå komplekse tekstinstruktioner (de berømte "prompts") og generere billeder med imponerende fotorealisme. Ikke flere seks fingre eller ulæselig tekst i billederne! Billede 4 lover en bedre håndtering af fine detaljer som hænder, ansigter og især en forbedret evne til at integrere læselig tekst direkte i billederne. Det er lidt som om, at din personlige tegner endelig forstår dine mest besværlige ønsker på første forsøg.
PINMAP: Den AI, der lærer robotter ikke længere at fare ind i møblerne (gennemsigtig)
Men Google stopper ikke ved stillestående billeder. Hold fast: Veo 3 er på vej med ambitionen om at revolutionere videokreation. Ifølge TechCrunch nøjes denne AI ikke med at generere videosekvenser fra en simpel beskrivende tekst; den kan nu også tilføje et originalt lydspor! Forestil dig: du beskriver en jagtscene i regnen, og Veo 3 producerer ikke kun de animerede billeder, men også den spændende musik og de passende lydeffekter. Denne evne til at generere både billede og lyd på en sammenhængende måde er et stort fremskridt, der potentielt kan gøre enhver bruger til en aspirerende filminstruktør og komponist.
Har du allerede videoer, men synes redigering er skræmmende? Google har tænkt på dig med Flow. Præsenteret af TechCrunch og The Verge som et AI-assisteret videoredigeringsværktøj, giver Flow dig mulighed for at redigere dine værker via tekstkommandoer. "Gør denne scene lysere", "accelerer dette afsnit", "tilføj en dramatisk effekt her"... Flow er lidt som din AI-forstærkede redaktionsassistent, der forstår naturligt sprog for at finjustere dine værker.
Og for dem, der har brug for skræddersyet baggrundsmusik uden en komplet video, har Google også afsløret Lyria Realtime. Som nævnt af TechCrunch, er denne AI-model i stand til at generere musik i realtid og vil være tilgængelig via en API (en applikationsprogrammeringsgrænseflade, simpelt sagt en indgang for andre software til at bruge denne teknologi). Har du brug for lidt baggrundsmusik til din podcast eller præsentation? Lyria kunne godt blive din personlige ekspreskomponist.
ZeroSearch: Alibabas AI, der lærer at søge uden Google – kunne det være en revolution?
Du hører om generativ AI overalt, men hvad er det egentlig? Det er en gren af kunstig intelligens, hvor algoritmer ikke kun analyserer data, men skaber originalt indhold: tekst, billeder, musik, videoer... Lidt som en ekstremt talentfuld kok, der kan opfinde en opskrift (og lave den) ud fra nogle få ingredienser (dine instruktioner), du giver dem. Modeller som Billede 4 eller Veo 3 er perfekte eksempler på denne teknologi i aktion.
For at interagere med disse nye digitale muser er der et nøgleord: prompt. Det er anmodningen, den tekstinstruktion, du giver AI'en for at den kan generere det, du har i tankerne. "En rød killinge, der sover på en stak gamle bøger, i oliemaleristil". Kvaliteten og præcisionen af din prompt er afgørende. Det er lidt som at give meget præcise instruktioner til en tegner eller musiker: jo klarere og mere detaljeret du er, desto bedre (og tættere på dine forventninger) bliver resultatet. Et nyt job i horisonten: "promptolog"?
Et andet koncept, der fremhæves i Googles meddelelser, er multimodalitet. Bag dette lidt barbariske udtryk gemmer sig en simpel idé: AI'ens evne til at forstå og generere forskellige typer indhold (tekst, billede, lyd, video) og få dem til at interagere. Veo 3, der genererer en video og dens lydspor, er det perfekte eksempel. Det er som en schweizisk lommekniv for digitale kunstnere, hvor hver "klinge" (billede, lyd, video) kan arbejde alene eller harmonisk sammen med de andre.
Den massive tilstrømning af disse værktøjer rejser et spændende spørgsmål: demokratiseringen af kreativitet. Med AI'er, der kan håndtere de mest tekniske aspekter, sænkes barrieren for at producere kvalitetsindhold betydeligt. Ifølge rapporterede oplysninger lader Google til at sigte mod en "forstærkning" af menneskers kreative evner. Men risikerer denne nye lethed ikke at standardisere produktioner eller omdefinere kunstnerens rolle? Debatten er i gang, og den lover at være lige så levende som videoerne genereret af Veo 3.
AI-musik: en milliard afspilninger, nul fans og en (ulovlig?) jackpot på 10 millioner dollars
Vidste du det?
Modeller som Billede 4 er ikke kun bedre til fotorealisme, men også til at fortolke særligt lange og nuancerede prompts, hvor tidligere generationer nogle gange kunne "miste tråden". En gave for kræsne kreative!
Med denne nye bølge af AI-værktøjer nøjes Google ikke med at tilføje gadgets til sit arsenal: firmaet fra Mountain View tegner konturerne af en fremtid, hvor skabelsen af digitalt indhold (billeder, videoer, musik) kunne blive lige så enkelt som at skrive en e-mail (næsten!). AI positionerer sig i stigende grad som en superkraftfuld kreativ copilot, klar til at give liv til vores vildeste ideer. Spørgsmålet er, hvordan vi mennesker vil tage disse nye tryllestave i brug.
Så, er du klar til at lade AI tilføje lidt glimmer (og en masse kode) til dine næste kreationer? Fremtiden lover at være levende, og det kunne godt være dig, der bliver den næste Spielberg... prompt-version!
Jerome
Ekspert i webudvikling, SEO og kunstig intelligens, min praktiske erfaring med at skabe automatiserede systemer går tilbage til 2009. I dag, udover at skrive artikler for at afkode aktualiteter og udfordringer inden for AI, designer jeg skræddersyede løsninger og fungerer som konsulent og underviser for en etisk, effektiv og ansvarlig AI.