Google lancerer ny Omni-model og personlig AI-agent i Gemini



Fra information til handling: Google har netop på den årlige I/O-konference løftet sløret for et markant boost til Gemini, som får en helt ny brugerflade, agent-funktion og en ny visuel AI-model, der forvandler enhver idé til filmiske videoer.

AI-assistenten Gemini har det seneste år været i kraftig vækst, så der nu er 900 millioner brugere af appen på verdensplan, mere end dobbelt så mange som samme tid sidste år.

Og nu får Gemini et kraftigt løft - både indholdsmæssigt og visuelt. På den årlige I/O-konference har Google netop annonceret en række opdateringer, der vil gøre Gemini mere personlig, mere agentisk og mere visuelt appellerende.

Gemini Omni: En ‘flydende’ AI-model

Sidste år tog Google billedredigering til et nyt niveau med den såkaldte Nano Banana-model. Nu kommer Gemini Omni, det næste niveau af visuelle AI-modeller, som kan skabe et hvilket som helst output ud fra et hvilket som helst input, startende med video.

I modsætning til de fleste AI-systemer, der opererer i ‘kasser’ - fx forvandling af et billede til tekst eller tekst til lyd - lader den nye model dig bruge enhver kombination af forskellige input for at skabe fx videoindhold i høj kvalitet. Det er en flydende, samtalebaseret måde at skabe indhold på - fx via stemmen at tilføje filmiske zooms eller ændre baggrunde, alt imens fx personer fremstår uændrede. Gemini Omni opbygger ikke bare scener, der ser virkelige ud - de giver også mere mening, fordi de trækker på Geminis dybe forståelse af verden, fysikkens love osv.

Gemini Omni rulles ud til Google AI-abonnenter startende i dag. Læs meget mere om Gemini Omni her.

Ny agentfuntion gør arbejdet for dig

Chatbotten får også en ny agentfunktion kaldet Gemini Spark. Det er en personlig AI-agent, der 24/7 står klar til at hjælpe med at navigere det digitale liv døgnet rundt. Ikke bare ved at besvare spørgsmål, men også ved at gøre arbejdet på dine vegne.

Gemini Spark kan eksempelvis bruges til:

  • At løse faste opgaver: Fx at finde mønstre og røde flag i dine månedlige kreditkortudskrifter.
  • At huske og agere for dig: Fx at tjekke indbakken for bestemte mails og deadlines og sende dig et samlet dagligt overblik.
  • Skabe hele workflows: Fx at samle rå mødenotater fra mails og chats til gennemarbejdede dokumenter og handlingsplaner.

En anden ny funktion er ‘Daily Brief’, der hver morgen samler alt det vigtigste og giver dig overblik over dagens gøremål.

Både Spark og Daily Brief begynder i USA og ruller ud til flere lande i den kommende tid.

Nyt design

Gemini er blevet redesignet fra bunden i et nyt designsprog, hvor brugerfladen nu byder på flydende animationer, levende farver, nye skrifttyper og haptisk feedback.

Gemini Live-samtaler integreres direkte i Gemini, så du problemfrit kan skifte mellem at skrive et hurtigt spørgsmål og dykke dybere ned i en naturlig samtale. Også mikrofonen er blevet genopfundet, så man kan trykke og tale sig gennem sine tanker i eget tempo.

Det nye design er også udviklet til at gøre svarene mere engagerende og lettere at forstå. I stedet for massive tekstblokke, vil de fremover også indeholde fx billeder, tidslinjer, fortællende videoer eller interaktive billeder med flere lag.

Brugere over hele verden kan opleve ‘Neural Expressive’, som det nye designsprog hedder, i dag på både web, Android og iOS.