Leistungen
Showroom
Wissen
Über uns
Kontakt

Gemini 3 Pro: Googles erste wirklich multimodale Denkmaschine

admin

18/11/2025

Kurzfassung: Gemini 3 Pro (November 2025) war der bisher deutlichste Sprung Googles: echte Multimodalität (Video + Audio + Bild + Text in einer Inferenz), über 1 Million Token Kontext und ein Reasoning-Level, das in vielen Benchmarks mit OpenAI o3 gleichzog.

Was Gemini 3 Pro ausmacht

Native Multimodalität: ein Prompt, ein Call – Video + Transkript + Bild werden gemeinsam verarbeitet.
1 Million Token Kontextfenster – reicht für ca. 750.000 Wörter oder mehrere Stunden Video.
Google-Search-Grounding eingebaut, optional über den API-Parameter `tools`.
Gleiche Familie wie die spezialisierten Image-/Video-Modelle (Nano Banana 2, Veo) – konsistente Markenführung.

Wofür es sich lohnt

Schulungen: Produktvideo als Input, Textzusammenfassung plus Screenshots als Output.
Customer-Support: Telefon-Mitschnitt + Kunden-E-Mail-Historie → strukturierte Fallakte.
Lokale Dienstleister: Foto vom Schaden + knapper Beschreibung → Angebotsentwurf.