Google hat zahlreiche neue KI-Tools vorgestellt
20. Mai 2025 um 20:09:19
Michael Förtsch
Auf seiner Konferenz Google I/O 2025 hat Google zahlreiche neue Projekte angekündigt. Vor allem im Bereich der Künstlichen Intelligenz. Dazu gehören Gemini 2.5, das neue Spitzensprachmodell des Technologie- und Werbeunternehmens, sowie die Integration von Gemini in Chrome. Ebenso wurde die vierte Version des Bildmodells Imagen enthüllt, das nun deutlich komplexere Szenen und zuverlässig gut lesbaren Text liefern kann. Mit Veo 3 wurde weiters ein neues Videomodell angekündigt, das nicht nur optisch realistischere Szenen generieren kann, sondern auch gleich Klang und Sprache. Mit Flow arbeitet Google zudem an einem Video-Tool, das KI-Videoclips nahtlos zu Szenen zusammensetzen soll.
Lyra 2 wiederum ist ein neuer Musik-Generator. Wer ihn testen möchte, muss sich auf eine Warteliste setzen lassen. Zudem will das Unternehmen demnächst mit US-Nutzern seines Search-Lab-Programms ein Werkzeug erproben, mit dem diese Kleidung aus der Google-Produktsuche virtuell anprobieren können, indem sie ein Bild von sich hochladen. Ein weiteres Experiment ist Gemini Diffusion, ein Sprachmodell, dessen Technik sich an den Text-zu-Bild-Modellen wie Stable Diffusion orientiert. Hier soll Text aus einem digitalen Rauschen erzeugt werden. Dies soll Nutzern mehr Kontrolle ermöglichen und das Erstellen kreativerer und „natürlicherer” Texte erlauben.