Googles neuer KI-Bildgenerator: Was kann der ImageFX?

Björn Schneider
Björn Schneider

Am

Kann Googles ImageFX mit OpenAIs Dall-E konkurrieren? Wir schauen uns ImageFX genauer an und fassen die bisherigen Erkenntnisse zusammen.

Googles KI-Bildgenerator will es unter anderem leichter machen, Zeichnungen, Grafiken und Bilder in einen anderen Stil zu überführen.
Googles KI-Bildgenerator will es unter anderem leichter machen, Zeichnungen, Grafiken und Bilder in einen anderen Stil zu überführen. - Depositphotos

Mit einer beeindruckenden Menge an Daten bringt Google seinen neuen KI-gestützten Bildgenerator auf den Markt. Die bisher veröffentlichten Bilder von ImageFX sind atemberaubend detailliert und zeigen ein tiefes Verständnis für den Kontext.

Aber wie genau funktioniert das Programm eigentlich? Gleich vorweg: Im Grunde genommen arbeitet ImageFX ähnlich wie andere Kunstgeneratoren, die auf künstlicher Intelligenz basieren.

Es beginnt mit einer riesigen Datenbank voller Bilder, die als Trainingsgrundlage dienen. Woher diese Daten genau stammen, bleibt Googles Geheimnis – wahrscheinlich ein Mix aus internen Quellen, Web Scraping und UGC-Inhalten.

Was macht Googles ImageFX so besonders

Eine Besonderheit von ImageFX ist die Funktion «expressive Chips». Damit können Nutzer ihre Suchanfragen schnell bearbeiten und gleichzeitig etwas Neues ausprobieren.

Mann an seinem heimischen Arbeitsplatz
Mit den «expressiven Chips» erlaubt ImageFX spielend leicht die Umwandlung in einen anderen Mal- oder Kunststil. Und das ohne komplexe Prompts oder Anweisungen. - Depositphotos

Wer beispielsweise nach einem Frauenporträt sucht, kann dieses in Sekundenschnelle in ein abstraktes Bild, eine Handzeichnung oder ein Ölgemälde verwandeln. Ausserdem ist ImageFX derzeit kostenlos verfügbar – zumindest in den Ländern, in denen es bereits eingeführt wurde.

Das alles macht ImageFX zu einer attraktiven Alternative zu Konkurrenten wie Midjourney und Dall-E. Zumal diese Dienste grösstenteils hinter Paywalls verborgen sind.

Digitales Wasserzeichen soll Missbrauch vorbeugen

Eine Herausforderung für alle grossen Tech-Unternehmen im Bereich KI-Kunst ist die Neigung des Menschen zu unangemessenem Verhalten. Frühere KI-Kunstgeneratoren zeigten sexistische und sehr häufig unangemessene grafische Bilder voller Vorurteile.

Probleme, die auch Google mit ImageFX angehen will. Alle von ImageFX generierten Bilder werde man mit SynthID kennzeichnen, erklärte das Unternehmen.

Dieses von Google DeepMind entwickelte Tool fügt ein digitales Wasserzeichen direkt in den generierten Inhalt ein.

Googles Pläne für Bard und Gemini

Neben ImageFX arbeitet Google an seinem Chatbot Bard – dem grössten Konkurrenten des KI-Chatbots ChatGPT. Google will diese Technologien kombinieren und so ein nahezu omnipotentes KI-Modell schaffen – wie OpenAI es mit ChatGPT und Dall-E plant.

Google will die verschiedenen KI-Technologien zusammenbringen und so ein KI-Modell der Superlative kreieren.
Google will die verschiedenen KI-Technologien zusammenbringen und so ein KI-Modell der Superlative kreieren. - Depositphotos

Mit dem Google-Gemini-System könnte eine Plattform entstehen, auf der man ein Modell beispielsweise bitten könnte, ein Brettspiel zu erstellen. Inklusive Regeln und Hintergrundgeschichte sowie allen Bildern, dem Spielbrett und weiterem Inhalt.

Oder alternativ eine Buchreihe, und dazu gleich mit den passenden Illustrationen. Schöne, neue KI-Kunstwelt.

Mehr zum Thema:

Weiterlesen