KI & Technologie

Wenn dein Foto der Ausgangspunkt ist, nicht das Ziel

Image-to-Image (kurz: Img2Img) beschreibt einen KI-Generierungsprozess, bei dem nicht reines Rauschen, sondern ein bestehendes Bild als Startpunkt dient. Das Modell verändert dieses Bild kontrolliert – in Richtung eines Prompts oder Stils – und behält dabei strukturelle Informationen aus dem Original.

Technisch gesehen wird das Eingangsbild vor der Generierung zunächst mit Rauschen "angereichert" (nur teilweise, nicht vollständig wie bei Text-to-Image). Das Modell startet den Diffusionsprozess also nicht bei null, sondern bei einem Zwischenstand. Wie stark das Original das Ergebnis beeinflusst, steuert der sogenannte Denoise-Stärke-Parameter: Bei niedrigen Werten bleibt viel vom Originalfoto erhalten, bei hohen entsteht etwas vollkommen Neues. Dieses Prinzip nennt man auch Strength oder Conditioning.

In einem KI-Profilbild-Dienst kann Image-to-Image genutzt werden, um ein Basisfoto in einen anderen Stil zu überführen – etwa ein Urlaubsfoto in ein professionelles Business-Porträt. Profilbild.com setzt auf personalisiertes Modell-Training, um Identitätstreue zu maximieren, was über reines Img2Img hinausgeht.

Für dein Profilbild bedeutet das: Image-to-Image eignet sich gut, wenn du ein Foto hast, das strukturell passt, aber stilistisch nicht. Es ist aber kein Ersatz für qualitativ hochwertiges Training – wer sein genaues Aussehen zuverlässig reproduziert haben möchte, braucht den personalisierten Ansatz. Ein Missverständnis: Image-to-Image verändert immer etwas, auch wenn der Strength-Wert niedrig ist – es ist kein einfacher Filter.