Google DeepMind hat das innovative Werkzeug SynthID entwickelt, das zur Erkennung von durch KI generiertem Text dient. Nun stellt das Unternehmen diese Technologie als Open Source zur Verfügung. Die SynthID-Technologie beinhaltet eine Reihe von Wasserzeichen-Tools, die speziell für KI-generierte Inhalte konzipiert sind.
fest / Quelle: vadian.ai / Mittwoch, 27. November 2024 / 15:30 h
Im vergangenen Jahr präsentierte Google ein Wasserzeichen für Bilder, die von KI erstellt wurden; inzwischen wurde auch ein Wasserzeichen für generierte Videos implementiert. SynthID findet Anwendung in der Gemini-App sowie in den Online-Chatbots von
Google DeepMind. Das Unternehmen hat die Technologie auf
Hugging Face veröffentlicht, damit andere Entwickler im Bereich KI diese effektiv nutzen und weiterentwickeln können.
Angepasste Wahrscheinlichkeitsbewertungen
In einem Artikel in '
Nature' hat Google DeepMind umfassendere Informationen zu dieser bahnbrechenden Technologie bereitgestellt. SynthID nutzt die Tokenisierung in generierten Texten: Ein grosses Sprachmodell (LLM) erzeugt den Text Token für Token, wobei ein Token ein Zeichen, ein Wort oder auch ein ganzer Satz darstellen kann. Beispielsweise könnte ein Satz wie «Meine liebsten tropischen Früchte sind?» durch ein LLM mit Wörtern wie «Mango», «Papaya» oder «Litschi» vervollständigt werden, erklärt DeepMind. Jedem Token wird eine Wahrscheinlichkeitsbewertung zugeordnet. SynthID hat die Fähigkeit, diese Wahrscheinlichkeitsbewertung jedes vorhergesagten Tokens zu modifizieren, ohne dass sich der Inhalt verändert.
Google mahnt: SynthID hat Schwierigkeiten mit kurzen Texten sowie mit umgeschriebenen oder übersetzten Inhalten. /


Dieser Prozess wird über den gesamten generierten Text hinweg wiederholt; somit kann ein einzelner Satz mehrere angepasste Wahrscheinlichkeitswerte aufweisen. Das Muster dieser Bewertungen wird als Wasserzeichen betrachtet.
Wasserzeichen können umgangen werden
DeepMind betont, dass das System keine negativen Auswirkungen auf die Qualität, Genauigkeit, Kreativität oder Geschwindigkeit der Ausgaben hat. Die Erkennung funktioniert bereits bei Texten mit einer Länge von drei Sätzen. Dennoch warnt DeepMind: SynthID ist kein Allheilmittel zur Identifizierung von KI-generierten Inhalten. Das System hat Schwierigkeiten mit kurzen Texten sowie mit umgeschriebenen oder übersetzten Inhalten. Auch OpenAI untersucht Methoden zur Kennzeichnung von KI-Texten mit Wasserzeichen, hat jedoch bislang auf eine Veröffentlichung verzichtet ? unter anderem aus technischen Gründen.
Die Entwicklung von SynthID ist ein bedeutender Schritt in der Transparenz und Nachvollziehbarkeit von KI-generierten Inhalten. Es ist wichtig, solche Technologien weiterzuverfolgen und zu implementieren, um die gesellschaftlichen Auswirkungen der künstlichen Intelligenz verantwortungsvoll zu gestalten. Nutzen Sie diese Gelegenheit, um sich über die neuesten Entwicklungen im Bereich der KI-Kennzeichnung zu informieren und tragen Sie aktiv zur Weiterentwicklung bei!