Bildersuche mit KI

Um unter zigtausenden Fotos bestimmte Bilder aufzuspüren, kann man auf Schlagwörter zurückgreifen. Die KI kann Fotos aber auch ohne Schlagwörter anhand von Beschreibungen oder Bildbeispielen finden. Michael J. Hußmann erklärt, wie diese semantische Suche funktioniert.
Wenn in den letzten Jahren von Bildern und KI die Rede war, dann ging es meist um die generative KI, in diesem Fall also eine, die Bilder erzeugt. Dass solche KI-Systeme mit Myriaden aus dem Internet abgesaugter Fotos trainiert wurden, deren Charakteristika sich auch in den damit generierten Bildern wiederfinden – speziell wenn man im Prompt einen Fotografennamen vorgibt –, macht sie rechtlich wie ethisch heikel. Fotografen sehen ihre Urheberrechte und ihr Geschäftsmodell bedroht, wenn man sich Bilder in ihrem Stil einfach von einer KI generieren lassen kann.
Die künstliche Intelligenz kann aber auch bei der Verwaltung großer Bilddatenbestände helfen, die sich im Laufe eines Fotografenlebens ansammeln und schnell unüberschaubar werden. Auch die von …
Dieser Inhalt ist Teil unserer Premium-Inhalte von DOCMA2go.
Als Abonnent einloggen
DOCMA 2GO abonnieren
Das DOCMA-Magazin als wöchentliches E-Mail-Update. Mehr erfahren.
- Nur 3,99 EUR/Monat
Hallo Michael,
das ist interessant, aber kann denn ich so auch nach Bildern suchen, die eine bestimmte Person darstellen?
Gruß
Peter
Gute Frage … Im Prinzip schon, denn man könnte ja argumentieren, dass Bilder zweier Menschen immer dann besonders ähnlich wären, wenn es Bilder derselben Person sind. Nur trifft das ja nicht immer zu, denn schon eine unterschiedliche Kleidung oder eine andere Frisur machen die Bilder wieder weniger ähnlich, und dann verändern sich Menschen ja auch mit den Jahren. Man müsste damit rechnen, dass ein ähnlich alter Mensch mit ähnlicher Kleidung vermeintlich als dieselbe Person erkannt würde, obwohl er nicht ist, während derselbe Mensch in jungen Jahren nicht erkannt würde. Eine Personenerkennung muss sich daher auf Merkmale beschränken, die möglichst unveränderlich sind – was eine generelle semantische Suche nicht tut.
In Peakto oder Excire Search funktioniert die KI-basierte Personensuche bereits ziemlich gut. Michaels Bedenken bezüglich Altersveränderung interessieren diese beiden KIs dabei eher wenig. Ich kann das zumindest für die gefundenen Bilder von mir selbst über die letzten 35 Jahre sagen, in denen ich mich sehr verändert habe und bei denen selbst merkwürdige Posen und stark bearbeitete Fotos von mir – selbst in kleinteiligen Collagen – gefunden wurden. Das läuft natürlich gesichtsbasiert und nicht bezogen auf andere körperliche Merkmale wie es einige Super-Recognizer (die etwa für die Kriminalpolizei tätig sind) hinbekämen. Die werden auf lange Sicht aber wohl auch durch KI arbeitslos. 🤷♂️
Ja, die Identifizierung bestimmter Personen aufgrund unveränderlicher Merkmale hat sogar eine längere Geschichte als die generalisierte semantische Suche. Diese Erkennung funktioniert auch für den Hausgebrauch ganz gut (auf dem iPhone beispielsweise auch schon vor Apples zweifelhaften KI-Bemühungen mit der aktuellen iOS-Version).
Der Feldversuch der Polizei in einem Berliner Bahnhof (vor ein paar Jahren) war weniger erfolgreich: Trotz einer hohen Erkennungsquote hätte man bei einem echten Einsatz dieser Technik täglich so viele Unschuldige vorläufig festnehmen müssen, die einem per Haftbefehl Gesuchten nicht ausreichend unähnlich sahen, dass die Bevölkerung das nicht akzeptiert hätte. Aber für den Hausgebrauch ist es ja kein Malheur, wenn mal jemand falsch erkannt wird.
Das ist eben auch Statistik: Wenn die a priori-Wahrscheinlichkeit dafür, dass man eine bestimmte Person trifft, sehr gering ist, muss man selbst bei einem geringen Anteil von false positives damit rechnen, dass die meisten vermeintlich Erkannten nicht der Gesuchte sind. So war es beim Testlauf der Polizei, die ja nicht damit rechnen konnte, dass ein Straftäter vor ihren Kameras auftaucht. Suche ich dagegen in meinen Fotos Freunde und Verwandte, die darin tatsächlich sehr häufig zu sehen sind und dementsprechend eine hohe a priori-Wahrscheinlichkeit haben, fällt das Ergebnis derselben Personenerkennung viel besser aus.