Die altbekannten Bilderrätsel – Ampeln anklicken, Zebrastreifen suchen, verzerrte Buchstaben tippen – verlieren ihren Sinn, je besser KI-Modelle darin werden, genau diese Aufgaben zu lösen. Google reagiert nun mit einem neuen Ansatz für seinen Verifizierungsdienst reCaptcha: einer Handgestenerkennung per Kamera. Statt Objekte zu erkennen, sollen Nutzerinnen und Nutzer eine einfache Bewegung vor der Webcam ausführen.
Wie die Gestenerkennung funktioniert
Nach Googles eigener Cloud-Dokumentation nimmt reCaptcha bei aktivierter Funktion ein oder mehrere kurze Videos der Hand auf, während die Person eine vorgegebene Geste ausführt. Aus dem Video extrahiert ein Machine-Learning-Modell sogenannte Hand-Landmark-Daten – konkret 21 Koordinaten der Fingerknöchel und Gelenkpunkte. Anhand dieser Punkte erkennt das System die ausgeführte Geste und prüft, ob eine echte, menschliche Handbewegung vorliegt.
Die Idee dahinter: Eine flüssige, dreidimensionale Handbewegung in Echtzeit ist für automatisierte Bots deutlich schwerer zu fälschen als das Anklicken von Kacheln. Laut heise online soll der Mechanismus gezielt KI-Bots abwehren, die klassische Bilderrätsel inzwischen zuverlässig knacken.
Ankündigung, kein Standard
Wichtig für die Einordnung: Die Funktion ist keine flächendeckende Pflicht. Sie richtet sich an Website-Betreiber, die reCaptcha über Google Cloud Fraud Defense einsetzen, und muss von diesen erst aktiviert werden. Wer heute eine beliebige Website besucht, wird also in aller Regel weiterhin keine Handgesten vorführen müssen. reCaptcha bleibt ein gestuftes System: Es kann eine Interaktion durchwinken, zusätzliche Prüfungen verlangen oder eine Anfrage blockieren – die Gestenprüfung ist nur eine zusätzliche Challenge-Option.
Damit unterscheidet sich der Ansatz vom Trend der vergangenen Jahre. Mit reCaptcha v3 und unsichtbaren Captchas hatte Google eigentlich darauf gesetzt, Nutzer möglichst unbehelligt zu lassen und im Hintergrund anhand von Verhaltenssignalen zu bewerten. Die Gestenerkennung kehrt diese Logik um und fordert wieder eine aktive, sichtbare Handlung.
Der Haken: Zugriff auf die Kamera
Genau hier liegt der heikle Punkt. Für die Gestenprüfung ist ein Kamerazugriff zwingend erforderlich. Google versichert in seiner Dokumentation, dass die Videos niemals mit der Identität einer Person verknüpft, kein Ton aufgezeichnet, die Aufnahmen nach der Verifizierung gelöscht und nicht an Dritte weitergegeben werden.
Kritiker halten diese Zusagen für widersprüchlich. heise weist darauf hin, dass von Google erhobene Daten zugleich gemäß der allgemeinen Datenschutzerklärung des Konzerns verwendet und gespeichert werden könnten – was im Spannungsverhältnis zum Versprechen der sofortigen Löschung steht. Auch das Magazin Cybernews berichtet von Datenschutzsorgen der Nutzer, die einem Werbekonzern ungern Bilder ihrer Hände und damit potenziell biometrienahe Daten überlassen wollen.
Einordnung
Die Handgestenerkennung ist vor allem ein Symptom des Wettlaufs zwischen Captcha-Anbietern und immer leistungsfähigeren KI-Systemen. Jede neue Hürde, die Maschinen überfordern soll, verlangt Menschen mehr ab – und verschiebt die Grenze zwischen Bot-Abwehr und Datensammlung. Ob sich das Winken vor der Kamera durchsetzt, hängt nicht nur an seiner technischen Robustheit, sondern auch daran, ob Website-Betreiber ihren Besuchern den Kamerazugriff zumuten wollen. Bis dahin gilt: Es handelt sich um eine optionale Funktion – nicht um den neuen Captcha-Standard.



