Allgemeines 21.915 Themen, 147.228 Beiträge

News: Captchas bald für den Arsch?

Roboteraugen werfen bei Google-Zeichenmatsch das Handtuch

Michael Nickles / 7 Antworten / Flachansicht Nickles

Seit geraumer Zeit werden Internetnutzer mit sogenannten "Captchas" gequält. Damit eine Aktion auf einer Webseite ausgeführt werden kann, wird beispielsweise die Eingabe einer "Zeichenfolge" gefordert.

"Captchas" steht für "Completely Automated Public Turing test to tell Computers and Humans Apart". Also: ein komplett automatisierter Test um Menschen von Maschinen unterscheiden zu können. Durch Captcha-Abfragen will eine Webseite sicherstellen, dass sie es mit einem Menschen zu tun hat und nicht mit einem "Roboter", der ihre Informationen automatisiert absaugen will.

Dass so ein Captcha-Mechanismus in vielen Fällen Sinn macht, wird kaum bestritten. Aber: damit Captchas nicht automatisch per "Zeichenerkennungsroutine" von "Robotern" gelesen werden können, werden sie nicht in "Normalschrift" sondern möglicht verwackelt und verhunzt dargestellt.

Die Idee der "Captcha-Macher" ist die, dass ein Mensch noch in der Lage ist das fast Unlesbare zu erkennen, ein "Programm" aber daran scheitert. Leider gibt es in vielen Fällen Captchas, bei denen Menschen mit Sehschwierigkeiten (und auch Menschen ohne Sehschwierigkeiten) keinerlei Chance haben den "Zeichenbrei" entziffern zu können.

Im Glücksfall kriegt man bei "Falscheingabe" eine weitere Chance mit einem neuen Captcha, im Pechsfall gehen alle Eingaben auf einer Seite (beispielsweise in einem Formular) verloren und man darf von vorne anfangen.

Forscher aus Stanford haben jetzt versucht die gängigen Captcha-Lösungen zu knacken und ihr Ergebnis mitgeteilt (siehe PDF-Dokument. Und demnach sieht es wohl so aus, als ob Captchas auf dem Weg sind, eine sinnlose Sache zu werden.

Die aktuellen Erkennungsalgorithmen der Forscher können die meisten Captcha-Systeme bereits mit hoher Trefferquote überlisten, deren "Zeichenmatsch" entziffern.

Lediglich an einem Captcha-System biss sich die Erkennungs-Software "Decaptcha" der Forscher die Zähne aus: Recaptcha, Googles Recaptcha-Lösung:


Dass Roboter bei Googles Recaptcha das Handtuch schmeißen ist wenig verwunderlich – bei einem Zeichenmatsch wie hier im Bild, haben vermutlich auch die meisten Menschen keine Chance.

Gewiss ist es allerdings nur eine Frage der Zeit, bis auch Googles Recaptcha ausgetrickst wird.

Captcha-Fans wird vielleicht auch eine Studie von Stanforfd aus dem Jahr 2010 interessieren (siehe PDF-Dokument). Da wurde untersucht, wie gut Menschen in der Lage sind, die gängigen Captcha-Systeme erkennen zu können.

Michael Nickles meint: Googles Captchas sind also am ekeligsten. Aber spannend! Es ist recht interessant sich mal durchzulesen, wie Googles Captcha-System funktioniert (siehe Digitizing Books One Word at a Time).

Konkret werden die Recaptcha-Gequälten so ganz nebenbei als menschliche Buchdigitalisierer missbraucht. Denn: die von Google gezeigten Captcha-Wörter stammen von eingescannten Büchern. Und es sind solche Wörter, bei denen die Texterkennungs-Software versagt hat.

Drum gibt es bei Google Recaptcha zwei Worte einzutippen. Ein Wort, das das System bereits kennt und eins, das noch unerkannt ist. Gibt der menschliche "Digitalisierer" das bekannte Wort richtig ein, dann geht die Software davon aus, dass sich der Mensch auch bemüht hat, das noch unbekannte Wort richtig zu entziffern.

Wurde ein unbekanntes Wort ausreichend vielen Menschen präsentiert und es gibt eine erkennbare Häufigkeit gleicher "Antworten", dann kriegt das Wort den Status erkannt. Ganz schön, clever!

bei Antwort benachrichtigen