Alles wat je ooit wilde weten over CAPTCHA's, maar bang was om te vragen [technologie uitgelegd]
Houd van ze of haat ze - CAPTCHA's zijn alomtegenwoordig op het internet. Wat is CAPTCHA eigenlijk en waar komt het vandaan? Verantwoordelijk voor eye-strain over de hele wereld, heeft de nederige CAPTCHA het centrum van veel aandacht als het enige meest effectieve wapen in de strijd tegen web-spam. Maar zijn ze effectief? Zijn er andere soorten CAPTCHA anders dan de basis “kantel je hoofd, loom en lees me”?
Je komt niet voorbij (The Turing Test)!
Captcha's zijn bedacht door een team van professoren van Carnegie Mellon en zijn rond 2000 in gebruik genomen door AltaVista en Yahoo, in een poging om automatische chat-bots en URL-inzendingen te voorkomen. Het is in feite een afkorting voor Completely EENutomated Ppenbare Turing test om te vertellen Computer en HUmans EENeen deel.
Voor degenen onder u die niet weten wat dat betekent, kan het helpen om uit te leggen wat de Turing-test is. De Turing-test, vernoemd naar de Britse professor Alan Turing, is de standaardtest van een Kunstmatige intelligentie gebaseerd machine, waarbij als een machine de test kan passeren, het wordt beschouwd om te exposeren intelligent gedrag. In essentie gaat het om een gesprek met een aantal juryleden via een tekstinterface. Als de juryleden niet kunnen zien dat ze met een computer chatten, slaagt de test. Persoonlijk ben ik van mening dat de Turing-test nutteloos is, op basis van het feit dat een dolfijn ook niet met een mens kan converseren, maar we schrijven ze toe aan een hogere vorm van intelligent gedrag. Maar ik dwaal af.
De CAPTCHA is daarom een geautomatiseerde Turing-test. Er zijn een aantal verschillende manieren om dit te doen, maar de meest gebruikelijke waarop we lijken te zijn gebaseerd, is om de gebruiker een gecodeerde vorm van tekst voor te stellen, uitgaande van (vaak onjuist) dat een normaal mens in staat zal zijn om de tekst te ontcijferen. tekst.
De CAPTCHA is in de loop van de tijd geëvolueerd, maar is uiteindelijk verslagen, zoals we later zullen ontdekken.
Op tekst gebaseerde CAPTCHA's en het Re-CAPTCHA-project
Het reCAPTCHA-project, dat nu eigendom is van Google, besloot dat in plaats van cryptische tekst alleen maar ten onrechte te ontcijferen, het een fantastische kans bood om de tekortkomingen van computergebaseerde optische tekenherkenning te corrigeren. Vooral voor oudere boeken vinden computers het erg moeilijk om de woorden te herkennen, terwijl een mens de taken triviaal vindt. Combineer de taak van het digitaliseren van oude boeken met spampreventie, en je bent op een absolute winnaar.
Als de computer echter problemen had om het woord in de eerste plaats te herkennen, hoe kan het dan uitmaken of wat je schreef onzin is? Eenvoudig - presenteer de gebruiker met TWEE woorden - waarvan er een bekend is. Het systeem gaat ervan uit dat als de gebruiker het bekende woord correct intypt, de kans groot is dat het onherkenbare woord ook correct is.
Een ander ingenieus idee is om de CAPTCHA te combineren met een vorm van reclame.
Wiskunde probleem
OK, de foto is een grap, maar in wezen krijgt de gebruiker een basis wiskundeprobleem. We gebruiken nu een vergelijkbaar systeem op de site Answers. Het hoeft niet moeilijk te zijn, slechts een basis toevoeging.
Op afbeeldingen gebaseerde CAPTCHA's
Zo moeilijk als sommige ReCAPTCHA-codes voor u kunnen zijn en soms is er al software ontwikkeld die de code kan breken met een succespercentage van ongeveer 30% - wat voor een spam-campagne met miljoenen pogingen een redelijk acceptabel percentage is. Afbeeldingen aan de andere kant zijn voor semantische computers uiterst moeilijk te verwerken. Denk aan een eenvoudige foto van een kat - het programmeren van een computer om een menselijk gezicht te herkennen is al moeilijk genoeg, maar om een kat te onderscheiden van alle andere dieren en objecten in de wereld is op dit moment vrijwel onmogelijk.
Logic-Based
Deze steunen op logische en semantische intelligentie over de wereld, of gewoon op basis van gewoon menselijk besef. Sommige voorbeelden kunnen zijn:
- Identificeer het voedsel in deze lijst: asfalt, spek, wolk, dolk.
- Identificeer het wapen in deze lijst: asfalt, spek, wolk, dolk.
- Hoeveel deuren zijn er op een vierdeursauto?
- Wat is het derde woord in deze zin?
- Wat er overblijft als je de B uit ABC verwijdert?
Een goede plug-in om dit soort tests te integreren in uw WordPress-reactiesysteem is trouwens WP-Gatekeeper.
De-CAPTCHA-services
Het trieste feit is dat terwijl CAPTCHA's een noodzakelijk kwaad zijn, ze tegenwoordig gemakkelijk door spammers kunnen worden opgelost. Hoewel sommige spammers inderdaad geavanceerde software hebben ontwikkeld die het menselijk oog en brein kan nabootsen zoals een mens doet, is de waarheid veel eenvoudiger en gruwelijker. Waarom dure software ontwikkelen als u iemand centen kunt betalen om de CAPTCHA voor u te doen? Het huidige goedkoopste tarief is $ 1,39 voor 1000 CAPTCHA's, met een nauwkeurigheidspercentage van 98%, en diensten zoals Death By Captcha hebben uitgebreide API's ontwikkeld die ontwikkelaars kunnen gebruiken. De enige persoon die tegenwoordig wordt vertraagd door CAPTCHAs, ben jij!
De toekomst van de Captcha
Net als al het andere in het leven, zijn CAPTCHA's niet ondoordringbaar voor hacking of spammen. Naarmate er nieuwe en meer vernuftige tests worden bedacht, zullen steeds verfijndere manieren om ze te doorbreken worden ontwikkeld - en de oplossing om iemand anders te betalen om ze voor je te doen, kan nooit worden verslagen. Toch is het onze verantwoordelijkheid als webontwikkelaars en -beheerders om spammers weg te houden van onze sites zonder de gebruikerservaring te verslechteren.
Ben je geschokt om te leren hoe goedkoop een CAPTCHA kan worden verslagen? Heb je een ander soort CAPTCHA's in het wild gezien die indruk op je maakten? Laat het ons weten in de reacties! Controleer ook alle gelabelde grappige foto's “captcha” over op Geeky Fun.
Afbeelding Krediet: xkcd
Ontdek meer over: Spam.