Asirra [Arhiva] - DevProTalk

Pogčedajte punu verziju : Asirra

Dragan Babić

18. 03. 2007., 20:05

Asirra (http://research.microsoft.com/asirra/) (Animal Species Image Recognition for Restricting Access) is a HIP that works by asking users to identify photographs of cats and dogs. This task difficult for computers, but our user studies have shown that people can accomplish it quickly and accurately. Many even think it's fun!

Ovo je u suštini alternativa CAPTCHA sistemu, zanima me šta mislite o ovome? CAPTCHA definitivno ume da bude bol u dupetu nekada, nepristupačna je korisnicima sa disabilitetima i onima koji ne učitavaju slike, itd. Sa druge strane ova Asirra mi se čini kao malo prekomplikovana tehnika, teba učitati onoliko slika, JSa, itd.

Vaše mišljenje? Ima li ovo kakvu budućnost (i ima li je CAPTCHA uopšte)?

misk0

18. 03. 2007., 22:00

Vidio sam vec nesto slicno ovome, nisam siguran da se ovako zove. Captcha je mnogo jednostavnija, ovo mi bas zvuci smor i komplikovano, pogotovo sto ne mozes brzo uraditi, slike su suvishe malene i ako captcha ima problema sa disable-ovanim images i JS, tek ce ovaj sistem imati.
Meni je ovo smor, ja bih (da moram) trazio drugo rjesenje.

Ilija Studen

18. 03. 2007., 22:30

Naletao sam na ovo ranije, ali sam mislio da je u pitanju igra tipa "razvrstaj priorodne i sa silikonima" (beše link za ovo na DPT), samo za malo mlađu publiku...

ivanhoe

19. 03. 2007., 01:12

po meni je sustina zastite da napravis originalno resenje za svaki sajt, makar i sa vrlo malom razlikom, tipa promenis imena polja... time si automatski odbio 99% posto spam bottova, koji su u sustini veoma glupo pisani.. oni jure poznate metode zastite, i ako ih ne nadju idu dalje..

Meni se licno najvise svidja fora sa laznim poljem: napravis textfield sa imenom email, a u labelu napises "Ostavite ovo polje prazno" (plus sve to sakrijes CSS-om). Apsolutno svaki bot ce pokusati da popuni lazni email, i tako ih se lako resis...

Petar Marić

19. 03. 2007., 01:26

Heh, u zadnje vreme baš se mislim da mi master rad bude u vezi sigurnosti različith klasa CAPTCHA testova :)
Prednosti:
* Teži za računare od tekstualne CAPTCHA-e
* Pristojna baza slika

Mane:
* Kvalitet slika - na nekima je nejasno šta je u stvari na njima - što zbog kvaliteta slike, što zbog same živuljke :D
* Cena - znajući MS ova usluga neće još dugo biti besplatna
* Sporo - u odnosu na uobičajne CAPTCHA-e treba dovući 12x više slika
* Različitost - pitanje je koliko je vremena prosečnom korisniku potrebno da shvati šta se od njega traži, naročito ako ne zna engleski.
* Sličnost - bez obzira na zaštitne mehanizme (http://research.microsoft.com/asirra/security.aspx) i ovakav sistem se da razbiti: matematika + dobar AI + bot-net + brute-force + jeftina ljudska radna snaga. Pitanje je samo želje i novca.

A da ovaj unos ne bi bio čisto teoritisanje evo malo koda:
"""
A script for testing Asirra CAPTCHA (http://research.microsoft.com/asirra/) security

The idea behind this script is pretty simple:
* First, let's say we have a way to learn which animal is on a picture (cheap
human labor or AI - neural network).
* Then, with the help of this script, we calculate how much of CAPTCHA requests
we need to make in order to have a specific amount of animal pictures.
* After we have a rough estimate of the needed requests we employ our bot-network
to get the pictures.
* We classify the pictures using the selected learning algo.
* Now we train our Agent (AI) to recognize the rest of unknown pictures.
* CAPTCHA PASSED :)
"""
__author__ = 'Petar Maric - http://www.petarmaric.com/'

TOTAL_PICTURES = 2*10**6 # They say "It's powered by over two million photos"
PICTURES_PER_VIEW = 4*3 # CAPTCHA test picutre grid is 4x3 pictures

# List of how much CAPTCHA requests to make
TRIES_LIST = xrange(5*10**4, 5*10**5, 5*10**4)

###############################
# You can look, but no touching
###############################

import random

ALL_PICTURES = xrange(TOTAL_PICTURES)

def num_pictures_learned(num_tries):
"""Returns the number of learned pictures"""
pictures_learned = {}
for i in xrange(num_tries):
for pic in random.sample(ALL_PICTURES, PICTURES_PER_VIEW):
pictures_learned[pic] = 0
return len(pictures_learned)

def main():
for num_tries in TRIES_LIST:
learned = num_pictures_learned(num_tries)
learned_percent = 100.0 * learned/TOTAL_PICTURES
print "Learned %d/%d (%.2f%%) with %d tries." % (
learned,
TOTAL_PICTURES,
learned_percent,
num_tries
)

if __name__ == "__main__":
main()
Rezultat:
Learned 518207/2000000 (25.91%) with 50000 tries.
Learned 901901/2000000 (45.10%) with 100000 tries.
Learned 1187203/2000000 (59.36%) with 150000 tries.
Learned 1396808/2000000 (69.84%) with 200000 tries.
Learned 1553736/2000000 (77.69%) with 250000 tries.
Learned 1669414/2000000 (83.47%) with 300000 tries.
Learned 1754926/2000000 (87.75%) with 350000 tries.
Learned 1818577/2000000 (90.93%) with 400000 tries.
Learned 1865694/2000000 (93.28%) with 450000 tries.

nixa

19. 03. 2007., 01:31

ovo je generalno dobra ideja ...mada kao sto kaze Petar .. ne bih se ja oslanjao na M$ ...

Dobra stvar je da je ovo jako dobar koncept ... i da je realizacija neceg slicnog u
svojoj realizaciji je relativno lako ( naravno lokalna baza slika ili glifa/ikona) .

Pedja

19. 03. 2007., 07:59

po meni je sustina zastite da napravis originalno resenje za svaki sajt, makar i sa vrlo malom razlikom, tipa promenis imena polja... time si automatski odbio 99% posto spam bottova, koji su u sustini veoma glupo pisani.. oni jure poznate metode zastite, i ako ih ne nadju idu dalje..

Bogme, vremena se menjaju. Imam nekolko sajtova na kojima je custom web forma za kontakt. Na svakom su posle nekog vremena poceli da zasipaju. Ili su spameri zaludni pa to rade rucno ili su poceli da obaracaju paznju i na male sajtove sa custom formama...

Dragan Babić

19. 03. 2007., 08:13

[...] Meni se licno najvise svidja fora sa laznim poljem: napravis textfield sa imenom email, a u labelu napises "Ostavite ovo polje prazno" (plus sve to sakrijes CSS-om). Apsolutno svaki bot ce pokusati da popuni lazni email, i tako ih se lako resis...
Na dnevniku je upravo takva spam zaštita bila i probijena je, do te mere je sve išlo da sam morao da skinem kontakt formular na neodređeno... Doduše bot koji je spamovao sa mog sajta je verovatno textpattern specefoc bot (baš za taj, inače verovatno najbolji plugin za TXP, zem_contact).

marinowski

04. 06. 2007., 04:48

Danas sam na Diggu naišao na interesantan Captcha test:

http://www.marinowski.com/pic/fun/captcha.jpg

Komentare i još primera imate ovde: http://digg.com/offbeat_news/Best_Captcha_Ever_PICTURE

Eniac

04. 06. 2007., 09:49

wow this is so cool...

inace ne znam da li ste citali o reCAPTCHA... fenomenalna ideja gde se ovaj model iskoriscava za digitalizaciju knjiga, tako da ne gubite vreme dok popunjavate svoj confirmation kod :D

marinowski

04. 06. 2007., 09:56

... i onda se nadje neko pametan i iskoristi Google da to izracuna: http://www.google.com/search?q=ln%282%2Bsqr%28arctan%280%29*sin%281%2F0. 00000000000000000000000001%29%29%29

Pravi geekovi naravno odmah prepoznaju da je to ln 2 ...

Ipak, vise mi se svidja ideja za digitalizaciju knjiga.

Eniac

04. 06. 2007., 13:53

http://recaptcha.net/

Evo i linka da probate

http://recaptcha.net/learnmore.html

Ja se izvinjavam sto nisam u prethodnom postu to uradio, a sad mi je istekao vreme za edit :(