|
29. 03. 2010. | #1 |
Super Moderator
Invented the damn thing
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
|
A sta je sa dve iste fotke u razlicitoj rezoluciji? To se smatra duplikatom ili ne? Ako da onda hash check ne pije vodu, onda ti je exif ili perceptualni check (ovo sto kaze McKracken) jedino resenje.
|
29. 03. 2010. | #2 |
VD IT Direktora
Invented the damn thing
Datum učlanjenja: 08.06.2005
Lokacija: Beograd
Poruke: 2.118
Hvala: 503
1.307 "Hvala" u 282 poruka
|
Zapravo, zamisli iduću perverziju: s obzirom da su u pitanju goleme fotke čiji upload verovatno ume da potraje, odradiš MD5 početnih n kilobajta u toku uploada i odmah upozoriš korisnika da takva fotka već postoji, pre nego što se upload završi.
__________________
blog |
08. 04. 2010. | #3 | |
novi član
Na probnom radu
Datum učlanjenja: 27.12.2009
Lokacija: Zagreb
Poruke: 17
Hvala: 0
0 "Hvala" u 0 poruka
|
Citat:
1. kako mislis rjesiti problem slika koji imaju isti hash za prvih n kilobyte-a? 2. je li uopce i kako je moguce napraviti hash od prvih n kilobyte-a ako cijela slika nije uploadana? Pricam naravno o PHP rjesenju.
__________________
ZWD |
|
08. 04. 2010. | #4 | ||
VD IT Direktora
Invented the damn thing
Datum učlanjenja: 08.06.2005
Lokacija: Beograd
Poruke: 2.118
Hvala: 503
1.307 "Hvala" u 282 poruka
|
Kao prvo, cela ideja je samo ideja, daleko od toga da sam radio nešto slično, dakle u pitanju je teoretisanje. Za većinu sajtova kojoj velike fotke nisu u centru pažnje, ovo nema smisla, ali verovatno postoje i sajtovi kojima se isplati da istraže malo u ovom pravcu. Naravno, uvek postoji mogućnost da se upload radi nekim dedicated klijentom, Java appletom ili bilo čime drugim.
Citat:
Citat:
__________________
blog Poslednja izmena od jablan : 08. 04. 2010. u 15:54. |
||
08. 04. 2010. | #5 | |||
novi član
Na probnom radu
Datum učlanjenja: 27.12.2009
Lokacija: Zagreb
Poruke: 17
Hvala: 0
0 "Hvala" u 0 poruka
|
Citat:
Citat:
Probat cu pojednostaviti. Uzmi npr. da imas jednu uploadanu sliku ciji bitovi pocinju sa npr. "0000" i drugu koju namjeravas uploadati ciji bitovi pocinju isto sa "0000". Za njih dvije ces izracunati isti hash ako racunas hash na temelju prva 4 bita, ali one ne moraju nuzno biti iste, prva moze biti "0000 0000 ..." a druga moze biti "0000 1111 ...". Nadam se da ti je sad jasnije (iako, i ova situacija je daleko teoretiziranje ). Citat:
__________________
ZWD |
|||
08. 04. 2010. | #6 |
Ivan Dilber
Sir Write-a-Lot
|
ideja je dobra, ali moralo bi se uzeti u obzir da slike na pocetku imaju zaglavlje koje zavisi od formata.
Ja bih to ovako: Flash upload koji prenese samo deo fajla (mislim da je to izvodljivo), onda se to uporedi, nadju se slike koje se matchuju (jedna ili vise), pa se korisniku prikaze dijalog: Da li je slika koju uploadujete neka od ovih slika? i prikazu se thumbovi tih slika koje su vec u bazi. Ali to neki drugi put, kad ne budem imao pametnijeg posla
__________________
Leadership is the art of getting people to want to do what you know must be done. |
09. 04. 2010. | #8 |
majstor
Wrote a book
|
Upitno je koliko ima smisla koristiti prvih nekoliko kilobajta. Mozda bi prije svega toga trebalo uraditi analizu veceg broja slika i vidjeti kakvi se rezultati dobiju.
JPEG koliko znam pocinje fajl sa gornjim lijevim uglom slike i ide prema donjem desnom. Kod BMP formata ide 'odozdo' prema gore. Dosta slika prirode imaju 1/3nu neba koje je u gornjem dijelu i moguce je da je isto/slicno za velik broj slika. |
09. 04. 2010. | #9 | |
VD IT Direktora
Invented the damn thing
Datum učlanjenja: 08.06.2005
Lokacija: Beograd
Poruke: 2.118
Hvala: 503
1.307 "Hvala" u 282 poruka
|
Citat:
Mogli bismo da napravimo mali eksperiment: svako od nas napravi skroz beli JPG 1000x1000, pa da vidimo koliko prvih bajtova im se poklapa. Ja tipujem na između 10 i 50.
__________________
blog |
|
11. 04. 2010. | #10 | |
novi član
Na probnom radu
Datum učlanjenja: 27.12.2009
Lokacija: Zagreb
Poruke: 17
Hvala: 0
0 "Hvala" u 0 poruka
|
Citat:
Medjutim, kad bi svi koristili isti nacin kodiranja, dobili bi iste slike. Enivej, nisam proucavao JPEG standard, ali sigurno postoje nekakvi meta-podaci o slici kakvi inace postoje kod slicnih stvari (od kojih su neki i nacini kodiranja, level kompresiranja, itd.), a koji su najvjerovatnije stavljeni na pocetak. Njihove varijacije nisu velike, pa stoga vjerojatnost da dvije slike imaju isti hash na temelju prvih n kilobyte-a uvelike raste ako uzmemo u obzir veliku kolicinu slika prvenstveno, a zatim i vec spomenute slicnosti tematike slika (nebo, mrak, jednobojne pozadine). Naravno, ta vjerovatnost uvelike ovisi i o odabiru broja n (veci n manja vjerojatnost pronalaska istog hash-a za razlicite slike). Ja na problem gledam matematicki, mozda ne bi bilo lose prouciti standard.
__________________
ZWD Poslednja izmena od ivan.skugor : 11. 04. 2010. u 13:34. |
|
|
|
Slične teme | ||||
Tema | Početna poruka teme | Forum | Odgovori | Poslednja poruka |
Status servisa na serveru, provera? | pcigre | Web Hosting, web serveri i operativni sistemi | 9 | 22. 01. 2009. 20:11 |
MySQL uklanjanje duplikata | Nemanja Avramović | SQL baze podataka - Sponzor: Baze-Podataka.net | 5 | 08. 02. 2008. 11:24 |
nalazenje duplikata | ivanhoe | PHP | 4 | 08. 01. 2007. 12:36 |
Provera izgleda web aplikacije na PDA | Pedja | Web site, dizajn i multimedia | 9 | 30. 06. 2006. 09:16 |
WHOIS Provera domena | bluesman | Web Hosting, web serveri i operativni sistemi | 7 | 30. 10. 2005. 16:08 |