DevProTalk

Forumi IT profesionalaca
web development, web design, e-business, SEO


Idite nazad   DevProTalk > Web development i web aplikacije > Programiranje
Beach Wedding Dresses - Looking for the Wedding Dress? Here, 1dress.co.uk stunning collection of beach wedding dresses is just what you are looking for.
charles wang

Programiranje Java, Perl, VB, ASP, .NET, C, C++, Pascal, Delphi Sponzor: VIP izazov 3

Odgovori
 
Alati teme Način prikaza
Staro 03. 10. 2006.   #1
Ilija Studen
Direktor Kombinata
Invented the damn thing
 
Avatar Ilija Studen
 
Datum učlanjenja: 07.06.2005
Poruke: 2.669
Hvala: 44
119 "Hvala" u 64 poruka
Ilija Studen će postati "faca" uskoroIlija Studen će postati "faca" uskoro
Default Određivanje sličnosti između dva teksta

Evo ga interesantan problem. Treba da napravim RSS agreagator koji će pored klasičnog sakupljačkog zadatka imati i zadatak da uz vest koju trenutno gledamo prikaže i "srodne" vesti.

Da li je neko radio nešto slično ili ima ideju kako bi ovo moglo da bude urađeno, a da pruža zadovoljavajuće rezultate?
Ilija Studen je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #2
kaizen
old school
Professional
 
Avatar kaizen
 
Datum učlanjenja: 07.02.2006
Poruke: 340
Hvala: 32
44 "Hvala" u 20 poruka
kaizen će postati "faca" uskoro
Default

Citat:
Originalno napisao Ilija Studen
Evo ga interesantan problem. Treba da napravim RSS agreagator koji će pored klasičnog sakupljačkog zadatka imati i zadatak da uz vest koju trenutno gledamo prikaže i "srodne" vesti.

Da li je neko radio nešto slično ili ima ideju kako bi ovo moglo da bude urađeno, a da pruža zadovoljavajuće rezultate?
Tagovi?
kaizen je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #3
Ilija Studen
Direktor Kombinata
Invented the damn thing
 
Avatar Ilija Studen
 
Datum učlanjenja: 07.06.2005
Poruke: 2.669
Hvala: 44
119 "Hvala" u 64 poruka
Ilija Studen će postati "faca" uskoroIlija Studen će postati "faca" uskoro
Default

Tagovi? Ne bi radilo posao. Pre nešto:

PHP kôd:
print compare_this($text1$text2); 
I da ispiše neku vrednost, procenat, neka konstanta, whatever. Onda bi za srodne uzimao one tekstove koji imaju najvišu sličnost, a pri tom su veći od unapred definisanog faktora (npr. 5% ili šta već).
Ilija Studen je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #4
robi-bobi
expert
Grand Master
 
Avatar robi-bobi
 
Datum učlanjenja: 05.10.2005
Lokacija: Sofia, Bulgaria
Poruke: 805
Hvala: 222
944 "Hvala" u 68 poruka
robi-bobi ima spektakularnu aururobi-bobi ima spektakularnu aururobi-bobi ima spektakularnu aururobi-bobi ima spektakularnu aururobi-bobi ima spektakularnu aururobi-bobi ima spektakularnu aururobi-bobi ima spektakularnu aururobi-bobi ima spektakularnu auru
Pošaljite poruku preko Skype™ za robi-bobi
Default

http://bg2.php.net/manual/en/function.similar-text.php


edit: long live PHP
robi-bobi je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #5
Dragi Tata
dinosaurus
Master
 
Avatar Dragi Tata
 
Datum učlanjenja: 29.12.2005
Lokacija: Nova Engleska
Poruke: 636
Hvala: 79
263 "Hvala" u 66 poruka
Dragi Tata će postati "faca" uskoroDragi Tata će postati "faca" uskoroDragi Tata će postati "faca" uskoro
Default

Citat:
Originalno napisao Ilija Studen
Određivanje sličnosti između dva teksta
Za sličnost dva stringa (kao u diff komandi, npr) se obično koristi LCS algoritam ( http://www.ics.uci.edu/~eppstein/161/960229.html ), ali mi se čini da ti tražiš maltene IR: http://www.dcs.gla.ac.uk/~iain/keith/ a to je mnogo kompleksnija oblast.
Dragi Tata je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #6
kaizen
old school
Professional
 
Avatar kaizen
 
Datum učlanjenja: 07.02.2006
Poruke: 340
Hvala: 32
44 "Hvala" u 20 poruka
kaizen će postati "faca" uskoro
Default

Citat:
Originalno napisao Ilija Studen
Tagovi? Ne bi radilo posao. Pre nešto:

PHP kôd:
print compare_this($text1$text2); 
I da ispiše neku vrednost, procenat, neka konstanta, whatever. Onda bi za srodne uzimao one tekstove koji imaju najvišu sličnost, a pri tom su veći od unapred definisanog faktora (npr. 5% ili šta već).
"Srodnu vest" nećeš pronaći poređenjem sličnosti teksta.

edit: ne bi bilo loše da definišeš "Srodnu vest", pošto su za mene srodne vesti :
1 - Zvezda ispala iz Kupa UEFA,
2 - Partizan ide dalje

Poslednja izmena od kaizen : 03. 10. 2006. u 21:20.
kaizen je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #7
dinke
Super Moderator
Invented the damn thing
 
Avatar dinke
 
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
dinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamen
Default

Za slicnost izmedju dve reci ja sam ranije koristio levenshtein f-ju.

Medjutim, obzirom da i sam imam slican zadatak na svom rss projektu, a rss feedove cu cuvati u bazi, najverovatnije cu koristiti mogucnosti full text indexa. Nisam 100% siguran, ali mislim da su na es-u tako odradili "flashback linkove" (srodne teme).
__________________
Caught in a Web|Blogodak
With great power comes great responsibility!
dinke je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #8
Ilija Studen
Direktor Kombinata
Invented the damn thing
 
Avatar Ilija Studen
 
Datum učlanjenja: 07.06.2005
Poruke: 2.669
Hvala: 44
119 "Hvala" u 64 poruka
Ilija Studen će postati "faca" uskoroIlija Studen će postati "faca" uskoro
Default

Citat:
Originalno napisao dinke
najverovatnije cu koristiti mogucnosti full text indexa
Može više detalja o ovom pristupu?
Ilija Studen je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #9
dinke
Super Moderator
Invented the damn thing
 
Avatar dinke
 
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
dinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamen
Default

I ja tek trebam da ga proucim. U principu koristi se takozvani 'query expansion' search. Pogledaj ovu stranu manuala za neke osnovne informacije.

A mozes da probas i da googlas. Kljucne reci mysql fulltext related post

E sad, znam da su istu tehniku koristili na es-u, pa ako je flajko (Aleksandar.Ilic) upucen u detalje moze da nam tacno kaze, ako ne kopacemo dalje
__________________
Caught in a Web|Blogodak
With great power comes great responsibility!
dinke je offline   Odgovorite uz citat
Staro 03. 10. 2006.   #10
ivanhoe
Ivan Dilber
Sir Write-a-Lot
 
Avatar ivanhoe
 
Datum učlanjenja: 18.10.2005
Lokacija: Bgd
Poruke: 5.320
Hvala: 104
2.341 "Hvala" u 583 poruka
ivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svima
Pošaljite poruku preko Skype™ za ivanhoe
Default

ja bih napravio tabelu reci (keyworda) za svaki text, i onda matchovao preko toga, 2 texta sa puno slicnih reci su verovatno i slicne tematike.

Naravno da bi ovo imalo smisla treba eliminisati reci koje se pojavljuju samo jednom (nisu bitne) ili opet suvise cesto u textu, zatim one koje se pojavljuju u vise od npr. 50% textova (tako to radi i fulltext search u mysql-u), kao i napraviti neku listu reci koje se zanemaruju i onih kojima se daje veca vaznost (npr. ajax je bitna kategorija za slicnost, a reci kao interface ili button nisu toliko).

U svakom slucaju nije bas lak posao...
__________________
Leadership is the art of getting people to want to do what you know must be done.
ivanhoe je offline   Odgovorite uz citat
Odgovori


Alati teme
Način prikaza

Pravila pisanja
Možete ne započinjati nove teme
Možete ne slati odgovore
Možete ne slati priloge
Možete ne izmeniti svoje poruke
vB kôd je Uključen
Smajliji su Uključen
[IMG] kod je Uključen
HTML kôd je Isključen
Pogledajte forum

Slične teme
Tema Početna poruka teme Forum Odgovori Poslednja poruka
[REŠENO] QA: Potrebni Web testeri [studenti, određeno na 2 meseca] DejanVesic Poslovne ponude i zapošljavanje 0 16. 10. 2010. 00:44
phpBB2 - određenog usera redirectati na neki URL blackshtef Web aplikacije, web servisi i software 0 04. 09. 2008. 20:12
Aktiviranje posebnog templejta za određene kategorije u WordPressu Deki80 Sva početnička pitanja 8 20. 02. 2008. 17:52
Da li je određeni path stvarna adresa fajla? Ilija Studen PHP 4 09. 06. 2006. 18:07


Vreme je GMT +2. Trenutno vreme je 11:27.


Blogodak - Domaci blogovi na jednom mestu Caught in a web - web dev blog
Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.
Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.