(X)HTML, JavaScript, DHTML, XML, CSS Client scripting tehnologije, Dynamic HTML, Cascading Stylesheets, XML i standardi |
|
Alati teme | Način prikaza |
|
25. 10. 2011. | #1 |
expert
Expert
Datum učlanjenja: 15.03.2011
Poruke: 518
Hvala: 16
20 "Hvala" u 17 poruka
|
algoritam kljucnih reci ili ...
Neznam da li ovo pitanje pripada ovoj temi ... a radi se o sledecem. Kako npr. sajt dajsve.com yipit.com ili slicni agregatori grupisu ponude po kategorijama kad na sajtovima sa kojih se dobijaju ponude uopste i ne postoji kategorizacija.
Da li na osnovu kljucnih reci - analizom? Da li rucno to rade? ... na neki treci nacin?
__________________
I'm not sexy and I know IT! |
25. 10. 2011. | #2 |
expert
Grand Master
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
|
Vjerovatno ima neki machine learning algoritam, ali da budeš siguran, ručno... ako imaju zaradu dobru, nije problem nekoga i zaposliti samo da sortira.
|
25. 10. 2011. | #3 |
expert
Expert
Datum učlanjenja: 15.03.2011
Poruke: 518
Hvala: 16
20 "Hvala" u 17 poruka
|
Verovatno je kombinacija ova dva nacina tj. automatskog kategorisanja i rucne provere i izmene... mada neznam kako npr. yipit.com dnebvno moze u roku od 3 sata da sortira pola miliona ponuda. Treba im fabrika kineza
__________________
I'm not sexy and I know IT! |
25. 10. 2011. | #4 |
Branimir Momcilovic
Qualified
Datum učlanjenja: 15.02.2006
Lokacija: Beograd
Poruke: 167
Hvala: 47
25 "Hvala" u 8 poruka
|
Za takve stvari se koriste data mining algoritmi, najverovatnije cluster analysis ili neki classification algoritmi...
__________________
Važnije je biti ljubazan, nego biti u pravu. |
25. 10. 2011. | #5 | |
expert
Expert
Datum učlanjenja: 15.03.2011
Poruke: 518
Hvala: 16
20 "Hvala" u 17 poruka
|
Citat:
__________________
I'm not sexy and I know IT! |
|
26. 10. 2011. | #6 |
Branimir Momcilovic
Qualified
Datum učlanjenja: 15.02.2006
Lokacija: Beograd
Poruke: 167
Hvala: 47
25 "Hvala" u 8 poruka
|
@AdriaMart Za određivanje kategorija proizvoda na osnovu atributa koje imaš.
Nisam se baš udubljivao u ovaj problem, ali ti generalno imaš neke podatke o "proizvodu", naziv, opis, sliku, sa kog sajta dolazi, cenu... Sad na osnovu tih podataka hoćeš da ga smestiš u neku kategoriju, npr. "Učenje", "Putovanja", "Sport". Možeš da probaš npr. naive bayes, znači na osnovu modela (postojećih podataka koje si ručno klasifikovao) odrediš verovatnoću P1 da je nešto "Putovanje" ako mu je u opisu neka određena reč ili fraza (npr. more, provod, bla bla...), zatim ako je sa sajta gde preovlađuju takve ponude P2 i tako dalje... Na osnovu tih pojedinačnih zavisnosti, sračunaš neke verovatnoće, izlaz je da na osnovu ovih podataka odrediš procenat verovatnoće da je tvoj proizvod u kategoriji "Učenje" npr. 30% u kategoriji "Putovanja" 50% i u trećoj n%. Ukoliko jedna kategorija bitno preovlađuje ubaciš ga automatski u tu kategoriju, ako ne napraviš neku notifikaciju moderatoru. Kako ti baza raste, tako ti raste i preciznost automatike... Ako si zainteresovan malo preciznije definiši problem, pomoći ću ti oko koncepta.
__________________
Važnije je biti ljubazan, nego biti u pravu. |
25. 10. 2011. | #7 |
Super Moderator
Knowledge base
Datum učlanjenja: 02.10.2006
Lokacija: Niš
Poruke: 1.618
Hvala: 263
275 "Hvala" u 104 poruka
|
na vesti.rs imamo kategorizaciju po nekim kljucnim recima, recimo:
Kôd:
http://www.vesti.rs/Auto-moto/Volkswagen/Volkswagen-najveci-proizvodjac-automobila-vec-ove-godine.html ^^^^^^^^^ analiziraju se naravno reci i unutar vesti [sadrzaj]. Poslednja izmena od Peca : 25. 10. 2011. u 21:32. |
25. 10. 2011. | #8 |
expert
Grand Master
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
|
|
25. 10. 2011. | #9 | |
expert
Expert
Datum učlanjenja: 15.03.2011
Poruke: 518
Hvala: 16
20 "Hvala" u 17 poruka
|
Citat:
__________________
I'm not sexy and I know IT! |
|
25. 10. 2011. | #10 |
Super Moderator
Knowledge base
Datum učlanjenja: 02.10.2006
Lokacija: Niš
Poruke: 1.618
Hvala: 263
275 "Hvala" u 104 poruka
|
pa?
[kakve veze ima taj copy-paste sa ovom temom? ] |
|
|