hipoteticki, zamisli da nije kategorisana [ima takvih, da ne trazim].
hteo sam da objasnim princip, kako se preko kljucne reci definise podkategorija a samim tim i kategorija. nista vise. link sam odmah stavio pod [code] da ne ispadne da backlinkujem sajt. |
ja sam postavio link zato što sam ga vidio par minuta ranije na svom siteu pa sam i ja postavio, shvatam da si hipotetički mislio... ali opet, ništa ne mora da znači, može volkswagen biti u ekonomiji, itd... naravno ne postoji bulletproof sistem, uglavnom objasnio si suštinu...
|
@AdriaMart Za određivanje kategorija proizvoda na osnovu atributa koje imaš.
Nisam se baš udubljivao u ovaj problem, ali ti generalno imaš neke podatke o "proizvodu", naziv, opis, sliku, sa kog sajta dolazi, cenu... Sad na osnovu tih podataka hoćeš da ga smestiš u neku kategoriju, npr. "Učenje", "Putovanja", "Sport". Možeš da probaš npr. naive bayes, znači na osnovu modela (postojećih podataka koje si ručno klasifikovao) odrediš verovatnoću P1 da je nešto "Putovanje" ako mu je u opisu neka određena reč ili fraza (npr. more, provod, bla bla...), zatim ako je sa sajta gde preovlađuju takve ponude P2 i tako dalje... Na osnovu tih pojedinačnih zavisnosti, sračunaš neke verovatnoće, izlaz je da na osnovu ovih podataka odrediš procenat verovatnoće da je tvoj proizvod u kategoriji "Učenje" npr. 30% u kategoriji "Putovanja" 50% i u trećoj n%. Ukoliko jedna kategorija bitno preovlađuje ubaciš ga automatski u tu kategoriju, ako ne napraviš neku notifikaciju moderatoru. Kako ti baza raste, tako ti raste i preciznost automatike... Ako si zainteresovan malo preciznije definiši problem, pomoći ću ti oko koncepta. |
У питању је неки облик machine learning.
На линку http://www.ml-class.org/course/video/preview_list погледај видео Unsupervised Learning, имаш тамо пример са news.google.com. Можда после тога будеш на трагу решења :1064: |
Da, shvatam kako treba da se otprilike uradi...
Najpre preuzmem opis tj. glavni tekst koji opisuje ponudu... zatim iz njega izbacim opste reci kao sto su kupon,popust,din,od,do,cena i sl. i taj tekst uporedim sa recima iz jedne po jedne kategorije... i gde ima najvise poklapanja stavim tu kategoriju a ukoliko nema bitnih poklapanja saljem administratoru na odredjivanje... Sta mislite? Jednostavan alg. ali nadam se efikasan... |
Tako nekako. Pogledaj da li imaš još neki atribut osim opisa proizvoda koji možeš da iskoristiš, npr. sa kog sajta dolazi, cenu...
|
U mom slucaju kategorija ne zavisi ni od cene ni od sajtova... mozda samo dodam kategoriju proizvodu/usluge jeftiniji od 500din npr.
|
^ Mislim da nije BraMom imao to u vidu. Uzmi naprimer dva sledeća oglasa:
"Dvosoban stan na Karaburmi, 40m2, III, TA, 200e" i "Garsonjera u Žarkovu, 20m2, CG, VP, 30000e" Na osnovu cene prvi možeš da klasifikuješ u "stanovi/izdavanje" a drugi u "stanovi/prodaja", bez eksplicitne informacije o tome u samom oglasu. |
^ podržavam, ali on hoće da kategoriše stranice tipa http://www.kolektiva.rs/ koje u naslovu često nemaju nikakav pointer... ove stranice nisu classified, prema tome ja ne bih ni pokušavao to, bolje napravi neki pametni search...
|
pametni search??? ...Jednostavno cu uporediti tekst pa sa kojom kategorijom ima najvise poklapanja tamo cu dodati... nemoze da bude u pitanju ponuda npr. restorana a da se ta rec ne spominje ni u naslovu ni u opisu.
|
Vreme je GMT +2. Trenutno vreme je 16:38. |
Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.