Klasterizacija Flickr tagova
Kad tad, i do ovoga je moralo doći. Usled potrebe bolje organizacije saržaja putem tagova - linkovanih asocijativnih reči koje korisnici (i/ili sami kreatori sadržaja) vezuju za pojedinačne sadržaje (u slučaju Flickr servisa - fotografije).
Do sada su za organizaciju i prezentaciju tagova, kao alternativne info-strukture, korišćene obične liste nabrajanja, koje su se pokazale kao nepraktično rešenje sa narastanjem broja tagova. Jednostavno, povećanjem broja tagova otežava se navigacija kroz "šumu nekategorisanih tagova", a samim tim i kroz ponuđene sadržaje. Stoga se i uvidelo (što i sam sve više uviđam sa mojoj organizacijom tagova) da je potrebno dodati neku vrstu strukture i smislene organizacije tagovima. Klasterizacija u praksi U praksi, kada kliknete na neki tag dobijate opciju smeštanja taga u već postojeće klastere (kategorije) ili možete otvoriti sasvim novi klaster. Na primer, asocijaciju "car" povezuje više neimenovanih klastera tematski vezanih za automobile:
Još jedan (nekoliko) dokaz "evolucije" Filckr-a možete pronaći u intervjuu koji je vodi J.J. Garrett sa jednim od pokretača ovog servisa. |
Slažem se da mora doći do klasterizacije, ili drugačijeg tretiranja tagova/ključnih reči kada njihov broj poraste na ... (upišite ovde vašu omiljenu brojku, veću od 100). Tagova jednostavno ima previše, i baratanje sa njima postaje rogobatno.
Projekat u koji sam uključen sadrži 430.000 različitih ključnih reči, sve ukupno vise od 18 miliona. Pretraga, obrađivanje ključnih reči u tom projektu postaje blago rečeno neudobno. Dodatni problemi su višeznačnost reči, i neujednačeno dodeljivanje tagova, pa dosta toga zavisi od tražene reči. Npr. ako neko traži diamond, da li se mislilo na oblik romba, dijamant, karo znak u kartama ... Srećom, tu klasterizacija isto pomaže (did you mean ...) Klasterizacija nije nimalo lagan posao. Treba na neki način dovesti u vezu tagove. Kod prve iteracije ovog obimnog posla može dosta pomoći WordNet, hijerarhijski leksički rečnik. Toplo ga preporučujem kod bilo kojeg posla sa mnoštvom reči. Kako stoji situacija kod nas? Postoje pozitivni pomaci. Baš danas sam naleteo na srpski Aspell koji je baziran na korpusu srpskog jezika. Prava stvar bi bio sprski WordNet, koji je, ako sam dobro razumeo, u izradi baš na PMF-u. Englesko-srpski rečnik bi dao dobru početnu iteraciju za WordNet, pretpostavljam da se od toga krenulo. |
Kad se prica o tagovima, interesovalo bi me sledece misljenje. Koliko je dobar izbor pored tagova, koji bi u sistemu organizacije sadrzaja bili default opcija, postaviti i sistem navigacije kroz kategorije/direktorijum?
S tim sto bi kategorije bile svojevrsni editor's choice, odnosno pod nekom kategorijom urednik/moderator bi mogao da svrsta odredjene tagove. Npr. postoje tagovi tipa: ALCATEL (5) MITSUBISHI (3) MOTOROLA (11) NEC (1) NOKIA (36) PANASONIC (4) SAGEM (2) SAMSUNG (24) SIEMENS (15) SONY ERICSSON (21) VERTU (2) Urednik ih jednosatvno sve ubaci u kategoriju Mobilna telefonija. Fakticki, egzistirala bi tri tipa pronalazenja sadrzaja: tags, categories, search. |
Svakako je dobro ponuditi različite forme organizacije i prezentacije sadržaja, tako da korisnici u zavisnosti od znanja i iskustva mogu potpunije da iskoriste ponuđene sadržaje.
|
Kad napokon budem odlučio da preradio area51 (nadam se uskoro) definitivno ću zadržati labele (tagove), ali ću dodati i kategorije. To bi odgovaralo tome što si naveo pošto ima i pretraga.
Thumbs up za to rešenje, ako imaš vremena i potrebu da tako nešto izvedeš. |
Da nastavio diskusiju, interesuje me vas stav po pitanju organizacije koja podrazumijeva sistem takav da korisnici pri postavljanju tagova mogu da ih svrstaju samo u okviru ranije predefinasanih kategorija od strane urednika.
Tipa na sajtu postoje predefinsane kategorije: IBM, Intel, Apple, Microsoft, Dell, Acer, LG Korisnik recimo zeli da postavi tag iPod, i podrazumijeva se da ga postavlja u Apple kategoriju. |
Citat:
|
Vreme je GMT +2. Trenutno vreme je 21:39. |
Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.