DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   Planiranje i usability (http://www.devprotalk.com/forumdisplay.php?f=35)
-   -   Klasterizacija Flickr tagova (http://www.devprotalk.com/showthread.php?t=152)

Goran Aničić 08. 08. 2005. 22:23

Klasterizacija Flickr tagova
 
Kad tad, i do ovoga je moralo doći. Usled potrebe bolje organizacije saržaja putem tagova - linkovanih asocijativnih reči koje korisnici (i/ili sami kreatori sadržaja) vezuju za pojedinačne sadržaje (u slučaju Flickr servisa - fotografije).

Do sada su za organizaciju i prezentaciju tagova, kao alternativne info-strukture, korišćene obične liste nabrajanja, koje su se pokazale kao nepraktično rešenje sa narastanjem broja tagova.

Jednostavno, povećanjem broja tagova otežava se navigacija kroz "šumu nekategorisanih tagova", a samim tim i kroz ponuđene sadržaje. Stoga se i uvidelo (što i sam sve više uviđam sa mojoj organizacijom tagova) da je potrebno dodati neku vrstu strukture i smislene organizacije tagovima.

Klasterizacija u praksi
U praksi, kada kliknete na neki tag dobijate opciju smeštanja taga u već postojeće klastere (kategorije) ili možete otvoriti sasvim novi klaster. Na primer, asocijaciju "car" povezuje više neimenovanih klastera tematski vezanih za automobile:
  • Klaster: road, street, driving, auto, cars, automobile, ford, classic, sign, truck
  • Klaster: reflection, mirror, window, rain, water, bridge, wash, glass, camera, windshield

Još jedan (nekoliko) dokaz "evolucije" Filckr-a možete pronaći u intervjuu koji je vodi J.J. Garrett sa jednim od pokretača ovog servisa.

marinowski 09. 08. 2005. 09:51

Slažem se da mora doći do klasterizacije, ili drugačijeg tretiranja tagova/ključnih reči kada njihov broj poraste na ... (upišite ovde vašu omiljenu brojku, veću od 100). Tagova jednostavno ima previše, i baratanje sa njima postaje rogobatno.

Projekat u koji sam uključen sadrži 430.000 različitih ključnih reči, sve ukupno vise od 18 miliona. Pretraga, obrađivanje ključnih reči u tom projektu postaje blago rečeno neudobno.

Dodatni problemi su višeznačnost reči, i neujednačeno dodeljivanje tagova, pa dosta toga zavisi od tražene reči. Npr. ako neko traži diamond, da li se mislilo na oblik romba, dijamant, karo znak u kartama ... Srećom, tu klasterizacija isto pomaže (did you mean ...)

Klasterizacija nije nimalo lagan posao. Treba na neki način dovesti u vezu tagove. Kod prve iteracije ovog obimnog posla može dosta pomoći WordNet, hijerarhijski leksički rečnik. Toplo ga preporučujem kod bilo kojeg posla sa mnoštvom reči.

Kako stoji situacija kod nas? Postoje pozitivni pomaci. Baš danas sam naleteo na srpski Aspell koji je baziran na korpusu srpskog jezika.

Prava stvar bi bio sprski WordNet, koji je, ako sam dobro razumeo, u izradi baš na PMF-u. Englesko-srpski rečnik bi dao dobru početnu iteraciju za WordNet, pretpostavljam da se od toga krenulo.

mungos 09. 09. 2005. 09:45

Kad se prica o tagovima, interesovalo bi me sledece misljenje. Koliko je dobar izbor pored tagova, koji bi u sistemu organizacije sadrzaja bili default opcija, postaviti i sistem navigacije kroz kategorije/direktorijum?

S tim sto bi kategorije bile svojevrsni editor's choice, odnosno pod nekom kategorijom urednik/moderator bi mogao da svrsta odredjene tagove. Npr. postoje tagovi tipa:

ALCATEL (5)
MITSUBISHI (3)
MOTOROLA (11)
NEC (1)
NOKIA (36)
PANASONIC (4)
SAGEM (2)
SAMSUNG (24)
SIEMENS (15)
SONY ERICSSON (21)
VERTU (2)

Urednik ih jednosatvno sve ubaci u kategoriju Mobilna telefonija. Fakticki, egzistirala bi tri tipa pronalazenja sadrzaja: tags, categories, search.

Goran Aničić 09. 09. 2005. 15:40

Svakako je dobro ponuditi različite forme organizacije i prezentacije sadržaja, tako da korisnici u zavisnosti od znanja i iskustva mogu potpunije da iskoriste ponuđene sadržaje.

Ilija Studen 09. 09. 2005. 17:01

Kad napokon budem odlučio da preradio area51 (nadam se uskoro) definitivno ću zadržati labele (tagove), ali ću dodati i kategorije. To bi odgovaralo tome što si naveo pošto ima i pretraga.

Thumbs up za to rešenje, ako imaš vremena i potrebu da tako nešto izvedeš.

mungos 14. 09. 2005. 11:41

Da nastavio diskusiju, interesuje me vas stav po pitanju organizacije koja podrazumijeva sistem takav da korisnici pri postavljanju tagova mogu da ih svrstaju samo u okviru ranije predefinasanih kategorija od strane urednika.

Tipa na sajtu postoje predefinsane kategorije: IBM, Intel, Apple, Microsoft, Dell, Acer, LG

Korisnik recimo zeli da postavi tag iPod, i podrazumijeva se da ga postavlja u Apple kategoriju.

Goran Aničić 14. 09. 2005. 22:12

Citat:

Da nastavio diskusiju, interesuje me vas stav po pitanju organizacije koja podrazumijeva sistem takav da korisnici pri postavljanju tagova mogu da ih svrstaju samo u okviru ranije predefinasanih kategorija od strane urednika.
Ovo je upravo klasterizacija, s tim što ona ne podrazumeva predefinisane kategorije (naravno, može da ih bude), već se samim koirsnicima prepušta dodavanje novih kategorija.


Vreme je GMT +2. Trenutno vreme je 21:39.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.