|
![]() |
#1 |
Knowledge base
Wrote a book
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
![]() ![]() |
![]() A kako spojiti 'Posh' sa 'Victoria', 'Spice Girls' itd?
__________________
Năo quero mais seguir um só caminho |
![]() |
![]() |
![]() |
#2 |
Siva eminencija
Grand Master
|
![]() |
![]() |
![]() |
![]() |
#3 |
VD IT Direktora
Invented the damn thing
Datum učlanjenja: 08.06.2005
Lokacija: Beograd
Poruke: 2.118
Hvala: 503
1.307 "Hvala" u 282 poruka
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]() Na taj način što će verovatno barem dve od te tri fraze naći u istom tekstu (kao i "Dejvid Bekam", što je još jedna od fraza za povezivanje sa srodnim vestima).
Random primer (izvinjavam se čitaocima sa slabijim stomakom ![]() http://www.kurir-info.co.yu/Arhiva/2...16122005.shtml Poslednja izmena od jablan : 15. 05. 2007. u 00:19. |
![]() |
![]() |
![]() |
#4 |
Knowledge base
Wrote a book
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
![]() ![]() |
![]() Posh i Spajs se pominju samo jednom u tekstu, postoji velika verovatnoca da ne bi imali odgovarajucu tezinu za povezivanje sa Viktorijom Bekam, odnosno srodnim clancima.
__________________
Năo quero mais seguir um só caminho |
![]() |
![]() |
![]() |
#5 |
VD IT Direktora
Invented the damn thing
Datum učlanjenja: 08.06.2005
Lokacija: Beograd
Poruke: 2.118
Hvala: 503
1.307 "Hvala" u 282 poruka
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]() Pa cenim da bi Poš i Spajs upali u prvih 10-20 tagova za ovaj tekst, pogotovu ako se poveća težina reči sa velikim slovom (što je logično za tagove ovakvog tipa). Na kraju krajeva, dovoljno je da imaš ključne reči "Viktorija" i "Bekam" da bi je povezao sa srodnim člancima. Ja bih svakako probao ovaj algoritam pre nego ga otpišem.
|
![]() |
![]() |
![]() |
#6 |
Knowledge base
Wrote a book
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
![]() ![]() |
![]() Mislim da jedino bluesman moze da nam odgovori valja li algoritam
![]()
__________________
Năo quero mais seguir um só caminho |
![]() |
![]() |
![]() |
#7 |
Vladan Zirojević
Grand Master
|
![]() Jablene, u opstem slucaju hoce, ali u nekom procentu nece, pa to "verovatno" ce mu opet praviti false-positives kao i da radi obicni fulltext search, samo treba vidjeti sa kojim procentom greske.
Ne znam koliko je ta funkcionalnost vazna za Bluzmenov projekat, ako nije pretjerano, neki od ovdje navedenih algoritama ce ti zavristi posao. Ako jeste vazna/osnovna funkcionalnost, onda tu ima dosta posla... Jer nije samo pitanje da se izbace vijesti koje nisu dovoljno slicne, vec (ako je to bitna funkcionalnost) i ne preskoce vijesti koje su bitne i vrlo povezane, ali zbog upotrebe sinonima ili slicno nisu pogodjene obicnim poredjenjem sadrzaja teksta, koji je u ovome slucaju prilicno kratak (100 znakova). Mungos je upravo na ovome problemu zaustavio rad na Momentu, zato sto nije dobijao dovoljno kvalitetne srodne vijesti. |
![]() |
![]() |
![]() |
#8 |
VD IT Direktora
Invented the damn thing
Datum učlanjenja: 08.06.2005
Lokacija: Beograd
Poruke: 2.118
Hvala: 503
1.307 "Hvala" u 282 poruka
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]() Da, prevideo sam možda, 100 karaktera je stvarno malo. Kakve su to vesti uopšte?
|
![]() |
![]() |
![]() |
#9 |
Knowledge base
Wrote a book
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
![]() ![]() |
![]() Procenat greske se moze smanjiti ako se analiziraju i clanci sa proverenih izvora (primer: http://www.articlesbase.com, ima vise od 134 hiljade clanaka), pa se kreira neki sistem vezanih keyworda, a baza sinonima bi olaksala posao.
Svejedno, ima tu dosta posla, ako je kvalitet jako bitan, onda jedino rucno dodeljivanje tagova dolazi u obzir. Evo znam neke Indijce koji bi to radili za saku dolara ![]()
__________________
Năo quero mais seguir um só caminho |
![]() |
![]() |
![]() |
#10 |
Ivan Dilber
Sir Write-a-Lot
|
![]() ta vasa ideja zvuci kao nesto gde bi se mogao uklopiti Bayesov filtar, kao za spam sto se koristi. Nadju se verovatnoce da se neka rec nalazi na odredjenoj poziciji u recenici i verovatnoca da bude u istoj recenici sa drugim recima, pa onda preko toga mogu da se nadju slicne recenice...
e a kad to neko isprogramira da actually radi, onda sjebemo google, postignemo svetsku dominaciju na trzistu SE i otkupimo donesi.com za 2 milijarde dolara... ![]()
__________________
Leadership is the art of getting people to want to do what you know must be done. |
![]() |
![]() |
![]() |
|
|
![]() |
||||
Tema | Početna poruka teme | Forum | Odgovori | Poslednja poruka |
Budućnost Interneta | vidak | e-Business | 15 | 15. 03. 2011. 21:08 |
Etičnost u marketingu, again | mileusna | Marketing i SEO | 9 | 22. 02. 2008. 23:48 |