DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   (X)HTML, JavaScript, DHTML, XML, CSS (http://www.devprotalk.com/forumdisplay.php?f=8)
-   -   Bitno, nebitno ... (http://www.devprotalk.com/showthread.php?t=10654)

ivanet 03. 01. 2012. 01:18

Bitno, nebitno ...
 
Predlozite neku vrstu algoritma koji bi na osnovu kljucne reci u nekom tekstu odvajao bitno od nebitnog... npr. za kljucnu rec beograd izdvoji pasus ili recenice koje su najbitnije? Kako da izvedem to?


tj. neki algoritam za analiziranje teksta!

3banchi 03. 01. 2012. 01:32

omg

ivanet 03. 01. 2012. 01:40

Ne moras da komentarises ako ne znas nista pametno da kazes ;)

webarto 03. 01. 2012. 01:58

@3banchi omfg

ajankovic 03. 01. 2012. 02:04

To što tražiš se stručno zove Natural Language Processing. Imaš odličnu python biblioteku u kojoj je implementirano dosta alata za procesiranje teksta. Tako da jednostavne obrade možeš vrlo jednostavno da uradiš.

Ali ovo što ti tražiš ne spada u jednostavne obrade jer predstavlja izvlačenje značenja iz teksta i bez dobre teorijske podloge dobijaćeš iste rezultate kao da staviš random odabir paragrafa ili rečenica.

japan 03. 01. 2012. 02:06

Pocni odavde

ivanhoe 03. 01. 2012. 14:17

odabrao si ekstremno komplikovanu materiju, nije to nesto sto mozes na brzaka savladati...

ako te ipak zanima kljucne reci su ti data mining, text mining, pattern recognition, ontologies, natural language processing... pa kreni polako po blogovima i wikipediji da steknes predstavu o cemu je rec

ivanet 03. 01. 2012. 16:05

Znam da je ovo izuzetno teska materija ali vec sam krenuo da razvijam svoj nazvacu ga ''people minning'' algoritam... Zato sto ce se iz teksta najpre napraviti klasifikacija bitnog i manje bitnog na osnovu procenata ucesca kljucne reci, a zatim ce korisnici imati mogucnost da kliknu na link usefull - not usefull (nesto kao like-unlike) i ukoliko kliknu na not usefull na to mesto ce doci tekst koji je po meni bio od sekundarne vaznosti... vremenom ce se napraviti solidna baza iskristalisanih rezultata :) na osnovu onoga sto ljudi misle da je najbitnije. Dobra ideja?

japan 03. 01. 2012. 16:55

Konkretno, za kljucnu rec "Beograd", klincu backpackeru iz GB je najbitnije u kom hostelu moze da prespava, na kom splavu da se napije, i gde da pojede cevape, dok je nekome ko pise rad o istoriji Beograda najbitnije kad je Beograd oslobodjen od Turaka, kad su ga bombardovali Nemci, kad saveznici...

I cije "bitnije" je tu sad bitnije?

ivanet 03. 01. 2012. 17:45

Citat:

Originalno napisao japan (Napišite 104016)
Konkretno, za kljucnu rec "Beograd", klincu backpackeru iz GB je najbitnije u kom hostelu moze da prespava, na kom splavu da se napije, i gde da pojede cevape, dok je nekome ko pise rad o istoriji Beograda najbitnije kad je Beograd oslobodjen od Turaka, kad su ga bombardovali Nemci, kad saveznici...

I cije "bitnije" je tu sad bitnije?

Upravu si ali nisam mislio da se kombinuju stranice ve sam mislio ovako: stranica koja se bavi hotelima daje najbitnije informacije o hotelima, stranica koja se bavi istorijom daje najbitnije informacije o istoriji ali svakako ovaj koncept mora da se jako usavrsi.
Hvala na sugestiji, na mestu je svakako!


Vreme je GMT +2. Trenutno vreme je 12:42.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.