DevProTalk

Forumi IT profesionalaca
web development, web design, e-business, SEO


Idite nazad   DevProTalk > Web development i web aplikacije > (X)HTML, JavaScript, DHTML, XML, CSS
Želite da se reklamirate ekskluzivno na ovoj poziciji? Javite se

(X)HTML, JavaScript, DHTML, XML, CSS Client scripting tehnologije, Dynamic HTML, Cascading Stylesheets, XML i standardi

Odgovori
 
Alati teme Način prikaza
Staro 04. 01. 2012.   #11
ivanet
profesionalac
Professional
 
Datum učlanjenja: 19.09.2011
Poruke: 241
Hvala: 15
9 "Hvala" u 8 poruka
ivanet je ponekada pravio frku ranije
Default

Prirodna obrada teksta jeste stvarno zajebana stvar. Postoje li vec neka istrazivanja sa open-source kodom. Trazio sam na netu ali nisam nasao nista korisno.
ivanet je offline   Odgovorite uz citat
Staro 04. 01. 2012.   #12
ivanet
profesionalac
Professional
 
Datum učlanjenja: 19.09.2011
Poruke: 241
Hvala: 15
9 "Hvala" u 8 poruka
ivanet je ponekada pravio frku ranije
Default

Ovaj http://www.nltk.org/ sajt nudi ono sto je neko spomenuo - prirodnu obradu teksta ali je nazalost rec o pyton a ne o php codu.
ivanet je offline   Odgovorite uz citat
Staro 04. 01. 2012.   #13
japan
novi klan
Professional
 
Avatar japan
 
Datum učlanjenja: 03.02.2007
Poruke: 326
Hvala: 43
427 "Hvala" u 50 poruka
japan će postati "faca" uskorojapan će postati "faca" uskorojapan će postati "faca" uskorojapan će postati "faca" uskorojapan će postati "faca" uskoro
Default

Niko ti ne brani da ga portujes
__________________
We professional we dealin' with business
japan je offline   Odgovorite uz citat
Staro 04. 01. 2012.   #14
ivanet
profesionalac
Professional
 
Datum učlanjenja: 19.09.2011
Poruke: 241
Hvala: 15
9 "Hvala" u 8 poruka
ivanet je ponekada pravio frku ranije
Default

Problem je sto nisam do sada radio ''pyton'' projekte pa mi treba vremena da proucim, naucim, koristim. php mi mnogo vise lezi
ivanet je offline   Odgovorite uz citat
Staro 04. 01. 2012.   #15
ivanet
profesionalac
Professional
 
Datum učlanjenja: 19.09.2011
Poruke: 241
Hvala: 15
9 "Hvala" u 8 poruka
ivanet je ponekada pravio frku ranije
Default

E sad jedno banalno pitanje ali me jako interesuje... sta ako sa neke stranice pruzmem tekst zatim taj tekst podelim na paragrafe i iskoristim php funciju similar_text koja daje procenat podudarnosti, onaj paragraf koji ima najveci stepen podudarnosti ima i najvecu verovatnocu da je koristan ? - ne mora da znaci ali verovatno u 80% slucajeva?


Zna li ko, da li ova funcija meri stepen podudarnsoti izmedju karaktera tj. slova ili izmedju reci?

Poslednja izmena od ivanet : 04. 01. 2012. u 22:55.
ivanet je offline   Odgovorite uz citat
Staro 04. 01. 2012.   #16
ivanet
profesionalac
Professional
 
Datum učlanjenja: 19.09.2011
Poruke: 241
Hvala: 15
9 "Hvala" u 8 poruka
ivanet je ponekada pravio frku ranije
Default

Evo jednog predloga za algoritam a nadam se feedbacku:

1.Za odredjenu kljucnu rec preuzme se tekst sa 10 najrelevantnijih strana
2.Izbace se reci a,and,or, ... tj. tipicne reci za odredjeno govorno podrucje
3.Sve strane se objedinjuju i pronalaze se 10-ak najzastupljenijih kljucnih reci za sve strane
4.Sada se svaka strana posebno deli na paragrafe i svaki paragraf se analizira sa tih 10-ak najzastupljenijih kljucnih reci i onaj sa najvise podudarnosti se izdvaja.

Prosto ali ne znam samo koliko i ucinkovito
ivanet je offline   Odgovorite uz citat
Staro 09. 01. 2012.   #17
ivanet
profesionalac
Professional
 
Datum učlanjenja: 19.09.2011
Poruke: 241
Hvala: 15
9 "Hvala" u 8 poruka
ivanet je ponekada pravio frku ranije
Default

"The app uses an algorithm to recognise what category of information a webpage contains by using "ontological detection" to identify its nature which in turn determines which set of instructions should be used to provide a consolidated summary of its text."

Sta bi tacno znacilo "ontological detection" ?


http://www.enggjournals.com/ijcse/do...-03-03-117.pdf

Poslednja izmena od ivanet : 09. 01. 2012. u 03:18.
ivanet je offline   Odgovorite uz citat
Staro 09. 01. 2012.   #18
webarto
expert
Grand Master
 
Avatar webarto
 
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
webarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished road
Default





Obrati pažnju na gornji desni ugao

Meni nije jasno zašto to uopšte pokušavaš, pod 1, već ima, i aplikacija je prevara, jer tako nešto je u suštini impossibru. Pod 2, teško je to napraviti, a onda se vrati na 1.
__________________
Github // LinkedIn // PHP // ZCE // Stackoverflow PHP // Site5 Web Hosting

Poslednja izmena od webarto : 09. 01. 2012. u 04:10.
webarto je offline   Odgovorite uz citat
Staro 09. 01. 2012.   #19
ivanet
profesionalac
Professional
 
Datum učlanjenja: 19.09.2011
Poruke: 241
Hvala: 15
9 "Hvala" u 8 poruka
ivanet je ponekada pravio frku ranije
Default

App je zaista lose odradjen i ne daje u 50% slucajeva neke korisne rezultate... ali ono sto ja pokusavam je malo vise od toga.

Npr. potrebno mi je da za neki topic dobijem kljucne reci koje ga objasnjavaju
sportski automobili <=> ferari,porse,audi ...

A takodje i mogucnost da se obradjuje upit pa tako ako u upitu postoji ''where'' onda se upit odnosi na lokaciju, ako u upitu postoji "why" ... i slicne kombinacije, ako postoji znak $ , "e" , "din" odnosi se na cenu , m2 - na kvadraturu i sl. i na osnovu upita da gewnerise potrebne rezultate!


tj. ZELIM DA URADIM PRETRAZIVAC DA SE NA OSNOVU UPITA AUTOMATSKI GENERISE ODGOVOR KOJI SE PRONALAZI U REZULTATIMA GUGLA, BINGA I BLEKKA!

UPISE SE "kOLIKO KM2 IMA PARIS" I ANALIZOM STRANA DOBIJE SE ODGOVOR znam da je tesko ali ne i nemoguce.

Poslednja izmena od ivanet : 09. 01. 2012. u 16:21.
ivanet je offline   Odgovorite uz citat
Staro 09. 01. 2012.   #20
ivanet
profesionalac
Professional
 
Datum učlanjenja: 19.09.2011
Poruke: 241
Hvala: 15
9 "Hvala" u 8 poruka
ivanet je ponekada pravio frku ranije
Default

Cak sta vise ovaj sajt www.qwiki.com je mnogo blizi onom sto zelim da uradim nego li summly ... samo naravno sa tekstom, slikama i videom bez citanja teksta...

Takoreci da se na osnovu upita dobije stranica sastavljena od wikipedia informacija, slika, videa i ostalih elemenata koji se pronadju za odredjeni upit!
ivanet je offline   Odgovorite uz citat
Odgovori



Pravila pisanja
Možete ne započinjati nove teme
Možete ne slati odgovore
Možete ne slati priloge
Možete ne izmeniti svoje poruke
vB kôd je Uključen
Smajliji su Uključen
[IMG] kod je Uključen
HTML kôd je Isključen
Pogledajte forum


Vreme je GMT +2. Trenutno vreme je 01:45.


Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.
Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.