DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   Programiranje (http://www.devprotalk.com/forumdisplay.php?f=23)
-   -   Search Query Syntax (http://www.devprotalk.com/showthread.php?t=9954)

BraMom 26. 04. 2011. 11:57

Search Query Syntax
 
Pravim pretragu u mojoj aplikaciji. Hteo bih da izbegnem gomilu kontrola, pa sam se odlučio za gugl pristup. Znači koristim jedan input u koji korisnik unosi termin za pretragu, uradiću i neku jednostavnu sintaksu koja omogućava "advanced search", znate nešto kao kad u guglu otkucam:
Kôd:

site:devprotalk.com pretraga
Pitanje je da li postoji standard za ovakvu sintaksu i eventualno neki parser za upite? Bilo bi super kada bi postojala nekakva implementacija, pa još za .NET... I dobar primer kako je ovo urađeno u nekoj web aplikaciji je dobro došao.

Evo primera na šta mislim:
Microsoft
Google

jablan 26. 04. 2011. 15:14

Ne bi trebalo da ti upiti budu teški za parsiranje jer ne moraš da podržiš nikakvu komplikovanu (npr. ugnježdenu) strukturu, verovatno može regexpovima sasvim fino da se parsira.

ivanhoe 26. 04. 2011. 18:25

sve zavisi od baze koju koristis, najlakse ti je da koristis direktno sintaxu koju ona podrzava. Recimo mysql fulltext podrzava direktno operatore tipa one -,+, "" i slicno, tako da ja obicno pustim ljude da direktno kucaju te operatore (npr. "foo bar" +bla -blabla) i onda samo sa regexpima proverim da nema nedozvoljenih karaktera...

jablan 26. 04. 2011. 20:32

Off Topic: ^ Što bi ograničavao korisnicima set karaktera koji mogu da koriste u pretrazi?

ivanhoe 26. 04. 2011. 21:40

@jablan: Nisam lepo napisao, mislio sam na znake koji imaju posebno znacenje u fulltext pretragama... cisto da upozoris ljude ako pisu gluposti (vecini su boolean upiti jasni koliko i teorija niti...)

@braMom: A imas i onu foru kad korisnik trazi usera 'Pera Peric', a ocekuje zapravo da dobije +"Pera Peric", ali kad trazi fotografije sa 'sun sea' ocekuje da dobije prvo +sun +sea, ali i sve 'sun' ili 'sea', samo sortirane ispod. E tu onda zavisno od vrste pretrage treba malo akrobatike, da ti sam provalis sta korisnik zeli da dobije po defaultu (AND, OR, neku kombinaciju), pa da mu automatski formatiras tako na osnovu obicnog niza keyworda koje je on ukucao... Sve u svemu krvav posao ako zelis da napravis da zaista bude "k'o gugl" :)

BraMom 27. 04. 2011. 09:34

Hvala vam, verovatno ću za početak da iskoristim Jablanov predlog, neko jednostavno seckanje regexpovima.

@ivanhoe Vidim da je krvav, ne bi se raspitivao za postojeću implementaciju da mogu da ga napravim na brzinu ;)

jablan 27. 04. 2011. 13:14

Evo ako može da pomogne za početak:

Kôd:

def parse_query s
  s.scan(/((\S+)\:\s?)?([+-])?(("(.+?)")|(\S+))/).map{|match|
    Hash[
      [nil, :prefix, :plusminus, nil, nil, :phrase, :word].zip(match).select(&:all?)
    ]
  }
end

p parse_query 'foo +bar -baz "dev pro talk" site:devprotalk.com category:cat1'

vraća

Kôd:

[
  {:word=>"foo"},
  {:plusminus=>"+", :word=>"bar"},
  {:plusminus=>"-", :word=>"baz"},
  {:phrase=>"dev pro talk"},
  {:prefix=>"site", :word=>"devprotalk.com"},
  {:prefix=>"category", :word=>"cat1"}
]

http://ideone.com/oRMg5


Vreme je GMT +2. Trenutno vreme je 10:49.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.