Slicni zapisi [Arhiva]

Pogčedajte punu verziju : Slicni zapisi

Ivan

22. 10. 2008., 14:15

LiquidBrain

22. 10. 2008., 14:21

select * from tabela where value1 like '%ivan%' and value2 like '%SNB%'

Ajde ovo u pocetnicka pitanja :1023:

Ivan

22. 10. 2008., 14:34

Bravo. Bilo bi lepo da imam samo reci "ivan" i "SNB".

Meni treba nacin da izvucem sve te reci iz tablice sa oko 100.000 zapisa pa da istu pretrazim za duplikate ...

Postoji nacin da prvo selektujem sve zapise, razbijem npr prvo polje na zasebne reci ako ima space, i onda za svaku rec radim upit pa ako vrati vise od jednog da ih pakujem u neku tablicu duplikata ...

Pitanje je da li postoji neko elegantno resenje za ovo ?

LiquidBrain

22. 10. 2008., 14:41

Dragi ivane, ukoliko stavish znak % on menja sve karaktere, dakle sa %ivan% naci ce se i
ivansadas, mr ivan...

A ako ti treba i vishe reci onda mozesh da uradish i varijantu

select * from tabela where value1 like ('%ivan%' OR value1 like '%nesto drugo%') and (value2 like '%SNB%' OR value2 like '%nesto trece%')

Ivan

22. 10. 2008., 15:00

Ne kontas sta mi treba, ja ne znam da postoje reci "ivan", "nesto drugo", "SNB" i "nesto trece", vec treba da ih provalim dinamicno ...

japan

22. 10. 2008., 15:14

:)

pa dobro, ja razumem šta tebe muči - možeš da nađeš unos 'mr ivan' pomoću '%ivan%', ali ne i obrnuto.

međutim to obrnuto ti ni ne treba. ako prolaziš kroz sve zapise, bilo iz programa, bilo kursorom, uvek ćeš da naiđeš na najkraću reč koju ćeš da trpaš u uslov između %%. i nema potrebe da razbijaš po spejsu i da porediš za svaku reč...

ima tu dosta praznog hoda, ali ti rešava problem.

pseudo kod:

begin prođi kroz sve zapise
za svaki zapis
@@reper = trenutni zapis
begin
@@term = value1 trenutnog zapisa
begin prođi kroz sve zapise
za svaki zapis koji nije @@reper
begin
uporedi value1 sa @@term
...
end
end
end
end

btw, ne znam da li postoji neko elegantnije rešenje...

jablan

22. 10. 2008., 15:14

U svakom slučaju, moraćeš da se potrudiš da ti definicija pojma "sličan" bude malo bolja od "nešto ovako".

robi-bobi

22. 10. 2008., 15:47

izgleda da tebi treba nesto ovako samo u SQL-u?
http://bg2.php.net/manual/en/function.similar-text.php

mozda koristan link:
http://codejanitor.com/wp/2007/02/10/levenshtein-distance-as-a-mysql-stored-function/

srdjan

22. 10. 2008., 16:11

Sortiraj po rezultatu SOUNDEX funkcije :)

SELECT SOUNDEX ("Ivan"); -> I150
SELECT SOUNDEX ("Ivana"); -> I150
SELECT SOUNDEX ("Ivanka"); -> I152
SELECT SOUNDEX ("Ivanjica"); -> I152
SELECT SOUNDEX ("Anjica"); -> A520

http://dev.mysql.com/doc/refman/5.0/en/string-functions.html#function_soundex

LiquidBrain

22. 10. 2008., 16:14

How To Ask Questions The Smart Way (http://www.catb.org/~esr/faqs/smart-questions.html)

Mislim da niko od nas nije vidovit...

Ivan

23. 10. 2008., 01:04

Morao sam na brzinu da nadjem resenje pa sam improvizovao i napravio nesto slicno onome sto je predlozio @japan.

@jablan, ne postoji neko tacno pravilo jer su podaci vrlo specificni. Morao bi da prikazem vecu kolicinu podataka kako bi nasli sablon.

U svakom slucaju, kada nadjem vremena pozabavicu se ovom temom (Soundex algoritam).