Pogčedajte punu verziju : Slicni zapisi
Kako da selektujem sve slicne zapise iz neke tablice gde pod slicne podrazumevam nesto ovako:
id|value1|value2
--------------------
1|ivan|SNB
2|mr ivan|SNB
3|ivan|SNB doo
Moze da se radi i nad jednim poljem ako je problem na vise.
Kako se inace pristupa ovom problemu ?
Hvala
LiquidBrain
22. 10. 2008., 14:21
select * from tabela where value1 like '%ivan%' and value2 like '%SNB%'
Ajde ovo u pocetnicka pitanja :1023:
Bravo. Bilo bi lepo da imam samo reci "ivan" i "SNB".
Meni treba nacin da izvucem sve te reci iz tablice sa oko 100.000 zapisa pa da istu pretrazim za duplikate ...
Postoji nacin da prvo selektujem sve zapise, razbijem npr prvo polje na zasebne reci ako ima space, i onda za svaku rec radim upit pa ako vrati vise od jednog da ih pakujem u neku tablicu duplikata ...
Pitanje je da li postoji neko elegantno resenje za ovo ?
LiquidBrain
22. 10. 2008., 14:41
Dragi ivane, ukoliko stavish znak % on menja sve karaktere, dakle sa %ivan% naci ce se i
ivansadas, mr ivan...
A ako ti treba i vishe reci onda mozesh da uradish i varijantu
select * from tabela where value1 like ('%ivan%' OR value1 like '%nesto drugo%') and (value2 like '%SNB%' OR value2 like '%nesto trece%')
Ne kontas sta mi treba, ja ne znam da postoje reci "ivan", "nesto drugo", "SNB" i "nesto trece", vec treba da ih provalim dinamicno ...
japan
22. 10. 2008., 15:14
:)
pa dobro, ja razumem šta tebe muči - možeš da nađeš unos 'mr ivan' pomoću '%ivan%', ali ne i obrnuto.
međutim to obrnuto ti ni ne treba. ako prolaziš kroz sve zapise, bilo iz programa, bilo kursorom, uvek ćeš da naiđeš na najkraću reč koju ćeš da trpaš u uslov između %%. i nema potrebe da razbijaš po spejsu i da porediš za svaku reč...
ima tu dosta praznog hoda, ali ti rešava problem.
pseudo kod:
begin prođi kroz sve zapise
za svaki zapis
@@reper = trenutni zapis
begin
@@term = value1 trenutnog zapisa
begin prođi kroz sve zapise
za svaki zapis koji nije @@reper
begin
uporedi value1 sa @@term
...
end
end
end
end
btw, ne znam da li postoji neko elegantnije rešenje...
jablan
22. 10. 2008., 15:14
U svakom slučaju, moraćeš da se potrudiš da ti definicija pojma "sličan" bude malo bolja od "nešto ovako".
robi-bobi
22. 10. 2008., 15:47
izgleda da tebi treba nesto ovako samo u SQL-u?
http://bg2.php.net/manual/en/function.similar-text.php
mozda koristan link:
http://codejanitor.com/wp/2007/02/10/levenshtein-distance-as-a-mysql-stored-function/
srdjan
22. 10. 2008., 16:11
Sortiraj po rezultatu SOUNDEX funkcije :)
SELECT SOUNDEX ("Ivan"); -> I150
SELECT SOUNDEX ("Ivana"); -> I150
SELECT SOUNDEX ("Ivanka"); -> I152
SELECT SOUNDEX ("Ivanjica"); -> I152
SELECT SOUNDEX ("Anjica"); -> A520
http://dev.mysql.com/doc/refman/5.0/en/string-functions.html#function_soundex
LiquidBrain
22. 10. 2008., 16:14
How To Ask Questions The Smart Way (http://www.catb.org/~esr/faqs/smart-questions.html)
Mislim da niko od nas nije vidovit...
Morao sam na brzinu da nadjem resenje pa sam improvizovao i napravio nesto slicno onome sto je predlozio @japan.
@jablan, ne postoji neko tacno pravilo jer su podaci vrlo specificni. Morao bi da prikazem vecu kolicinu podataka kako bi nasli sablon.
U svakom slucaju, kada nadjem vremena pozabavicu se ovom temom (Soundex algoritam).
vBulletin® v3.6.8, Copyright ©2000-2024, Jelsoft Enterprises Ltd.