PDA

Pogčedajte punu verziju : Slicni zapisi


Ivan
22. 10. 2008., 14:15
Kako da selektujem sve slicne zapise iz neke tablice gde pod slicne podrazumevam nesto ovako:

id|value1|value2
--------------------
1|ivan|SNB
2|mr ivan|SNB
3|ivan|SNB doo

Moze da se radi i nad jednim poljem ako je problem na vise.
Kako se inace pristupa ovom problemu ?

Hvala

LiquidBrain
22. 10. 2008., 14:21
select * from tabela where value1 like '%ivan%' and value2 like '%SNB%'


Ajde ovo u pocetnicka pitanja :1023:

Ivan
22. 10. 2008., 14:34
Bravo. Bilo bi lepo da imam samo reci "ivan" i "SNB".

Meni treba nacin da izvucem sve te reci iz tablice sa oko 100.000 zapisa pa da istu pretrazim za duplikate ...

Postoji nacin da prvo selektujem sve zapise, razbijem npr prvo polje na zasebne reci ako ima space, i onda za svaku rec radim upit pa ako vrati vise od jednog da ih pakujem u neku tablicu duplikata ...

Pitanje je da li postoji neko elegantno resenje za ovo ?

LiquidBrain
22. 10. 2008., 14:41
Dragi ivane, ukoliko stavish znak % on menja sve karaktere, dakle sa %ivan% naci ce se i
ivansadas, mr ivan...

A ako ti treba i vishe reci onda mozesh da uradish i varijantu


select * from tabela where value1 like ('%ivan%' OR value1 like '%nesto drugo%') and (value2 like '%SNB%' OR value2 like '%nesto trece%')

Ivan
22. 10. 2008., 15:00
Ne kontas sta mi treba, ja ne znam da postoje reci "ivan", "nesto drugo", "SNB" i "nesto trece", vec treba da ih provalim dinamicno ...

japan
22. 10. 2008., 15:14
:)

pa dobro, ja razumem šta tebe muči - možeš da nađeš unos 'mr ivan' pomoću '%ivan%', ali ne i obrnuto.

međutim to obrnuto ti ni ne treba. ako prolaziš kroz sve zapise, bilo iz programa, bilo kursorom, uvek ćeš da naiđeš na najkraću reč koju ćeš da trpaš u uslov između %%. i nema potrebe da razbijaš po spejsu i da porediš za svaku reč...

ima tu dosta praznog hoda, ali ti rešava problem.

pseudo kod:


begin prođi kroz sve zapise
za svaki zapis
@@reper = trenutni zapis
begin
@@term = value1 trenutnog zapisa
begin prođi kroz sve zapise
za svaki zapis koji nije @@reper
begin
uporedi value1 sa @@term
...
end
end
end
end


btw, ne znam da li postoji neko elegantnije rešenje...

jablan
22. 10. 2008., 15:14
U svakom slučaju, moraćeš da se potrudiš da ti definicija pojma "sličan" bude malo bolja od "nešto ovako".

robi-bobi
22. 10. 2008., 15:47
izgleda da tebi treba nesto ovako samo u SQL-u?
http://bg2.php.net/manual/en/function.similar-text.php

mozda koristan link:
http://codejanitor.com/wp/2007/02/10/levenshtein-distance-as-a-mysql-stored-function/

srdjan
22. 10. 2008., 16:11
Sortiraj po rezultatu SOUNDEX funkcije :)

SELECT SOUNDEX ("Ivan"); -> I150
SELECT SOUNDEX ("Ivana"); -> I150
SELECT SOUNDEX ("Ivanka"); -> I152
SELECT SOUNDEX ("Ivanjica"); -> I152
SELECT SOUNDEX ("Anjica"); -> A520

http://dev.mysql.com/doc/refman/5.0/en/string-functions.html#function_soundex

LiquidBrain
22. 10. 2008., 16:14
How To Ask Questions The Smart Way (http://www.catb.org/~esr/faqs/smart-questions.html)

Mislim da niko od nas nije vidovit...

Ivan
23. 10. 2008., 01:04
Morao sam na brzinu da nadjem resenje pa sam improvizovao i napravio nesto slicno onome sto je predlozio @japan.

@jablan, ne postoji neko tacno pravilo jer su podaci vrlo specificni. Morao bi da prikazem vecu kolicinu podataka kako bi nasli sablon.

U svakom slucaju, kada nadjem vremena pozabavicu se ovom temom (Soundex algoritam).