Pogledajte određenu poruku
Staro 17. 08. 2007.   #1
Pedja
Predrag Supurović
Grand Master
 
Datum učlanjenja: 24.01.2006
Lokacija: Užice
Poruke: 791
Hvala: 3
200 "Hvala" u 12 poruka
Pedja is on a distinguished roadPedja is on a distinguished roadPedja is on a distinguished road
Default Parsiranje po lang atributu

Zaglavio sam se oko ovoga i ne umem da se iskobeljam. Odavno sam napravio Universal Language Tool (http://ult.datavoyage.com/) koji omogucava da se dosta jednostavno ugradi visejezicna podrska na sajt.

Radi to dosta fino ividim da ima ljudi koji korsite biblioteku.

Naime, bibloteka sada jednostavno parsira ceo HTML kod i zamenjuje predefinisane makroe ili vec radi obradu kakvu treba dabi taj dokument "prevela" na trazeni jezik.

Sad sam namerio da je malo unapredim. Hteo bih da iskorsiti lang atribut da izdvojim delove dokumenta koji su na razlicitim jezicima i da te delove tretiram odvojeno.

Primer: biblioteka lako prevodi cirilicni dokument u latinicni, ali se javljaju situacije kada je potrebno da se neki delovi cirilicnog dokumenta zadrze u cirilici a da seostatak prevede na latinicu.

Na primer, dokument koji sadrzi:

<div>Ово је текст написан ћирилицом: <span lang="sr">Дошла маца на вратанца</span></div>

...bi u latinicnoj varijati trebalo a izgleda ovako:

<div>Ovo je tekst napisan ćirilicom: <span lang="sr">Дошла маца на вратанца</span></div>

Nemam pojma kako ovo da isparsiram, s obzirom da:

- lang atribut može da se dodeli mnogim tagovima i

- lang atribut može da se ponavlja po dubini u hijerarhiji HTML objekata

Moja ideja je da nekako iseckam HTML dokument na delove tako da dobijem više delova koji više ne sadrže nijedan lang atribut i da za svaki imam informaciju koji jezik je važeći za taj deo dokumenta. Moje poznavanje regularnih izraza je inferiorno u odnosu na ovakvu potrebu

Da li je neko radio nesto slicno ili bar ima kakvu korisnu sugestiju?
Pedja je offline   Odgovorite uz citat