|
|
Pedja |
23. 03. 2006. 11:27 |
Kako se borite protiv pretrazivaca?
Nesumnjivo je da nam je svima cilj da sajtovi budu sto popularniji, poseceniji i da nam je vazno da se sto bolje kotiraju na pretrazivacima.
Medjutim, ve neko vreme unazad, pretrazivaci su poceli cudno da se ponasaju. Indeksiraju sajtove cesto, a ako se radi o dinamickim sadrzajima umeju da upadnu u petlje pa jedan isti sadrzaj indeksiraju vise puta.
Rezultat je da je osetno povecana potrosnja protoka na sajtovima. Ovo je posebno primetno kod sajtova koji imaju veliki obim, odnosno veliki broj dokumenata (portali, forumi i slicno).
Ovo se desava sa Google, MSN, Alexom, pa cak i Pogotkom.
Jeste li imali ovakve probleme i kako izlazite sa tim na kraj?
Meni je vecpostala normalna procedura da za svaki sajtunapred pravi robots.txt koji ogranicava indeksiranje robotim samo na ono sto je zaista neophodno indeksirati, ali je to prilicno neefikasno jer cilj jeste da ipak skoro sav sadrzaj bude indeksiran.
Probao sam i da kroz robots smanim frekvenciju indeksiranja, bar kod staticnijih sajtova, medjutim, izgleda da pretrazivaci za te instrukcije mnogo ne mare (Crawl-delay).
Mozda je dobar nacin da se pravi sitemap a da se pretrazivacima kroz robots.txt zabrani da ista indeksiraju na svoju ruku, vec da samo koriste sitemap?
|
zextra |
23. 03. 2006. 15:20 |
Sto ne bi napravio robots.txt da bude dinamicki (registrujes .txt kao php skriptu), pa kontrolises ko kad moze da dodje na koji deo sajta?
|
cvele |
24. 03. 2006. 08:37 |
mod_rewrite... pogledaj temu iznad ove
|
Pedja |
24. 03. 2006. 08:48 |
Citat:
Originalno napisao zextra
Sto ne bi napravio robots.txt da bude dinamicki (registrujes .txt kao php skriptu), pa kontrolises ko kad moze da dodje na koji deo sajta?
|
To moze samo da odmogne, jer ako pretrazivac dodje na sajt a zabranjen mu ej pristup, to deluje kontraproduktivno.
Citat:
Originalno napisao cvele
mod_rewrite... pogledaj temu iznad ove
|
Na koji nacin mod_rewrite moze da pomogne?
|
ivanhoe |
24. 03. 2006. 12:21 |
Citat:
Originalno napisao Pedja
Na koji nacin mod_rewrite moze da pomogne?
|
pa kazes da se spajderi zbunjuju oko dinamickih url-ova, pa ucitavaju istu stranu vise puta (sto uzgred moze da ti donese negativne poene za kloniranje sadrzaja)...sakri sve dinamicke urlove da izgledaju lepo pomocu mod_rewrite i nemas taj problem...
dodatno google-u mozes da ponudis sitemap.xml fajl, a za vecinu robota mozes da koristis slicne tehnike kao kod rada sa cache-om, znaci da koristis Last-modified i If-Modified-Since headere da bi sprecio spajder da ucitava strane koje se nisu promenile..
A mozes i da uzmes hosting sa vecim protokom, sto mi se cini kao lakse resenje :)
|
Pedja |
24. 03. 2006. 19:42 |
Problem je sto se ovo desava i sa recimo forumom i sa staticnim sajtom (bukvalno je 90% sadrzaja cist HTML).
Niej problem hosting, nego sto je ovo postala cesta pojava i primecujem da skoro svaki veci sajt ima slican problem - pretrazivaci prave mnogo veci protok nego stvarni korisnici.
|
cvele |
24. 03. 2006. 20:32 |
ako imas veliki sajt to znaci da ti nije problem da platis flat hosting tako da zaista nevidim problem u svemu ovome
ivanhoe je objasnio kako mod_rewrite moze da pomogne
|
sirNemanjapro |
03. 04. 2006. 19:09 |
Jel nije problem neko da postuje robots.txt (sa disalow na nekim stranama) i sitemap.xml?
|
Vreme je GMT +2. Trenutno vreme je 01:31. |
|
Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.
Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.