DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   Linkovi (http://www.devprotalk.com/forumdisplay.php?f=22)
-   -   Novi SEO alat (http://www.devprotalk.com/showthread.php?t=6859)

diplomata 08. 01. 2009. 17:58

Novi SEO alat
 
Prije par dana pustili smo eksperimentalno sajt koji ce pokusati (ako server ne izgori :) ) da indeksira sve domene (samo prve strane).
Sa svakog domena "vadimo" meta podatke, najcesce koristene keyworde i domene prema kojima postoji link. Takodje se kupe i podaci o IP adresi servera.
Sve to ce omoguciti razlicito kombinovanje podataka (koji domeni su medjusobno linkovani, koji koriste slicne kljucne rijeci, koji se domeni nalaze na istom serveru i slicno).

Ako ste voljni da pogledate i date neke prijedloge www.displaydetails.com

P.S. Jos neke stvari nisu 100% optimizovane, ali u principu sve funkcionise.

Baic 08. 01. 2009. 19:42

Zanimljiv projekat. Takva baza ima veliku perspektivu.

Predlazem da za keyword odradite neko kesiranje, da bi ste ubrzali ucitavanje, a pomoglo bi i da se izbegne opterecenje.

Srecno.

Peca 08. 01. 2009. 19:51

koji je cilj i svrha projekta?

ivanhoe 08. 01. 2009. 20:25

^ da se obogate :)

Peca 08. 01. 2009. 21:51

:)
da preformulisem - kakvu uslugu/servis ovaj sajt moze pruziti, odnosno - za sta ce ga ljudi koristiti, sta on nudi?

kodi 08. 01. 2009. 22:04

kad kazes sve domene, jel mislis na sve domene na svetu, ili samo domace domene?

presretach 08. 01. 2009. 23:54

Ja razumeh za domace, za sve bi bilo malo mlogo, mada nikad nije kasno. Samo da ne kreci iz garaze (blokovi) :).

jasmanac 09. 01. 2009. 00:02

Eno vam ga cetvrti link "By country" sto znaci da se odnosi na ceo internet. Mislim da je stvar previse optimisticna i da zahteva ogromne resurse. Ali u poslu se treba voditi velikim idejama :)

diplomata 10. 01. 2009. 11:33

U principu, ovo je ekspriment :)
Znaci pratim kako se trose resursi i kako se ponasa baza, koja stalno raste jer se svi podaci kesiraju. Za sada ne postoje nikakve pretjerane ambicije, jer sto neko rece, moguce je da necu moci da obezbijedim potrebne resurse. Cinjenica je da kada na osnovu do sada indeksiranih domena (~50.000) napravim projekciju, sve izgleda ogromno.

Prvo sam krenuo da pravim crawler koji bi omogucio da se vide svi domeni koji su hostovani na jednom serveru. (trebalo mi je zbog nekog raspadnutog shared hostinga gdje su me ubjedjivali da pored mog ima jos samo 20 sajtova).
Pa reko, ajd' kad vec spiderujem domene da kupim u bazu sve podatke koje mogu.)

A sto se tice usluge sa korisnike... pa ako nista moci ce da koriste gore spomenuti reverse IP, ili da rade pretragu domena po nazivima.
Npr. svi .rs domeni koji u nazivu imaju rijec Beograd i slicne pretrage... Naravno bice potrebno jos vremena da se domeni indeksiraju kako bi podaci bili komletni.

Ako eksperiment propadne :)... pa nista. Ogranicicu crawler samo na .rs. To ce 100% da radi. :)

ivanhoe 10. 01. 2009. 22:37

jel ima sanse da objavis neke cifre oko potrosnje resursa za ovako nesto? Kapiram da je u pitanju veliki zalogaj, ali me jako zanima konkretno koliki...

diplomata 12. 01. 2009. 08:44

Citat:

Originalno napisao ivanhoe (Napišite 64657)
jel ima sanse da objavis neke cifre oko potrosnje resursa za ovako nesto? Kapiram da je u pitanju veliki zalogaj, ali me jako zanima konkretno koliki...

Najveci problem je velicina baze. I nema sanse da MySql ovo izgura do kraja.
Za nekih ~50.000 domena bilo je potrebno ~400,00Mb sa ~5.000.000 rekorda iako sam bazu prilicno dobro optimizovao. To znaci bi do kraja bili potrebni terabajti i terabajti i terabajti.
Ovo sada radi na virtual dedicated serveru i vec ima problema. Znaci potreban je dedicated server sa dobrim procesorom i ogromnim diskovima. I opet je pitanje kako ce se ponasati. Sve u svemu, ako nesto uradim... 'cu da javim :1010:

kodi 12. 01. 2009. 09:17

nema sanse, odma da ti kazem :)
been there, done that.

jedina stvar koju sa mysql-om mozes da uradis je sharding - ali to automatski znachi vishe servera. Ali onda uz malo dodatne application logic mozes da skaliras i ha haj.

Sta vise ne trebaju ti (za pocetak) nikakvi specijalni serveri, moze i taj VPS, samo da su fizicki na razlicitim serverima...I da mozes da kazes mysql-u da prima konekcije sa strane. Onda tabelu sa keywordima podelis na A-N, i server2: M-Z, a domene recimo po ID-u, prvi server od 0-10.000.000 drugi server 10M-20M i tako dalje..
Naravno, sto vise servera mozes da priustis to bolje jer onda smanjujes load po serveru.


Takodje mozes da probas da servis otplacuje servere, uz premium features ili neki oblik oglasavanja na sajtu
naravno ovaj broj od 10M je odokativan, stavis onoliko koliko jedna masina moze da izdrzi.

Mozda ces izgubiti mogucnost da radis JOIN iz jednog query-ja, ali ces dobiti na performansama.

diplomata 12. 01. 2009. 09:54

Hvala na dobrim idejama :)
Pokusacu sa dva VPS-a da vidim kuda to vodi.

Vjerovatno cu, za pocetak, smanjiti broj podataka koje prikupljam kako bi sve maksimalno optimizovao, pa onda, vremenom, pokusati dodavati ostatak.

U sustini, stvar je izvodljiva samo su potrebna prilicna ulaganja. Premium accounti (npr. neogranicen broj dnevnih upita, a free ograniciti na 10 i slicno) bi mogli da izvuku stvar, ali put do potpuno funkcionalnog servisa nije bas poplocan mermernim plocama :)

cvele 12. 01. 2009. 12:42

Odlicna ideja.
Samo jedna jako mala zamerka :) similar domains sa desne strane ti ispisuje www.example.com ako ukucas example.com

http://www.displaydetails.com/warhammer.net

diplomata 16. 01. 2009. 11:29

Citat:

Originalno napisao cvele (Napišite 64714)
Odlicna ideja.
Samo jedna jako mala zamerka :) similar domains sa desne strane ti ispisuje www.example.com ako ukucas example.com

http://www.displaydetails.com/warhammer.net

:) znam da ima kamara bagova, ali rjesavam jedan po jedan.

Pustio sam jos jedan dio sajta koji podatke prikazuje vizuelno. Mozda nekome bude zanimljivo:

npr:
http://www.displaydetails.com/pages/...devprotalk.com

diplomata 19. 01. 2009. 12:34

Konacno je gotova i osnovnu logika za sugerisanje naziva domena na osnovu ponudjenih rijeci. Zanimljivo je probati, ponekad daje smijesne ali interesantne rezultate :1087:

http://www.displaydetails.com/pages/suggestions

markosvaba 13. 03. 2009. 19:31

Super je samo mislis da ono sto radi SS ne radi dobro.
Npr evo za moj sajt
http://www.displaydetails.com/www.bet-team.org

Slika stoji ova


A to je slika jos od pre dva meseca

a pise
Last update: Today

Nemanja.Milosavljevic 12. 06. 2009. 23:45

Uf, ukucah dominomagazin.com,
i potraja posteno... sigurno nije bio indexiran...

U svakom slucaju svaka cast za smelost i znanje. Dizajn je veoma fin i pristojan, dovoljan!
Svaka ideja, ukoliko se valjano prouci moze samo da uspe ili da propadne, a ova ne lici na onu koja ce propasti.

Sa srecom!

Nemanja.Milosavljevic 12. 06. 2009. 23:49

Takodje,
cestitam na izboru domena :)

Cudo da je bio slobodan...

MorenoArdohain 12. 06. 2009. 23:55

@Nemanja, hebote, o'ladi sa starim temama.


Vreme je GMT +2. Trenutno vreme je 00:47.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.