Pogledajte određenu poruku
Staro 14. 10. 2008.   #93
bora2008
novi član
 
Datum učlanjenja: 14.10.2008
Poruke: 2
Hvala: 0
0 "Hvala" u 0 poruka
bora2008 is on a distinguished road
Default

Citat:
Originalno napisao xippi Pogledajte poruku
Поздрав Боро, и хвала што си одвојио време да нам се обратиш поводом Светске премијере тестирања претраживача Едгиос. Пошто се сам buzz одиграо виртуелно на српском језику, допринећу тако што ћу користити ћирилицу и поштовати правопис у мери у којој га се сећам. Овде xippi, и ја сам субверзивни елемент коме су закључали "Да ли сам кретен што сам купио Apple?", на коме је иначе планирао да истресе све што мисли о данашњем данашњем маркетинг пилићарењу и глобалној економији

Прво сам мислио да на твој пост одговорим цитирајући га део по део, али је он у тој мери погрешан да као такав заслужује да остане као целина. Мене јако радује чињеница да се сам софтвер развија у Србији и да те Силиконске инвестиције само што нису, те ми је крајње непријатно да те обавестим да скалабилне платформе способне за претраживање већ постоје Што се саме приче о новцу тиче, такво коцкарско инвестирање нас је и довело у ова глобална говна у којима се налазимо

Шалу на страну, мени није јасно како на овај начин можеш да се развијаш брже од било које компаније која купује сервере на кило? Колико корисника мора да подели 1 гигабајт да би се направио индекс чија би претрага имала икакву релевантност? Како ћете да скалирате мануелно одржавање црне листе? Како да спречим комшију да ме стави на црну листу? Што се саме приватности тиче, да не понављам аспект крајњег корисника, зар не мислите да су сви ти сајтови подесили свој robots.txt управо да не би били индексирани?

Са друге стране погледај против чега се бориш, рецимо један Google који има агресивног бота који ровари тражећи линкове, браузерски додатак који прати сваки корисников клик ( - хех, увек ме претекну ) и гомилу интернета у кешу.

Мени овде доста ствари једноставно није јасно и јако сам импресиониран да се неко упушта у овакав пројекат

Свако добро
Hvala na interesantnim komentarima. Skalabilnih platformi naravno ima, s tim sto su sve centralizovane . Nije mnogo poznato da u svetu postoji vrlo mali broj kompanija koji znaju i mogu da naprave indeks svetske klase ( > 1 milijarde linkova). To su Google, Yahoo, Microsoft, Ask, Cuil i Gigablast (u USA) kao i Baidu (Kina) i Yandex (Rusija). Ta lista je veoma mala i elitna, prakticno svi (osim Cuil i Gigablast) su veoma uspesne kompanije sa vrednoscu na trzistu vise milijardi dolara pojedinacno. Drugim recima, lepo je ukljuciti se u taj klub

Takodje ukoliko pogledamo konkurenciju na gornjoj listi, Yahoo je u veoma losem polozaju, a njihov pristup je od pocetka bio suboptimalan, MSN pokusava ali nikako da krene, Ask manje vise izlazi iz igre tako da se konkurencija smanjuje tj. nagrada u slucaju uspeha povecava.Baidu i Yandex su kompanije u usponu koje jasno pokazuju vrednost uspesnog ucestvovanja u ovj igri.

Polje u kojem smo mi (i Faroo, definitivno) su distribuisani pretrazivaci, i mi (i investitori) milsimo da je tu potencijal ogroman kao i sansa za ulazak u gornji specijalni klub

Inace u vezi riskantnih invsticija, enormni sadasnji problemi na svetskim finansijskim trzistima su primarno uzrokovani ne riskantnim investicijama (rizik uvek postoji u bilo kakvoj investiciji) nego kladjenjem na dug ("leverage") tj pozajmljivanje para za kladjenje tako da su gubici u slucaju neuspeha 20, 50 pa cak i 100 puta veci od uloga. U VC investicijama dug ne postoji, ukoliko kompanija ne uspe sve sto je izgubljeno je ta investicija i nista vise. Time naravno investitori nece biti odusevljeni, ali to je deo njihovog biznisa i naseg ugovora sa njima.

U vezi kupovine servera na kilo (tonu ) mislim da je najbolji primer Skype, oni su dostigli kriticnu masu prakticno bez ikakvih investicija u servere. To su dostigli neverovatno brzo (produkat lansiran leto 2003, prodat eBay za $2.6 mlrd jesen 2005) i to je mislim odlicna ilustracija prednosti distribuisanih pristupa.

Naravno, druga veoma velika prednost je vrednost korisnika u procesu rankiranja. Tu cinjenicu search industrija odlicno zna, to vam mogu potvrditi iz njihovih usta (off the record)

Manuelno skaliranje jeste uvek problem, ali nas pristup se zasniva na wisdom-of-crowds tj zajednickom menadzovanju tih aspekta. Inace, i Google i ostali imaju dosta stvari koje su manuelne, ali o kojime ne pricaju iz ociglednih razloga, narocito u oblasti rankiranja, spama kao i svezine rezultata.

Sto se tice razloga zasto se stvari stavljaju u robots.txt, ne mislimo da su svi stavili robots.tx samo iz jednog razloga, ima ih gomila. U svakom slucaju deljenje informacija o necemu sto ste videli je apsolutno vase pravo, npr. da li iko moze da vam zabrani da kazete nekome recimo pismom, ili telefonom, sta ste videli interesantno na Internetu? Ocigledno ne, zasto da vam zabrani da tu informaciju podelite kompjuterom. To spada pod tzv "fair use" doktrinu u Americi. Naravno postavlja se interesantno pitanje komercijalnog koriscebja toga, sto jeste druga stvar, medjutim tu je upravo Google onaj koji koristi ceo Internet u njihove komercijalne svrhe - ove cinjenice je veoma svesna svetska izdavacka industrija i pokusavaju godinama da urade nesto po tom pitanju , do sada neuspesno.

U vezi riskantnih stvari, ono sto je interesantno (meni) je da je najgora stvar sto moze da vam se desi da projekat ne uspe, s tim sto cak i u tom slucaju cete nauciti mnogo stvari, raditi na necemu sto vam se svidja i u sta verujete, kontrolisati svoju sudbinu. Naravno u slucaju uspeha, prica je potpuno druga. Poenta, sa moje tacke gledista, je da nemate sta da izgubite.

Pozdrav,

Bora
bora2008 je offline   Odgovorite uz citat