![]() |
^ pa ok, ipak je ovo alpha...
|
Hm, ajmo malo lepsi ton. Meni je drago sto je covek dosao na DPT, znaci ceni ovu ekipu :)
Hajdemo prosto da mu pomognemo... Ko hoce... Ako hocete da predstavite alfa Edgios uzivo, mozemo da organizujemo u Ozonu predstavljanje projekta, moze i ben iz Amerike da se ukljuci preko Video streama (cri internet :) ) Mozda u jednoj kvalitetnoj diskusiji mozemo jos da pripomognemo, vidim da je usvojen predlog da deo koda bude otvoren... |
Citat:
Прво сам мислио да на твој пост одговорим цитирајући га део по део, али је он у тој мери погрешан да као такав заслужује да остане као целина. Мене јако радује чињеница да се сам софтвер развија у Србији и да те Силиконске инвестиције само што нису, те ми је крајње непријатно да те обавестим да скалабилне платформе способне за претраживање већ постоје :) Што се саме приче о новцу тиче, такво коцкарско инвестирање нас је и довело у ова глобална говна у којима се налазимо Шалу на страну, мени није јасно како на овај начин можеш да се развијаш брже од било које компаније која купује сервере на кило? Колико корисника мора да подели 1 гигабајт да би се направио индекс чија би претрага имала икакву релевантност? Како ћете да скалирате мануелно одржавање црне листе? Како да спречим комшију да ме стави на црну листу? Што се саме приватности тиче, да не понављам аспект крајњег корисника, зар не мислите да су сви ти сајтови подесили свој robots.txt управо да не би били индексирани? Са друге стране погледај против чега се бориш, рецимо један Google који има агресивног бота који ровари тражећи линкове, браузерски додатак који прати сваки корисников клик ( ;) - хех, увек ме претекну ) и гомилу интернета у кешу. Мени овде доста ствари једноставно није јасно и јако сам импресиониран да се неко упушта у овакав пројекат :1050: Свако добро |
Citat:
|
Citat:
Ima ljudi koji su obrnuli mnogo kompleksnije algoritme, i probili jace sisteme zastite od uzjebanog java kompajliranja... |
Citat:
|
sprecavaju tuzbe i copyright :) isti problem je i sa ranije pomenutim craigslist-om ili autotrader-om - cak i sa mestimicno-distribuiranim, ili potpuno distribuiranim index-om problem je pravno gledano slican i dovoljno iscrpljujuc za male kompanije da bi ignorisale zabrane ili se pravile lude, a korist od samog posedovanja content-a se malo dezintegrisala.
|
Citat:
|
Ceo projekat je pisan u javi...
|
Citat:
|
Citat:
U stvari mislim da vrlo mali broj desktop korisnika ima instaliranu Javu (ja je sigurno nemam ni na jednoj mašini) a i oni koji je imaju instaliranu imaju različite verzije. Međutim, glavni problem je što Java (i ostali GC jezici, da ne bude da sam nešto posebno protiv Jave) jede memoriju kao luda što je čini vrlo lošim "građaninom desktopa". Ako je glavna aplikacija na kojoj radiš u datom trenutku pisana u Javi (npr Eclipse) đene-đene, ali za servis koji treba da bude što je moguće više neprimetan, Java je jako loš izbor. |
Citat:
Yes 89.15% Ovo su korisnici Furke, a za ovo su mahom krivi chat klijenti poput pricaonice na krstarici koja zahteva Javu, dakle Java nije toliko nezastupljena tehnologija koliko ljudi nisu svesni cinjenice da je imaju na racunaru :D Ali slazem se sa tobom da Java mozda nije najbolje resenje za ovako nesto, em je ona zahtevna em sami zahvtevi za edgios (1gb prostora, 512 ram) se mogu porediti sa zahtevima za neku relativno noviju igricu :) Kao logicno postavlja se pitanje, da li cu i zbog browsera morati da kupujem jachi rachunar XD |
Citat:
Takodje ukoliko pogledamo konkurenciju na gornjoj listi, Yahoo je u veoma losem polozaju, a njihov pristup je od pocetka bio suboptimalan, MSN pokusava ali nikako da krene, Ask manje vise izlazi iz igre tako da se konkurencija smanjuje tj. nagrada u slucaju uspeha povecava.Baidu i Yandex su kompanije u usponu koje jasno pokazuju vrednost uspesnog ucestvovanja u ovj igri. Polje u kojem smo mi (i Faroo, definitivno) su distribuisani pretrazivaci, i mi (i investitori) milsimo da je tu potencijal ogroman kao i sansa za ulazak u gornji specijalni klub :) Inace u vezi riskantnih invsticija, enormni sadasnji problemi na svetskim finansijskim trzistima su primarno uzrokovani ne riskantnim investicijama (rizik uvek postoji u bilo kakvoj investiciji) nego kladjenjem na dug ("leverage") tj pozajmljivanje para za kladjenje tako da su gubici u slucaju neuspeha 20, 50 pa cak i 100 puta veci od uloga. U VC investicijama dug ne postoji, ukoliko kompanija ne uspe sve sto je izgubljeno je ta investicija i nista vise. Time naravno investitori nece biti odusevljeni, ali to je deo njihovog biznisa i naseg ugovora sa njima. U vezi kupovine servera na kilo (tonu :) ) mislim da je najbolji primer Skype, oni su dostigli kriticnu masu prakticno bez ikakvih investicija u servere. To su dostigli neverovatno brzo (produkat lansiran leto 2003, prodat eBay za $2.6 mlrd jesen 2005) i to je mislim odlicna ilustracija prednosti distribuisanih pristupa. Naravno, druga veoma velika prednost je vrednost korisnika u procesu rankiranja. Tu cinjenicu search industrija odlicno zna, to vam mogu potvrditi iz njihovih usta :) (off the record) Manuelno skaliranje jeste uvek problem, ali nas pristup se zasniva na wisdom-of-crowds tj zajednickom menadzovanju tih aspekta. Inace, i Google i ostali imaju dosta stvari koje su manuelne, ali o kojime ne pricaju iz ociglednih razloga, narocito u oblasti rankiranja, spama kao i svezine rezultata. Sto se tice razloga zasto se stvari stavljaju u robots.txt, ne mislimo da su svi stavili robots.tx samo iz jednog razloga, ima ih gomila. U svakom slucaju deljenje informacija o necemu sto ste videli je apsolutno vase pravo, npr. da li iko moze da vam zabrani da kazete nekome recimo pismom, ili telefonom, sta ste videli interesantno na Internetu? Ocigledno ne, zasto da vam zabrani da tu informaciju podelite kompjuterom. To spada pod tzv "fair use" doktrinu u Americi. Naravno postavlja se interesantno pitanje komercijalnog koriscebja toga, sto jeste druga stvar, medjutim tu je upravo Google onaj koji koristi ceo Internet u njihove komercijalne svrhe - ove cinjenice je veoma svesna svetska izdavacka industrija i pokusavaju godinama da urade nesto po tom pitanju , do sada neuspesno. U vezi riskantnih stvari, ono sto je interesantno (meni) je da je najgora stvar sto moze da vam se desi da projekat ne uspe, s tim sto cak i u tom slucaju cete nauciti mnogo stvari, raditi na necemu sto vam se svidja i u sta verujete, kontrolisati svoju sudbinu. Naravno u slucaju uspeha, prica je potpuno druga. Poenta, sa moje tacke gledista, je da nemate sta da izgubite. Pozdrav, Bora |
Boro, hvala na tvojim dosadasnjim odgovorima. Najpre da razjasnim: moja pitanja su sa stanovista obicnog korisnika tj. predstavnika te buduce kriticne mase od koje na kraju sve zavisi - dakle, marketinga. Vecina njih, naravno, nece biti sa Stanforda ali, pretpostavljam da cete na kraju imati sav moguc tehnicko-pravni large & fine print. Ono sto korisnike najpre zanima su odgovori na zdravorazumska pitanja o samom konceptu, o ideji iza projekta, radije nego o detaljima.
Koliko sam shvatila, a vi me molim vas ispravite ako negde gresim, vi polazite od pretpostavke da su klasicne crawler/bot/whatever-based search engines nepouzdane zato sto poseduju absolutnu kontrolu i monopol, kako nad obimom i vrstom indexa, tako i nad rezultatima pretrage i prikupljenim podacima. Vas p2p nacin pretrage direktno povezuje korisnike kroz volontersku mrezu zaobilazeci informacione centre. Jednom recju, demokratizacija search-a. Pri tom je svaki korisnik i dalje prikljucen na velike indexe i odatle kopa po katalogu po svom nahodjenju. Uspeh projekta zavisi od broja ucesnika ali i od kolicine i vrste materijala koju ovi “data miners” iskopaju. Ako znamo da “people go where bots don’t”, realno je kao rezultat ocekivati sveobuhvatniju i dublju pretragu. Prikupljeni podaci nece biti smesteni po centrima vec ce biti rasuti po nekoj vrsti “self-generating” mreze. A net around a net (wrap-around?), if you wish. Kad su u pitanju vlasnistvo nad i pristup informacijama, korisnici imaju opciju filtriranja podataka pre pustanja u mrezu cime se dobija veca kontrola i bolja zastita licnih podataka. Sa druge strane, content providers prirodno nastoje da sacuvaju tajnost podataka. Eliminacijom search engine middle man-a, povecava se privatnost. Prikljucenje na mrezu zahteva instaliranje aplikacije koja je besplatna. Evo neliko pitanja: 1. Da li mene kao korisnika obavezuje privacy policy u odnosu na search engines i kompanije sa kojima saradjujem? Ako ja sa svojih ekspedicija donesem i dalje pustim u promet neciji private and protected information, da li mogu da me tuze zbog toga? 2. Koji je ovde business model? Kako se planira komercijalizacija podataka prikupljenih od strane samih korisnika i sta korisnik dobija zauzvrat? Sponsored search profit sharing? Social networking utilities? Da li cemo zauzvrat imati Nick and Norah’s Infinite Search Lists? Any other benefits? 3. Koje su mogucnosti zloupotrebe? Tu ne mislim samo na security leaks nego i na manipulaciju rezultata pretrage. Da li cemo imati worldwide data mining sweatshops? |
Boro, hvala na pojasnjenjima i iskustvima.
Imam jos dva pitanja, oba o pravilima indeksiranja: 1. Ako je jedna od ideja da se (kako je navedeno gore) otvori mogucnost indeksiranja stranica koje inace nisu indeksirane (popularni oglasnici npr.) koji to ne dozvoljavaju standardnim metodama, zar nije realno da cete ubrzo dobiti pismo od njihovih advokata da ih stavite na globalnu blacklistu i da ih vise ne indeksirate? 2. Sto se tice robots.txt, jasno je da ima onih sto ih ne postuju. Da li vas slucaj ipak nije toliko drugaciji od ostalih ukoliko se stvari gledaju iz drugog ugla (ukoliko sam ja razumio pojasnjenja sa prethodnih strana?): Posmatrajmo racunar sa Edgios-om koji indeksira neku stranu (dakle, ne originalni posjetilac, vec racunar u mrezi koji ce stranu ubaciti u indeks) i njegovu aktivnost. To je u sustini softver koji programirano obilazi zadatu/e adresu/e u cilju indeksiranja. Pitanje je: uopsteno gledano, zasto je to drugacije o botova drugih pretrazivaca i zasto za njega ne bi trebala da veze pravila kao i za prave botove? Hvala unaprijed i puno uspjeha :) |
Citat:
|
^ problem sa robots.txt se resava lako
stavite na vashem sajtu info kako da sajt zabrani vasem botu (pardon, softwaru) da siri info o tom sajtu kao: posto smo mi razliciti, mi ne citamo standardne direktive u robots.txt ali, posto smo fini i kulturni, evo kako mozete da nam ukazete sta da radimo s vasim sadrzajem (i onda ide red koji trebaju dodati u robots.txt) ovo bi bilo neko srednje resenje licno mislim da nepostovanje robots.txt-a nije lepo, iako ima tu i toga da ovo nije klasicni 'dodatni' bot inace, interesantna ideja, ima dosta stvari koje treba izjasniti - privacy, kako cete privuci kriticnu masu itd u svakom slucaju ocekujem da ce se indeks puniti segment po segment recimo, ako ovo pocnu da koriste IT people onda ce takvi sajtov biti dobro indeksirani te ce za tu oblast edgios biti relevantan. praticu s interesovanjem razvoj srecno |
Zanimljivo je krenuti na ovo polje, mogucnosti su zaista velike, slazem se, ali i jos veca ocekivanja korisnika koje necim boljim treba navesti da ne koriste pretrazivac koji vec koriste.
Citat:
Ne bih se bas slozio "da se sve vise siri u javnosti svest da je tzv "user attention data" npr. istorija vasih pretraga i klikova koju cuvaju pretrazivaci veoma bitna i moze da bude osnova za veliko poboljsanje kvaliteta." Pre bih rekao da su pretrazivacke kompanije sve vise na udaru zbog tih istih istorija pretraga kao i kompanije koje se bave behaviour advertajzingom. Slazem se da to moze da bude korisno za korisnike da dobiju relevatnije rezultate pretrage nego sada ali ko im moze garantovati da informacije o njihovim aktivnostima nece biti iskoriscnei u druge svrhe. Mnoge stvari kada zele da se uvedu se predstavljaju u smislu "to je u najboljem interesu korisnika", ali znate i sami kako ide ona izreka gde se spominje poplocani put i najbolje namere. To je isto kao kada bi se promovisalo u svetu da je RFID cipovanje ljudi jako dobro i u njihovom najboljem interesu zbog njihove bezbednosti. Takodje, problem je u tome sto je potrebno instalirati softver da bi se vrsila pretraga. Mislim da su idealna ciljna grupa za ovakve pretrazivace korisnici koji vole da koriste i druge P2P mreze ali iako sam na Internetu vise od 10 godina i nikad nisam koristio njednu P2P mrezu za skidanje programa, takva stvar je ok za razmenu fajlova ali mislim da instaliranje softvera zbog pretrage i insistiranje na Javi nije bas najbolje za osobe koje bas nisu web savvy. Ne treba se bas pravity hype oko ovoga, i Cuil je predstavljen kao the next Google killer i pre nego sto je lansiran samo zato sto su ga osnovali XGooglersi pa nisam siguran da je praksa pokazala to. Isti slucaj i sa Mahalom. Sustina: Da li mislim da ce ovaj sajt biti the next big thing? Ne mislim. Da li mislim da ce se vremenom ovaj sajt zbog necega dobro prodati? Vrlo moguce. Ali kada kazem "dobro prodati" ne mislim na cifre koje se spominju za Yandex i druge iz heavyweight kategorije. Btw. ime za sajt je moglo biti znatno bolje od ovog, barem je neko postojece ime moglo biti otkupljeno kada vec postoje investicije. Ovako jako lici na propali projekat Michael Arringtona Edgeio. |
Slazem se sa Bizingerom, plasim se da ovo nikada nece postati "everyday app", ko god hoce da pretrazuje verovatno ce uvek koristiti google ili yahoo (tradicionalne search engine), a bojim se da ce edgios i slicni alternativni search engine ostati samo za slucajeve kada pozelis 'malo da se igras". Nije pretraga samo "da li postoji" vec i koliko je relevantno, a ako sam ja dobro shvatio ceo koncept, relevantnost pronadjenih podataka preko edgios jako zavisi od subjektivnih elemenata.
Veliki problem je i to instaliranje, mora odmah da se oduzme deo populacije koji to ne zna da uradi i deo koji to ne zeli. Eto odmah velikog problema sa subejtivnoscu. Zar nije Alexa imao isti problem iz istih razloga (alexa toolbar). Da sam ja na vasem mestu, verovatno mi ne bih palo na pamet da se promovisem kao konkurencija tradicionalnim pretrazivacima, pre bih isao na nesto geek-ish. |
Meni licno najvise smeta sto je ceo koncept, ovako kako je dosad predstavljen, u sustini parazitski (loaded word, I know...): zivi na tudjem hardware-u, hrani se vec postojecim indexom koji mu donose pcele radilice a da za uzvrat ne dobijaju nista (osim mozda liability). Tough sell. Al' to smo sad vec svi rekli, da ne davim dalje.
|
Citat:
ne navodim vas da krenete da valjate accounte za placeni sadrzaj ali kontam da je tako nesto neophodno za siru populaciju... |
Citat:
|
Citat:
|
Citat:
|
Off Topic: Citat:
|
Citat:
|
Citat:
Jasno mi je donekle zasto se ulaze novac u ovaj projekat, i ako mi licno mozda ne dobijamo toliko. Tekst koji sam na nekoj od tema danas linkovao o kolicini servera i troskovima sa kojima se suocavaju klasicni pretrazivaci nas upucuje na to da sistemi pretrage postaju sve manje finansijski odrzivi i ovaj pokusaj decentralizacije cuvanja podataka pretrage predstavlja potencijalno resenje problema. Mozda ovaj projekat nece uspeti ali ce se iz njega izvuci kvalitetni zakljuchci o tome kako pretrazivanje treba da se razvija u buducnosti da obezbedi kompanijama odrzivu i komercijalnu pricu a korisnicima ugodno, kvalitetno i brzo pretrazivanje. :) |
koliko ovakvih slicnih projekata ima?
http://www.google.com/search?q=distr...search+engines rekao bih da je bilo dosta ozbiljnih pokusaja. proverio sam kako majestic radi. evo kako "radi" - http://search.majestic12.co.uk/search.jhh?q=vesti ne, niste maler, niste uboli bas kad ne radi. on jednostavno uopste ne radi :) [probam vec dva dana] |
Citat:
|
Citat:
|
Znaš kako, ako neko ove (velikom vecinom dobronamerne) komentare shvati kao "da komšiji crkne krava", onda mu je vreme za jedan duži odmor (bar godinu dana). Ok, slazem se da nekima nedostaje par casova civilizovane komunikacije pa su prilicno grubi, ali ne verujem da je bilo ko komentarisao zato sto zeli neuspeh.
|
Ja bih voleo da kada pokrenem nesto da dobijem realne komentare na celu pricu. Znaci udri, pa posle toga vidimo kako da ispravimo sve to...
Kritika je super stvar, naravno ako znash da prihvatish kritiku. S'druge strane ako me neko kritikuje ne mislim da hoce da propadnem... |
I ja mislim da su sve ove (ili najveci broj) izrecene kritike i pozitivne i negativne napisane u najboljoj nameri.
Cinjenica je da ovaj ili bilo koji projekat nece uspeti ili propasti zato sto su "tamo neki clanovi nekog foruma u Srbiji" rekli da je taj projekat super ili bezveze. Ali je cinjenica da moze da bude losiji ako te kritike ne budu napisane i/ili ne budu usvojene ili da bude bolji ako bude ona druga varijanta. U pravom projektnom timu, cesto osobe koje predlazu ideje od 10 predlozenih dobiju negativan odgovor za 9 a jedna 1 bude super i bude usvojena. Ali bas zbog te 1 ideje treba stalno predlagati nove ideje. Pricam iz iskustva. VC biznis je slican. Od 10 investicija, mozda 4 budu relativno uspesne a 1 jako uspesna. |
Ovo bi sad bila dobra nova tema: Direktna online komunikacija, prednosti i zamke. Cinjenica je, to sto kaze Berislav, da je generalno nas mentalitet naysayer-ski ali i da ljudi cesto kritiku shvataju kao licni napad i zelju da im crkne ta nesrecna proverbijalna krava. To se sve onda online podigne na kvadrat pa imamo gomilu nesporazuma sto za uzvrat dovodi (cesto preventivno) do isto tako velike gomile dodatnog objasnjavanja, ogradjivanja, "emotikonizacije", itd. Ko' sto Mesa Selimovic kaze: tako smo se narazgovarali, ko motkama da smo se tukli!
|
Sama cinjenica da je Edgios izazvao ovoliko postova u temi je dokaz da je rijec o veoma zanimljivom projektu. Realno, niko od nas ne moze znati kako ce Edgios izgledati za godinu-dvije, cak ni da li ce prezivjeti toliko, ali da je zanimljiv - to jeste.
Inace, meni ne izgleda da je diskusija bila negativna, vec realna, sa ukazivanjem na neke stvarne probleme i neka pitanja koja ce svakako morati biti odgovorena. Ukoliko problemi ostanu isti kao sada, ne vjerujem da ce diskusija na bilo kom svjetskom sajtu ici u drugom smjeru. Doduse, problem jeste u pisanoj formi foruma gdje stvari mogu izgledati drugacije nego kada ih nekome kazete u lice, ali dobro, ovdje smo svi u online svijetu i za pretpostaviti je da umijemo da prepoznamo dobru namjeru cak i ako je naizgled ostro napisana. U svakom slucaju, pohvalno je sto je jedan globalni projekat imao premijeru u Srbiji. |
Pratio sam diskusije sa velikom paznjom koliko mi je to vreme dozvoljavalo. Izvinjavam se ako nisam bas uvek na vreme stigao da odgovorim. S obzirom da ovaj forum okuplja krem srpskih IT profesionalaca impresioniran sam cinjenicom da je za samo nekoliko dana koliko je ova tema aktuelna, privukla paznju ogromnog broja posetilaca.
Nismo trazili nikakav popust jer se radi o domacoj tehnologiji, naprotiv. Hvala svima primedbama, mislim da su bile konstruktivne i bile su nam veoma korisne. Sigurno cemo posvetiti maximalnu paznju da vecinu i implementiramo. Rad na razvoju cemo jos intenzivnije nastaviti. Tim veoma mladih i izuzetno talentovanih developera je maksimalno angazovan na ovom poslu. Edgios se inace automatski updejtuje i sa svakom novom verzijom bice bolji, brzi i pouzdaniji i naravno, upotrebljiviji za sve veci broj korisnika. Edgios index je za manje od nedelju dana koliko je u javnoj upotrebi porastao za gotovo 50%. Naravno, pocetna velicina indexa sa kojom smo krenuli je bila mala tako da je ovakav skok ocekivan. Sa nase strane potrudicemo se da zadrzimo vasu paznju tako sto ce Edgios biti sve bolji, a oni koji odluce da ga probaju moci da se uvere u to iz dana u dan. Hvala na saradnji i razumevanju. Ben. |
Vreme je GMT +2. Trenutno vreme je 18:17. |
Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.