Tűt a szénakazalból – az internetes keresőszolgáltatások 2004/2

A közigazgatás szakmai fóruma

Cikkek / Lazíts!

Tűt a szénakazalból – az internetes keresőszolgáltatások 2004/2

VI. évfolyam, 2. lapszám
Szerző(k):
Molnár Péter Magyar Államkincstár



Mennyi információ található az interneten? Rengeteg. Több milliárd szöveges dokumentum, kép, zene, film, program szanaszét a világ szerverein, szinte lehetetlen, hogy pont a számunkra hasznosra bukkanjunk rá. Vagy ha egyszer már megvolt, hogy találhatunk vissza ismét, ha elfelejtettük feljegyezni a címet? Ilyenkor lehet igénybe venni a keresőszolgáltatásokat. Nem kell kijegyzetelnünk, észben tartani holmi www.megjegyehetetlenulhosszunev.hu címek tömkelegét, elég a keresőszolgáltatás címét ismerni. Több ilyen szolgáltatás üzemel, a legismertebbek az AltaVista, a Yahoo, vagy az egyik legkedveltebb, a Google.
Ezeknél lehetőség van kulcsszavak alapján keresni, olyan kifejezésekre, amelyek csak a keresendő információra jellemzőek. Tegyük, fel, hogy Sulinet program keretében szeretnénk egy modern, lapos, TFT monitort vásárolni. A kérdés, hogy hol, és mennyiért juthatunk hozzá? Irány a www.google.com és a keresendő kifejezéshez írjuk be: Sulinet. Eredményül egy listát kaptunk azokról a honlapokról, ahol a Sulinet kifejezés előfordul. Körülbelül félmilliót. Ez reménytelennek tűnik, szűkítsük a listát! A Sulinet kulcsszó mellé írjuk be egy szóközzel elválasztva: monitor. A lista már „csak” 17.000 oldalt tartalmaz. Ezeken az oldalakon a Sulinet és a monitor szó is szerepel. További szavakkal még pontosabban meghatározhatjuk, mit is szeretnénk. A Sulinet, a TFT és a monitor szavakra 7.900 találat érkezik, míg ha hozzávesszük az árlista kulcsszót is, akkor 845 lesz az eredmény, ami már kezelhető mennyiség. Vagyis a szóközzel elválasztott kulcsszavakkal azoknak az oldalaknak a listáját kapjuk, amelyeken mindegyik szó szerepel, függetlenül a sorrendtől.
Egy másik példában gyűjtsünk Robert Merle francia regényíróról anyagot! Ha a kulcsszó Robert Merle, megkapjuk mind a 259.000 olyan oldal listáját, melyben felbukkan a Merle családnév, legyen az illető Robert, Pierre, vagy Marie, és még valahol az oldalon megtalálható a Robert keresztnév is. Számunkra a két szó egymás utáni előfordulása hordoz csak valódi információt. Közöljük ezt a keresőprogrammal is, úgy, hogy idézőjelbe tesszük a teljes nevet: „Robert Merle”. Erre valóban azt a 9.260 találatot kapjuk, amely az íróval foglalkozik franciául, olaszul, magyarul, vagy angolul. A Google-nak szimpatikus tulajdonsága, hogy érzékeli a böngészőprogram nyelvét, és udvariasan magyarul kommunikál velünk. Ezt kihasználva kizárhatjuk a többi nyelven írt értekezést. Kijelölve a „Magyar lapok közti keresést” 503 oldalt fog tartalmazni a találati listánk.
Lehetőség van további trükkökre, hogy lehet például kizárni egy kulcsszót a keresésből, vagy hogy kereshetünk csak a franciaországi szervereken. Ezekről részletes leírást kaphatunk a Google honlapján.
Érdekesebb honnan tudja egy ilyen program, mit hol keressen. Gyakorlatilag a teljes interneten tárolt tartalomról másolatot készítenek a saját adatbázisuk számára. Robotoknak nevezett programok indexelnek fel egy-egy oldalt, majd az ott található hivatkozásokon – linkeken továbblépve egy másik honlapon folytatják az információk begyűjtését. Sziszifuszi munkával, fáradhatatlanul frissítik, bővítik az adatbázist.
Hogy mekkora adathalmazról van szó, arról képet kaphatunk Barrett Lyon Opte nevű projektjéről. Barrett először 2003 októberében fogadásból térképezte fel az internetet alkotó kisebb hálózatokat, s jelenítette meg őket grafikusan. Azóta rendszeresen megismétli a felmérést. Mire jó ez? – teszi fel magának a kérdést. Mert így láthatóvá válik, ha például egy természeti katasztrófa miatt kiesik egy nagyobb szegmens a hálózatból. (Furcsának tartom, ha valaki innen értesül földrengésről, háborúról, jégverésről, nem pedig a hírekből…) Azon kívül így láthatóvá tehető az Internet növekedése, és mert nem utolsósorban művészi alkotás. Valóban szép; az elkészült grafikon az internetről egy messzi-messzi galaxis fényképére hasonlít. Megtekinthető: www.opte.org/maps/ címen.

 

Kategória

Könyvajánló

Facebook Pagelike Widget

 

1037 Budapest, Montevideo utca 14.
Tel.: +36 1 340 2304
Fax: +36 1 349 7600
E-mail: info@orac.hu

Weboldal: orac.hu

Szakmai partnerek

Jegyzők Országos Szövetsége (JOSZ) – www.josz.eu

Közszolgálati Tisztviselők Szakmai Szervezeteinek Szövetsége – www.kozszov.org.hu