WWW kialakulása, a HTTP protokoll,URL fogalma, a HTML nyelv fejlődés, keresés az Interneten (Keresők fajtái, működési elvük), keresőprogram használata (pl.: Google részletes keresés)
A WWW kialakulása
A World Wide Web-et (más néven WWW; WEB, W3) a svájci CERN (Részecskefizikai Laboratórium) kutatóközpontban 1989-ben kezdte el fejleszteni Tim Berners-Lee és csapata abból a célból, hogy a kutatók az egyre nagyobb tömegű szöveges és grafikus információt könnyebben, strukturáltan, azonos felületen érhessék el, ezek földrajzi elhelyezkedésétől függetlenül.
A WEB, mint a nevében is benne van: „világméretű pókháló”-ként ténylegesen behálózza az egész világot. Ez ma (a jegyzet írásakor) a legnépszerűbb információforrás az Interneten, mivel nem csak szöveget, hanem képeket, animált képeket, hangokat-zenéket és videó-klipeket is meg tud jeleníteni, le tud játszani – vagyis multimédiás képességekkel rendelkezik.
A navigálás (a Gopherhez hasonlóan) itt már teljesen a (hypertext) hyperlinkek segítségével történik, melyek nem csak szövegek, de képek is lehetnek. A linkek itt is akár egy másik földrész másik szerverének dokumentumaira is mutathatnak.
A WEB sikerének titka a multimédiás képességeken túl a HTTP (HyperText Transfer Protocol) protokoll alapján működő HTML (HyperText Markup Language) nyelv és a használatukhoz készült kliensprogramok, az ún. böngészők fejlődése volt.
Az első széles körben elterjedt böngésző az NCSA (National Center for Supercomputing Applications – University of Illinois) Mosaic grafikus felületű programja volt. A böngészők fejlődése nagyon gyors, néhány hónap alatt új verziók jelennek meg. Ezek ma már a WEB funkciókon kívül magukba integrálták majdnem az összes Internet-szolgáltatást – E-mail, Gopher, FTP, Usenet News.
A WWW szerverek számát ma már több tízezres nagyságrendre teszik, a dokumentumok száma pedig százmilliós nagyságrendű, és ezek száma exponenciálisan nő.
HTTP
A HTTP ügyfél-kiszolgáló protokollt hypertext dokumentumok gyors és hatékony megjelenítésére tervezték. A protokoll állapotmentes, vagyis az ügyfélprogram több kérést is küldhet a kiszolgálónak, amely ezeket a kéréseket egymástól teljesen függetlenül kezeli, és minden dokumentum elküldése után le is zárja a kapcsolatot. Ez az állapotmentesség biztosítja, hogy a kiszolgáló mindenki számára egyformán elérhető és gyors legyen.
A HTTP-kapcsolat négy lépése:
- A kapcsolat megnyitása. Az ügyfél meghívja a kiszolgálót az Interneten keresztül az adott cím és port azonosító alapján (alapértelmezésben a 80-as porton keresztül).
- A kérés elküldése. Az ügyfélprogram üzenetet küld a kiszolgálónak, amelyben valamilyen kiszolgálást kér. A kérés HTTP-fejlécből és a kiszolgálónak küldött adatokból áll (ha van ilyen). A fejléc információkat tartalmaz a kiszolgáló számára arról, hogy milyen típusú a kérés, és megadja, hogy az ügyfélprogramnak milyen lehetőségei vannak.
- A válasz. A kiszolgáló a választ visszaküldi az ügyfélprogramnak. Ennek része a fejléc, amely leírja a válasz állapotát (sikeres vagy sikertelen, a küldött adatok típusát), és ezt követik maguk az adatok.
- A kapcsolat lezárása. A kiszolgáló a válasz elküldése után lezárja a kapcsolatot, így az erőforrások megint felszabadulnak a következő kéréshez.
Ez az eljárás azt jelenti, hogy a kapcsolat során csak egy dokumentumot lehet átadni, illetve egyetlen feldolgozás megy végbe. Az állapotmentesség miatt a kapcsolatok semmit nem tudnak az előző kérésekről, mivel a kiszolgáló minden dokumentum elküldése után lezárja a kapcsolódást, és minden kérést egyenként, külön-külön kezel. Ha egy dokumentum több képet vagy grafikát tartalmaz, akkor ezek megjelenítéséhez az ügyfél annyiszor építi fel a kapcsolatot, ahány hivatkozást talál. Egyet magának a dokumentumnak, és a többit egyenként a grafikáknak, illetve képeknek.
URL
Példa egy dokumentum címére:
http://www.sulinet.hu/
Az URL a HTML dokumentumban egy szabványos szerkezetű „utasítás”, ami meghatározza az Internet-szolgáltatás típusát: WWW, FTP, Telnet, Gopher, E-mail, …
Az URL, mint már beszéltünk róla, a következő információkat tartalmazza:
• az Internet protokollt, mely az adatok eléréséhez szükséges
• a szerver nevét (vagy címét)
• a szerveren belüli alkönyvtárnevet
• a fájl nevét (a WEB fájlok kiterjesztése htm, vagy html)
• a kiszolgáló portjának számát, melyet csak akkor kell megadni, ha eltér az alapértelmezettől (a WWW alapértelmezett portszáma 80, vagy pl.: 8080). Ezt kettősponttal elválasztva a szervernév után kell írni.
Az URL-ben használható karakterek:
Alapvetően (mint a HTML forráskódban) az ASCII karakterek használhatóak az URL-ben is, ezen belül is az ISO 8859-1 (Latin-1) karakterkészlet 32-től kezdődő és 128-ig tartó elemei (a 32-ig tartó vezérlő karakterek nem).
Ebből a tartományból sem minden karakter használható, mert pl.: sok E-mail rendszer nem tud 128-nál nagyobb kódú karaktert átvinni. Az URL-ben egyébként használhatóak a 128 kód alatti karakterek, de ezek közül néhány csak kód formájában. Ezek %-kal kezdődnek, majd a kód két karakteres hexadecimális megfelelője következik.
Ilyen pl.: az á kódja. Ez a HTML-ben á kóddal jeleníthető meg, az URL-ben ennek megjeleníthető kódja %e1.
Ezek közül nem használhatóak a következők:
Ezeket a kódokat csak akkor használjuk, ha kódlap beállítást nem használunk. Az ékezeteink helyes megjelenítéséhez a Windows1250-es és az ISO 8859-2-es kódlapot használhatjuk.
16Sulinet Expressz 2003
A leggyakrabban használt speciális karakterek és jelentésük:
• / (per jel): az alkönyvtárakat választja el
• # (kettős kereszt): az URL-nek és az URL-en belüli címkének az elválasztására használjuk. A belső címke az URL-en belül szerepel dokumentumazonosítóként. Ennek segítségével az egyes dokumentumok címkékkel jelölt részeire (belső linkek) közvetlenül hivatkozhatunk akár egy másik HTML dokumentum hyperlinkjével is.
• % (százalékjel): a kódok bevezető szimbóluma.
• ? (kérdőjel): az adatbázisból való lekérdezéshez ennek segítségével adhatjuk át a szerver programnak a paramétereket.
HTML
A dokumentumok logikai struktúráját a HTML (Hyper Text Markup Language) jelölései segítségével lehet szabályozni. A HTML arra készült, hogy segítségével a dokumentumok szokásos, sorban egymás utáni olvasása helyett, a szövegben elhelyezett kapcsolatok alapján az egész dokumentum könnyebben legyen áttekinthető és elolvasható. Segítségével logikusan szervezett és felépített dokumentumokat lehet készíteni oly módon, hogy a nyelv alkalmas a logikai kapcsolatok létrehozására a dokumentumon belül és dokumentumok között, amit a dokumentum olvasója kezelhet. A dokumentum fogalmát itt általánosabban kell értelmeznünk, amely objektumokat tartalmaz, melyek lehetnek: szöveg, kép(grafika), hang (zene), de akár mozgókép (film) is.
Az ily módon szervezett szöveget hypertextnek hívjuk. A folyamatos, sorokba rendezett szöveg végigolvasása helyett a kereszthivatkozásokat követve könnyen el lehet menni a szöveg egy más részére, megnézni más információkat, azután visszatérni, folytatni az olvasást, majd megint egy másik bekezdésre ugrani. Ilyen szerkezetűek a Microsoft Windows, illetve a Windows alatt futó programok súgói. Amennyiben a szöveg mellett más objektum is megjelenik, akkor hipermédiáról beszélünk.
A hálózaton az objektumok, illetve ezek részei közötti kapcsolatok magába a szövegbe épülnek be megjelölt szavak és grafikus elemek formájában. Amikor egy ilyen elemre a felhasználó az egérrel rákattint, a rendszer automatikusan létrehozza a kapcsolatot, és a kapcsolt objektumot megjeleníti a képernyőn (vagy ha hang, lejátssza). Lényeges, hogy a kapcsolt objektum is tartalmazhat további kapcsolásokat különböző objektumokhoz, amelyek elvileg a hálózaton bárhol lehetnek. A WWW úgy is tekinthető, mint egy dinamikus információ tömeg, amelyben a hypertext segítségével kapcsolatok (linkek) vannak. Ennek eredményeként adott információ a hálózat bármely pontjáról megszerezhető, illetve ugyanahhoz az információhoz több úton is el lehetjutni a különböző kapcsolatokon keresztül.
A HTML formátumú fájl valójában egy szöveges fájl, szintén szöveges (olvasható) vezérlőkódokkal. Ezek a vezérlőkódok < és > jelek között szerepelnek, és a szöveg megjelenését, formátumát, például a betűk nagyságát, formáját, stb. jelölik. A szöveg egyéb dokumentumokra vagy a dokumentum más részeire való hivatkozásokat is tartalmazhat, amit a vezérlőkódok segítségével adhatunk meg linkek formájában. Ezek a linkek - amelyek a megjelenítéskor általában kék színű, aláhúzott szövegekként, vagy kék keretes ikonokként jelennek meg - hypertext alakúvá teszik a dokumentumot.
Keresés a WEB-en
A címeket általában névjegykártyán vagy reklámban találjuk. Érdekes probléma, ha tartalom alapján szeretnénk számunkra érdekes WEB oldalt találni. Azaz, hogy lehet keresni a WEB-en?
A WEB több tízmilliónyi honlapján több száz millió oldalnyi információ van már most, és ezek száma napról napra nő.
Ebben az információ áradatban eligazodni, a nekünk szükséges adatokat megtalálni nagyon nehéz. Erre szolgálnak a kereső programok. A WEB-en nincs egységes módszer a keresésre. Nagyon sok cég készít indexelt adatbázisokat, melyek pásztázzák a WEB oldalakat és eltárolják ezeket információit. Ezek között lehet a saját speciális keresőszoftverükkel dolgozni.
Az első keresőprogramok nem a WEB-hez készültek, már tanultunk az ARCHIE (FTP kereső), a VERONICA és a JUGHEAD (Gopher) keresőkről.
A WEB rendszerű keresőknek alapvetően két fő fajtájukat különböztetjük meg, a tematikus keresőket, és a kulcsszavas keresőket.
A tematikus keresők
Egy tartalomjegyzékhez hasonlítanak (vagy akár a Gopherhez is hasonlíthatjuk, amiről később lesz még szó), melyekben az általános témák szűkítésével juthatunk el a keresett dokumentumig.
Ilyen pl.: a HUDIR (http://www.hudir.hu/ ), az EINet Galaxy (http://galaxy.einet.net/ ), a Yahoo (http://www.yahoo.com/ ). Sokszor összekapcsolják ezt a típust az indexelt keresőkkel.
A kulcsszavas keresők
A WEB rendszerű indexelők automatikusan pásztázzák (a hyperlinkeket követve) a WEB oldalakat a domain nevek és a linkek segítségével, majd ezeket egy adatbázisban leindexelik. Ebből az adatbázisból szókereséssel találhatjuk meg a nekünk szükséges oldalakat. Ezek a szerverek általában az Internet más-más részét indexelik, ezért ha keresünk, érdemes több keresőprogramot is használni ugyanarra a keresésre. Vannak olyan WEB indexelők, melyek Gopher, FTP, NEWS szervereken is keresnek.
Egyes szerverek csak a náluk bejelentett szervereken keresnek, mások ezt automatizálják. Vannak olyan indexelők, melyek csak az állományok címeiben, kulcsszavaiban keresnek, de vannak a teljes szövegben keresők is. Ma már a legtöbb ingyenesen használható.
Teljesszövegű indexelő pl.: az AltaVista (http://www.altavista.com/ ), a Lycos (http://lycos.cs.cmu.edu/ , http://www.lycos.com/ ), …
A keresendő szavak közé logikai keresőoperátorokat lehet tenni, amik segítségével pontosíthatjuk keresésünket.
Ezek keresőprogramonként változnak, de a legtöbb program ismeri a következőket:
And | a logikai „és” művelet |
Or | a logikai „vagy” művelet |
Near | a keresett szavak közel vannak egymáshoz |
„ ” | az idézőjelbe tett kifejezést egyben keresi |
Amennyiben menüvezérelten szeretnénk kiadni az összetett keresésünket válasszuk az alábbi nyomógombok valamelyikét:
• Részletes keresés
• Advanced Search
Ilyen például a magyar Google kulcsszavas kereső. ( http://www.google.com/ ) részletes keresést támogató oldala.
Gyakoribb azonban manapság a vegyes kereső, amelyen kulcsszavasan és tematikusan is kereshetünk. A találati listát érdemes minél jobban leszűkíteni, hogy könnyebb legyen a választás.
Jó tanács:
Ha több oldalra is kíváncsiak vagyunk a találati listából, akkor érdemes jobb-egérgombbal a linkre kattintva a menüből a Megnyitás új ablakban-t kiválasztani, és egy másik ablakban nézni az oldalt. Így egyszerre több oldalt is nézhetünk, és könnyű visszatérni a találati listához.
Sokszor érdemes egy portál oldalról kiindulni. Ilyen például a magyar nyelvű Startlap (http://www.startlap.com/ ). Az ilyen oldalak több előnyt is nyújtanak.
• Hétköznapi címszavak alapján jól használható címlistához, azaz linkgyűjteményhez jutunk
• A kereső oldalak címét nem kell fejből tudnunk, több kereső (menüválasztás után) elindítható.
1. | WWW kialakulása | 1p |
2. | HTTP protokoll | 2p |
3. | URL fogalma | 1p |
4. | HTML nyelv fejlődés | 2p |
5. | keresés az Interneten | 2p |
Kérdések
1 | Mikor és hol fejlesztették ki a WWW-t? |
2. | Mit jelent az URL-ben %-jel? |
3. | Mire készült a HTML? |
4. | Mik azok a könyvjelzők a böngészőben? |
5. | Milyen keresési fajtákat ismerünk? |
6. | Milyen fajtáit különböztetjük meg a WEB rendszerű keresőknek? |
7. | http kapcsolat 1 lépése? |
8. | Minek a rövidítése a HTML? |
Megjegyzés küldése