Technologie Internetowe cz. 1 Wstęp Dr Karol Grudziński Uniwersytet Kazimierza Wielkiego i Wyższa Szkoła Gospodarki Czym jest WWW (World Wide Web)
Definicja Sieci WWW: największy na świecie elektroniczny zbiór informacji. Zbiór milionów połączonych ze sobą dokumentów, znajdujących się na komputerach rozrzuconych po świecie.
Do dostępu do informacji potrzebna jest przeglądarka.
Komunikacja pomiędzy komputerami odbywa się za pomocą internetu.
Sieć WWW: ogólnoświatowy system komunikacyjny umożliwiający wymianę danych hipermedialnych pomiędzy komputerami podłączonymi do internetu . 2
WWW to system oprogramowania i powiązanych ze sobą dokumentów, który jest nałożony na internet (jego osprzęt i oprogramowanie).
Jednym słowem WWW do warstwa nałożona na internet.
Co to jest sieć?
Sieć jest głównym elementem internetu i każdej międzysieci.
Najprostsza sieć: 2 komunikujące się komputery.
Sieć lokalna i rozległa (LAN local area network i WAN wide area network) Sieć lokalna łączy komputery znajdujące się blisko siebie (w jednym pokoju lub budynku). Czasami odległości w LAN są rzędu kilkunastu kilometrów). 3
W skład sieci rozległej (WAN) wchodzą komputery znajdujące się w różnych miastach, województwach, państwach.
Czym jest międzysieć?
Po połączeniu dwu lub więcej sieci powstaje międzysieć.
Międzysieć umożliwia wymianę danych pomiędzy różnymi sieciami (często różnych typów). (patrz rysunek) 4
Internet to sieć komputerowa o światowym zasięgu.
Internet to sieć komputerowa składająca się z wielu sieci oplatających kulę ziemską.
Do internetu podłączone są komputery różnych typów na których działają różne Systemy Operacyjne. Dzięki oprogramowaniu internetu ani osoby korzystające z internetu ani z WWW nie widzą tych różnic. Internet jest fundamentem dla komunikacji (strukturą umożliwiającą wymianę danych) w ramach sieci WWW. 6
Powiązania sieci WWW i Internetu.
Przez lata ludzie gromadzili pliki na komputerach podłączonych do internetu. Dostęp do plików był możliwy dzięki protokołowi FTP (File Transfer Protocol). Przy pomocy FTP można przenosić pliki między systemami. Wraz ze wzrostem liczby plików odnajdywanie informacji stało się trudne. W internecie znajdowały się miliony publicznie dostępnych dokumentów o których większość użytkowników nie wiedziała. Nie było możliwości wyszukiwania plików gdyż dokumenty nie były ze sobą połączone. W WWW możemy łatwo wyszukiwać dokumenty i przechodzić między nimi GDYŻ S POACZONE!!! 7
Sieć WWW jest nałożona na Internet (komunikacja w sieci WWW odbywa się za pośrednictwem internetu).
Zasadnicza różnica między WWW a internetem polega na tym, że dokumenty WWW są połączone i można przechodzić od jednego do drugiego i budować wyszukiwaki.
Z kolei w celu odnalezienia poszczególnych dokumentów bez korzystania z sieci WWW tylko przy pomocy narzędzi typowych dla internetu byłby potrzeby spis wszystkich informacji dostępnych w tej sieci i adresów gdzie się znajdują. Sporządzenie takiego spisu jest niemożliwe ze względu na konieczność ciągłego jego uaktualniania. 8
Intranety.
Intranet to sieć o możliwościach podobnych do Internetu, w której dostępne są narzędzia typowe dla sieci światowej, takie jak poczta elektroniczna, przeglądarki, przesyłanie plików.
Różnica między internetem a intranetem jest taka, że intranet jest wewnętrzną siecią przedsiębiorstwa lub organizacji i może ale nie musi być podłączony do internetu. W intranecie mamy narzędzia typowe dla internetu, jest to jednak sieć prywatna i na ogół część danych jest tajna nie tylko dla użytkowników internetu ale i samego intranetu. W intranecie przechowuje się dane danego przedsiębiorstwa/organizacji. 9
Początki Sieci WWW.
Początki Internetu sięgają końca lat sześćdziesiątych, jednakże WWW powstała dopiero w Marcu 1989. Jej twórcą jest Tim Berners-Lee. Bezpośrednią przyczyną utworzenia WWW była potrzeba udostępnienia badaczom z całego świata rezultatów badań prowadzonych w CERN-nie pod Genewą. Właśnie w Cernie (Europejskie Centrum Badań Fizyki Cząstek Elementarnych) Tim Berners- Lee zaproponował system komunikacji komputerów za pomocą hipertekstu. Sieć w Cernie z czasem rozrosła się zatem do sieci globalnej. 10
Sieć WWW udostępniono w Genewie w Szwajcarii w styczniu 1992 r. Na początku sieć udostępniała tylko dokumenty CERN-u, przeglądarka była tekstowa, Już w kwietniu 1993 było 60 serwerów WWW.
Normy Dotyczące Internetu.
Do internetu są podłączone komputery różnych typów działające pod różnymi OS. Aby programy mogły się komunikować konieczne jest przestrzeganie pewnych zasad (protokołów).
W internecie można znalezć dokumenty RFC (Request for Comments) zawierające zarówno normy dt. sieci WWW oraz samego internetu. 11
Dokumenty RFC to rodzaj roboczych notatek sporządzanych przez osoby zajmujące się rozwojem Internetu i WWW.
Ani sieć WWW ani Internet nie mają swojego właściciela.
Zatwierdzaniem standardów dla sieci i WWW zajmują się:
WWW Consortium (grupa kierowana przez Tima Bernersa-Lee)
Internet Advisory Board (IAB)
W skład WWW Consortium wchodzą firmy i wyższe uczelnie, które współpracują ze sobą w celu zapewnienia technicznego rozwoju sieci jak i ustalaniu norm. 12
IAB zajmuje się opracowaniem norm dla Internetu. Organizacja składa się z czterech podstawowych grup:
IETF (Internet Engineering Task Force)
IESG (Internet Engineering Steering Group)
IRTF (Internet Research Task Force)
IRSG (Internet Research Steering Group)
W/w zajmują się ocenianiem oraz testowaniem propozycji standardów w celu stwierdzenia, czy spełniają warunki stawiane standardom internetowym. 13
Przeglądarka Mosaic pierwsza graficzna przeglądarka.
Pierwsza graficzna przeglądarka: Mosiac, opracowana przez programistów z NCSA (National Center for Supercomputing Applications) pod przewództwem wówczas studenta, Marca Anderseena.
Przeglądarka Netscape
Jim Clark, założyciel i prezes firmy Silicon Graphics zakłada w drugiej połowie lat 90-tych firmę Netscape i bierze Anderseena do siebie. Tworzą przeglądarkę Netscape i zestaw komercyjnych narzędzi i serwerów WWW. Po wejściu Netscape na giełdę, dwudziesto- paro letni Anderseen zarabia 50 milionów $ a Clark blisko 1 miliard $. 14
Przeglądarka Internet Explorer.
Microsoft z pewnym opóznieniem robi Internet Explorer. Dołącza IE do systemu Windows za darmo co stanowi początek licznych pozwów sądowych różnych firm.
Inne przeglądarki.
Mozilla
HotJava
WorldView
Opera
Firebird a następnie FireFox ... + wiele innych. 15
Architektura sieci WWW.
Aby pisać oprogramowanie dla sieci WWW, trzeba poznać sposoby komunikowania się komputerów do niej podłączonych.
Dzięki Internetowi jest możliwa wymiana danych, włączając dokumenty WWW.
Za kulisami mechanizmów transportu danych w sieci WWW kryje się internet.
Protokoły komunikacyjne.
Protokół to zbiór reguł, które normują transmisję danych oraz formaty komunikatów. W sieci dane są przsyłane w formie komunikatów zdefiniowanych przez protokół komunikacyjny. Wszystkie programy sieciowe współpracują z odpowiednimi protokołami. 16
Co to jest HTTP?
Większość adresów w sieci WWW zaczyna się od słowa http, np. http://www.microsoft.com/
HTTP (HyperText Transport Protocol), to protokół sieciowy opracowany specjalnie dla sieci WWW. Definiuje on sposób wzajemnej komunikacji między przeglądarką a serwerem WWW.
Sposób komunikacji przeglądarki z serwerem:
Podczas nawiązywania łączności z serwerem przeglądarka (klient) prosi o przesłanie odpowiedniej strony. Strona jest to tekst + tagi HTML. Serwer przesyła kopię żądanego pliku przeglądarce, która interpretuje tagi HTML i formatuje stronę. Gdy zachodzi potrzeba wyświetlenia grafiki, przeglądarka żąda przesłania odpowiednich plików i potem je wyświetla. 17
Co to jest HTML?
Dokumenty WWW muszą być zrozumiałe dla przeglądarki.
Przeglądarka wyświetla strony w formacie HTML (nie tylko).
HTML (HyperText Markup Language) jest językiem opisu dokumentów WWW zawierającym łącza do innych stron WWW.
HTML nie jest językiem programowania, lecz zbiorem reguł umożliwiających formatowanie dokumentów WWW. Język ten umożliwia zapisanie różnych informacji dotyczących wyglądu strony. 18
Hipertekst.
W wypadku sieci WWW termin hipertekst oznacza pewien fragment dokumentu opisanego w języku HTML.
Można powiedzieć, że hipertekst jest tekstem zawierającym łącze do informacji przechowywanej w sieci WWW. Zazwyczaj jest to łącze do innej strony WWW. Tradycyjnie dla oznaczenia łącza stosuje się pogrubienie lub podkreślenie.
Hipertekst jest ważną częścią dokumentu WWW, która informuje o powiązaniach z innym zasobami. 19
Opisowe formatowanie tekstu.
Należy zrozumieć różnicę między opisowym formatowaniem tekstu (HTML, LaTeX) a formatowaniem proceduralnym zapomocą programu (np. Microsoft Word).
W opisowym formatowaniu stosowane są specjalne znaczniki (tagi) służące do wyróżniania odpowiednich części dokumentu.
W sieci WWW można się poruszać na 2 sposoby. 1. Wpisując identyfikator URL (uniform resource locator) w polu adresu. URL zawiera informacje o poszukiwanych zasobach, np. Pliku. Innymi słowy jest on adresem zasobów dostępnych w sieci, takich jak dokumenty WWW, pliki, programy. np. http://www.wp.pl/ Po wpisaniu URL-a w oknie przeglądarki przeglądarka łączy się z serwerem i po nawiązaniu łączności wyświetla dane wysłane przez serwer 2. Użycie łączy hipertekstowych i obszarów aktywnych i innych elementów strony jak menu itp. 21
W celu pobrania dokumentu z Internetu przeglądarka potrzebuje informacji na temat miejsca w którym on się znajduje, oraz sposobu porozumiewania się z odpowiednim serwerem.
Twórcy sieci WWW wprowadzili identyfikatory URL w celu ogólnego sposobu adresowania różnych zasobów internetowych.
Tak więc identyfikatory URL są używane wyłącznie do zapisania informacji umożliwiającej odnalezienie zasobów w internecie.
URL należy traktować jako specjalny rodzaj adresu sieciowego. Jednakże nie odnosi się on do samego komputera głównego lecz do konkretnego dokumentu udostępnianego na tym serwerze. 22
W dokumencie RFC numer 1738 zatytułowanym Uniform Resource Locators , napisanym przez Bernersa-Lee, Masintera i McCahilla, sposoby dostępu są określane mianem schematów.
Schemat URL opisuje sposób w jaki program może sięgnąć do danego obiektu w sieci.
Dla większości zastosowań sposób dostępu można utożsamić z protokołem.
Podstawowa składnia URL: : I tak w adresie http://www.wp.pl/ http to nazwa schematu czyli protokół http. Inne schematy to ftp, https, mailto. 23