Internett

 

Internett - datamaskiner i et verdensomspennende nettverk

Tim Berners-Lee (f.1955) introduserte i 1989 et stort hypertekstprosjekt som han kalte World Wide Web (WWW, verdensveven), og i 1991 kom WWW på Internett. Berners-Lee konstruert et enkelt programmeringsspråk HTML (HyperText Mark-up Language) og protokoller HTTP (HyperText Transfer Protocol) som gjorde det mulig for alle som hadde tilgang til Internett å lese dokumenter som lå på datamaskiner tilknyttet nettet. Burners-Lee er en av de mange som kjemper for at Internett skal være et åpent og fritt system, ikke eid av noen. I 1993 kom Mosaic og seinere en rekke søkemoterer. Det finnes imidlertid kommersielle aktører som ønsker å tjene penger på nettet og informasjonsflyten, men de har heldigvis ennå ikke lykkes helt. Ved å logge seg inn på Internett, starte en søkemotor, skrive inn et søkeord, så vips kan det være tusenvis av nettsteder som har den informasjonen du er ute etter. I tillegg til det åpne internet finnes det et lukket internet hvor man får adgang mot betaling, f.eks. elektroniske tidsskrifter.

ARPA-nett og EARN

Det som sendes over Internett, f.eks. en E-post (e-mail, Electronic Mail), deles opp i pakker med adresse fra avsender og mottaker, og sendes via en ruter-datamaskin (Router) over nettet. Meldingen mottas av en annen ruter som pakker det hele sammen igjen slik at det blir likt det som ble sendt. Grunnen til dette er at Internet bygger på ARPA-nettet (Advanced Research Project Agency) utviklet av Forsvarsdepartementet i USA på slutten av 1960-tallet. Hensikten var at det skulle gå an å sende meldinger mellom datamaskiner over et nettverk selv om noen av maskinene ble slått ut av drift forårsaket av krig. Uansett skulle meldingen finne en vei gjennom nettet og komme "helskinnet" frem. Etterhvert ble flere universiteter koblet til nettet via andre nettverk som USENET (UNIX Users Group Network), BITNET (Because It´s There) og EARN (European Adademic Research Network). Det var i denne tiden vesentlig akademiske institusjoner som hadde interesse av og brukte nettverkene. Vi brukte i starten Gopher og Mosaic, seinere Netscape navigator.   Idag får private adgang til nettet via internettservice tilbydere (Internet Service Provider) via bredbånd/telefonlinje. Datamaskiner kan også kobles til nettet via en telefonlinje og modem (Modulator Demodulator).

TCP/IP ig IP-adresser

Kommunikasjonsprotokollen som deler opp data i små informasjonspakkerog putter dem sammen igjen som meldinger som sendes over nettet kalles TCP/IP (Transmission Control Protocol/Internet Protocol). En protokoll er en måte datamaskiner kan kommunisere med hverandre, og protokollene inneholder prosedyrer for å behandle data. Informasjonen settes sammen igjen ved mottakerstedet. TCP bestemmer hvordan meldingene skal pakkes og hvordan de skal settes sammen. Internetprotokollen tar seg av hvordan informasjonspakkene rutes og adresseres over nettet. Alle datamaskiner tilkoblet nettverket har sin egen unike adresse kalt IP-adresse i form av en tallkombinasjon bestående av 4 oktetter med 8 bits atskilt av punktum. IP-adressen består av to deler som sier hvilket nett og hvilken maskin på nettet. Det finnes idag A, B, og C-nett, som igjen er delt opp i subnett. I Internet Protocol versjon 4 (IPv4) er det 32 bits adressering, noe som har gitt for få tilgjengelige ledige IP-adresser. I IPv6 er det 128 bits adressering, noe som bedrer situasjonen betydelig. Internet Society er en internasjonal ikke-kommersiell organisasjon som bl.a. står for utdeling av IP-nummer. DNS (Domain Name System) er en database som oversetter IP-nummer til domenenavn.

Det var det nasjonale forskningsrådet i USA (National Science Foundation) som først laget et nasjonalt nettverk basert på ARPA-nettet og TCP/IP protokollene. Selve ARPA-nettet ble offisielt avviklet i 1990. Ethernett er eksempel på en annen type nettverksprotokoll. I alle datamaskiner som har et ethernett-kort er det en spesifikk adresse på kortet (bestående av en kombinasjon av bokstaver og tall) som identifiserer datamaskinens nett-tilknytning. Ethernettkortet brukes til koble datamaskinen til et lokalt nettverk (LAN - Local Area Network) hvor flere datamaskiner kan dele skrivere og nettverksdisker. Dette nettverket kan videre være koblet til det verdensomspennende internett via TCP/IP-protokoller. Intranet er et internt nettverk i en institusjon eller bedrift og er beregnet for internt bruk.

Siden den tid har det kommet kommersielle internetselskaper som kobler seg til nettverket på spesielle tilkoblingspunkter (Network Access Points) på de forskjellige kontinentene. Det har etterhvert utviklet seg til et gigantisk nettverk av nettverk med millioner av datamaskiner tilkoblet systemet. Av de muligheter som nettverket har er det WWW (World Wide Web), en hyptertekstbasert tjeneste, som har hatt størst suksess. Hyptertekst vil si at informasjon ett sted i systemet kan kobles til annen informasjon i WWW. Det går derfor an å koble sammen informasjon i lenker. Noen ord kan utheves i en annen farge og kalles hypertekst lenker/peker eller hyperlenker.(Hyper Links). Lenkene gjør at nettleseren kan hoppe til et annet dokument på samme datamaskin eller til et helt annet sted på internett. På denne måten kan man bevege seg raskt mellom informasjon som befinner seg på datamaskiner som virker som internettservere, og det er dette som kalles "å surfe på nettet". Forskjellige institusjoner og bedrifter (Sites) har laget sine egne lokale nettverk kalt Intranett som bruker internetteknologi og er koblet til internett ved egne datamaskiner (Gateway) som oversetter og sørger for trafikken mellom to ellers uavhengige nettverk.

Det er ofte en form for sikkerhetsbasert brannmur (Firewall) basert på programvare eks. Zone Alarm (http://www.zonelabs.com/store/content/home.jsp) eller maskinvare som begrenser tilgangen fra WWW til institusjonen eller datamaskinene. Brannmuren sperrer for porter og protokoller. En maskinvare brannmur kan være en datamaskin som står mellom det ytre og indre nettverket og sjekker og kontrollerer all nettverkstrafikk. Antivirusprogrammer beskytter datamaskiner mot datavirus, men de må være oppdaterte siden det hele tiden blir produsert nye og mer sofistikerte datavirus. Antivirusprogrammet søker igjennom disker, disketter, E-postvedlegg og nedlastinger fra nettet og gir beskjed og fjerner datavirus. Kjente antivirusprogrammer er Symantec´s Norton http://www.symantec.com/index.htm, F-secure (http://www.f-secure.com/)og McAfee antivirus (http://us.mcafee.com/). Telnet er et dataprogram som gjør det mulig for brukere av nettet å koble seg til andre datamaskiner på nettet via TCP/IP-protokollene. Telnet brukes som terminalemulering, eller kryptert som SSH (Secure Shell), hvor den krypterte versjonen er å anbefale. Filer kan overføres på nettet via en egen filoverføringsprotokoll FTP (File Transfer Protocol). Noen ganger er det som gjest uten navn og passord (Anonymous ftp) mulig å hente informasjon fra en vertsdatamaskin (Host computer). Det finnes forskjellige typer nettverkslesere (Browser) som er dataprogrammer som gir tilgang til WWW og som kan lese hyptertekst. Eksempler på slike er: Netscape Navigator utviklet av firmaet Netscape Communications; Internet Explorer utviklet av Microsoft; Opera; Mozilla Firefox. Det finnes tilleggsprogrammer/programtillegg (add-ons, plug-ins) som gjør at man også kan få overført lyd og video. Flash og Shockwave fra Macromedia for animasjoner. QuickTime, Window Media Player og Real Player for video. Overføring av video over nettet skjer ofte via videostrømming (video streaming) hvor videobildene overføres fortløpende fra en tjenermaskin, analogt for lydstrømming (løpende video og lyd). Informasjon finnes på nettet som oppslagstavler (Bulletin board) hvor det går an å henge opp og lese beskjeder for alle. En tjener (Server) er en datamaskin eller dataprogram tilkoblet internett og som gir en annen klient (Client) datamaskin adgang til tjenermaskinen. En klient er altså en datamaskin som bruker ressurser på en annen datamaskin kalt tjenermaskinen.

Hjemmesiden (Home Page) er startsiden for tilgang til WWW. Enkeltindivider kan også ha sin egen hjemmeside. På siden kan det være små ikoner (Icons) og klikker man på disse opprettes en hypertekstlenke til annen informasjon i systemet. En hjemmeside kan også inneholde små programmer (Applets) som kjøres av nettverksleseren slik at det er mulig å få overført sekvenser av lyd og bilde. JAVA er et programmeringsspråk utviklet av Sun Microsystems som gjør det mulig å sette inn multimedia og programmer på Web-sidene. Hypertekstmarkeringsspråket HTML (HyperText Markup Language) gir koder slik at WWW-sidene kan leses av nettverksleseren. Hypertekstoverføringsprotokollen http (Hypertext Transfer Protocol) er en WWW-protokoll som gjør at det kan foretas forespørsler og oversending av informasjon mellom en tjener- og klientdatamaskin. Andre protokoller kan f.eks. være SMTP (Simple Mail Transfer Protocol), eller RTSP for overføring av streamet video. Adressen som det gjøres en forespørsel til kalles en URL-adresse (Uniform Resource Locator). Alle hyptertekstdokumenter har en unik URL-adresse som starter med http://, og som skrives inn i adressefeltet på nettleseren. Resten av adressen viser hvor dokumentene befinner seg på nettet. Først kontaktes en internettdatamaskin kalt domenenavnserver (Domain Name Servers) som tolker adresse, hvor .no står for Norge. En slik adresse er av formen http://www.uio.no/ gir adressen til hjemmesiden for Universitetet i Oslo. Data ligger på en Web-server samlet og atskilt i direktorier/mapper atskilt av en "/". Et Web-sete/nettsted (Web-site) er en samling Web-informasjon på en tjenermaskin. Sider med mange bilder og store filer tar lang tid før de blir lastet ned fra nettet. Noen Web-tjenere får mange forespørsler og blir sterkt belastet, og for å redusere belastningen kan flere Web-tjenere settes til å løse den samme oppgaven som speil (Mirrors).Nettleseren lagrer en liste over URL-adresser som man har besøkt og danner en "historiefil". Spesielle URL-adresser kan lagres som Favoritter (Favorites) i Explorer eller Bokmerker (Bookmarks) i Netscape. Besøk på kommersielle sider etterlater ofte en informasjonskapsel (Cookie) på din datamaskin, og denne blir brukt av den kommersielle aktøren til å skaffe seg informasjon om deg som bruker av nettet. Som bruker kan du fjerne innholdet i mappen som viser hvilke sider du har besøkt, og innholdet i mappen med informasjonskapsler. XML (Extensible Markup Language) gir i tillegg informasjon av filinnholdet og hvordan data behandles av databasesystemer. En database er en samling av ordnet og strukturert informasjon. SQL (Symbolic Query Language) er et standardspråk for relasjonsdatabaser bl.a. brukt i programmene Oracle og Access hvor det kan sendes spørsmål til databasen. USENET er et system for å spre informasjon fra nyhetsgrupper mellom datamaskiner. Spørsmål som ofte stilles kalles FAQ (Frequently asked questions).

Elektronisk post

Internett brukes mye til sending av elektronisk post (E-post)(E-mail). SMTP (Simple Mail Transfer Protocol) er en protokoll som brukes til å sende E-post. Filer kan sendes med som vedlegg til E-post. MIME (Multipurpose Internet Mail Extensions) er en tilleggsprotokoll som gjør at man kan sende vedlegg (Attachment) med en E-post, i form av bilder, tekstfiler o.l.. Noen av problemene med dagens E-postsystem er uønsket reklame (spam), datavirus som vedlegg til E-post, og ubetenksom bruk av E-post. En måte å beskytte seg mot søppelpost er å bruke et spamfilter i E-postleseren. Dessuten bør ens egen E-postadresse holdes mest mulig hemmelig for utenforstående. Et datavirus er et lite dataprogram som har til formål å komme inn i din datamaskin eller å infisere filer. Makrovirus infiserer tekstbehandlere o.l. som bruker makrokommandoer. Du skal aldri åpne et vedlegg til en E-post hvis du ikke er helt sikker på hvor det kommer fra. Har du lastet ned en fil fra nettet fra en ikke sikker WEB-side må du scanne den før den åpnes. Datahackere har forskjellige formål for sin virksomhet og forsøker å trenge igjennom sikkerhetssystemene og inn i datamaskiner i nettverket. Den eneste måten å sikre seg helt mot hackere og datavirus er å koble datamaskinen fra nettet. Internett er overvåket og det som sendes som elektronisk post kan i prinsippet leses av alle. Så betenk deg vel hva du bruker Internett til. Netikette gir retningslinjer for hvordan man bør bruke nettet. Informasjonskapsler (cookies) er små informasjonsbiter som sendes fra webservere som man besøker og til nettleseren, og brukes til å undersøke hvor ofte en spesiell nettside besøkes. Cookies kan fjernes fra nettleseren. Kommersielle aktører som bruker Internett til pengetransaksjoner etc.opererer med forskjellige krypteringssystemer. JavaScript er et skriptspråk som brukes til å gi økt funksjonalitet og spesialitet i hypertekstdokumenter. Skriptspråk brukes til å lage skript som er små dataprogram som tolkes av et tolkeprogram (interpreter) og får datamaskinen til å sette igang spesielle prosedyrer. CGI-script (Common Gateway Interface) er en skriptprotokoll som brukes til å kjøre programmer på en webserver. PERL (Practical Extraction and Reporting Language) er et mye brukt skriptspråk, som bl.a. kan brukes til å lage cgi-skript. Java er et anvendlige objektorientert programmeringssprå basert på C++, og som passer på all maskinvare.

Søkemotorer

Det finnes en rekke generellesøkeverktøy/søkemotorer (Search Engines) for å kunne finne informasjon på Web. Disse har navn som HotBot, Yahoo!; AltaVista, Looksmart; Excite, Northern Light, Fast Search, Google, Kvasir, Links2Go, Fast, Virtual Library, Beaucoup!, Dogpile, Vivisimo,Teoma, m.fl. Søkemotorene går igjennom og leter ("spider") gjennom alle sider på internett og lagrer tittel, overskrift og søkeord etc. fra disse sidene i en indeks. Når du søker etter et ord leter søkemotoren i den indeksen den har laget, og ikke ute på internett. Open Directory Project er en global katalog for Web basert på frivillig arbeid fra entusiaster. Pandia Goalgetter gir litt informasjon om søking og søkemoterer. WIKIPEDIA er et gratis internettleksikon basert på frivillig arbeid. Det som ligger på nettet er av ymse slag og innhold, og det er opp til leseren å vurdere kvaliteten.

Pakking og datakompresjon

Filer som er svært store kan pakkes (zipping) til en mindre filstørrelse og pakkes ut igjen til normal størrelse (unzipping). Zip-filer er merket med .zip. Programmer som brukes er f.eks. WinZip eller PkZip/PkUnZip. Bilder blir spesielt store og kan pakkes til filkoden .JPEG (Joint Photographic Expert Group) eller .GIF format (Graphics Interchange Format). Filkoden .MPEG er en koding for video. .PDF (Portable Document Format) brukes for henting av filer via Acrobat reader® hvor layout av dokumentet bevares. .MP3 er et mye brukt filformat for musikk.

Datalagring

Datalagringskapasiteten har økt enormt de siste 50 årene. Enorme datamengder er lagret på servere rundt omkring i verden, hektet sammen via internett.

Datalagringsmedier

Datalagringsmedier fra hullkort via forskjellige diskettformater, til CD og USB-minnepinne.

Hullkort UiO

Et Fortran-program skrevet på hullkort i kjelleren i Niels Henrik Abels hus i 1973 som ble brukt til enzymkinetikk og beregning av Hill-koeffisienter i Cand.real.-oppgaven til undertegnede. Programmet hadde fargete styrekort i hver ende, ble lagt i kø,  og deretter eksekvert på UiOs sentrale datamaskin CDC3300, og etterpå hentet man utskriften fra det eksekverte programmet. I dag gjør man den samme regneoperasjonen med noen få programlinjer.

Kvartscene LANDSAT TM på magnetbånd

En kvartscene fra jordressurssatelitten LANDSAT TM-5 lagret på magnetbånd. Brukt i Cand.scient.-hovedfagsoppgaven til Lars Christensen: Fjernanalyse av skog ved brukt av LANDSAT-5 TM og digitale terrengdata. UiO 1990.  I dag laster man ned slike satelittdata via internett.

Landsatscene lagret på magnetbånd

Kvartscene fra LANDSAT-5 TM lagret på magnetbånd med 1600 bpi (bits per tomme).

Tilbake til hovedside

Av Halvor Aarnes
Publisert 3. feb. 2011 14:42 - Sist endret 7. jan. 2019 13:08