Mikä on Internet, kuka loi World Wide Webin ja miten globaali verkko toimii. World Wide Web - World Wide Web

"World Wide Web" (WWW)

World Wide Web (WWW) on suosituin ja kiinnostavin Internet-palvelu, suosittu ja kätevä tapa käsitellä tietoa. Internetin yleisin nimi nykyään on www. yli puolet Internetin tietovirrasta tulee WWW:stä. WWW-palvelimien määrää ei voi tällä hetkellä arvioida tarkasti, mutta joidenkin arvioiden mukaan niitä on yli 30 miljoonaa. WWW:n kasvuvauhti on jopa korkeampi kuin itse Internetin.

WWW on maailmanlaajuinen tietovarasto, jossa tietoobjektit on linkitetty hypertekstirakenteella. Hyperteksti on ensisijaisesti ristiviittattujen asiakirjojen järjestelmä, tapa esittää tietoa dokumenttien välisten linkkien avulla. Koska WWW-järjestelmä mahdollistaa näiden asiakirjojen sisällyttämisen tekstin lisäksi myös grafiikkaa, ääntä ja videota, hypertekstidokumentista on tullut hypermediadokumentti.

Vähän WWW-historiaa. World Wide Web (WWW) on yksi World Wide Webin tärkeistä osista. Ja hänellä on oma tarinansa.

Tämä on mielenkiintoista. Euroopan hiukkasfysiikan laboratorio (CERN) sijaitsee Sveitsissä Vuonna 1980 mies nimeltä Tim Bernes-Lee, joka työskenteli tuolloin CERN:ssä, alkoi kehittää projektia maailmanlaajuista tietokoneverkkoa varten, joka tarjoaisi fyysikot ympäri maailmaa. erilaisia ​​tietoja. Se kesti yhdeksän vuotta. Vuonna 1989, monien vuosien teknisten kokeilujen jälkeen, Mr. Tim ehdotti erityistä vaihtoehtoa, joka oli World Wide Webin tai lyhyesti WWW:n alku.

Ajan myötä monet ymmärsivät, että tällaisia ​​palveluita voivat käyttää eri ihmiset, eivät vain fyysikot. WWW alkoi kasvaa nopeasti. Monet ihmiset auttoivat häntä tässä: jotkut kehittivät laitteistoa, toiset loivat ohjelmistoja, jotka kehittivät WWW:tä, ja toiset paransivat viestintälinjoja. Kaiken tämän ansiosta siitä tuli nykyinen - "World Wide Web".

Asiakkaan ja palvelimen toiminnan periaatteet. WWW toimii asiakas-palvelin-periaatteella, tarkemmin sanottuna asiakas-palvelimet: on monia palvelimia, jotka asiakkaan pyynnöstä palauttavat hänelle hypermedia-asiakirjan - dokumentin, joka koostuu osista, joissa on monipuolinen informaatio (teksti, ääni) , grafiikka, kolmiulotteiset objektit jne.), jossa jokainen elementti voi olla linkki toiseen asiakirjaan tai sen osaan. WWW-dokumenttien linkit on järjestetty siten, että jokainen globaalin Internetin tietoresurssi on yksilöllisesti osoitettu ja parhaillaan luettava dokumentti voi linkittää sekä muihin samalla palvelimella oleviin asiakirjoihin että asiakirjoihin (ja yleinen Internet-resursseille ) muissa Internetin tietokoneissa. Lisäksi käyttäjä ei huomaa tätä ja työskentelee koko Internetin tietotilan kanssa yhtenä kokonaisuutena.

WWW-linkit osoittavat paitsi itse WWW-kohtaisiin asiakirjoihin, myös muihin Internetin palveluihin ja tietolähteisiin. Lisäksi useimmat WWW-asiakasohjelmat (selaimet, navigaattorit) eivät vain ymmärrä tällaisia ​​linkkejä, vaan ovat myös asiakasohjelmia vastaaville palveluille: FTP, gopher, Usenet-verkkouutiset, sähköposti jne. WWW-ohjelmistotyökalut ovat siis universaaleja erilaisille Internet-palveluille, ja itse WWW-tietojärjestelmällä on integroiva rooli.

Listataan joitain WWW:ssä käytettyjä termejä.

Ensimmäinen termi - html - on joukko komentosarjoja, jotka sisältyvät html-dokumenttiin ja jotka määrittelevät toiminnot, jotka katsojan (selaimen) tulee suorittaa tätä asiakirjaa ladattaessa. Tämä tarkoittaa, että jokainen sivu on tavallinen tekstitiedosto, joka sisältää tekstiä, joka näkyy kaikille, ja joitain ohjelman ohjeita, jotka ovat näkymättömiä ihmisille linkkien muodossa muille sivuille, kuviin, palvelimiin. Siten täytetään kyselylomakkeita ja rekisteröintikortteja ja tehdään sosiologisia tutkimuksia.

Toinen termi on URL (uniform Resource locator - yleinen osoitin resurssiin). Näin niitä linkkejä Internetin tietolähteisiin kutsutaan.

Toinen termi on http (hypertext transfer protocol). Tämä on protokollan nimi, jolla asiakas ja WWW-palvelin ovat vuorovaikutuksessa.

WWW on suora pääsypalvelu, joka vaatii täyden Internet-yhteyden ja vaatii lisäksi usein nopeita viestintälinjoja, jos luettavassa asiakirjassa on paljon grafiikkaa tai muuta ei-tekstitietoa.

Internetin nopea kehitys, joka alkoi 90-luvun alussa, johtuu suurelta osin uuden WWW-teknologian syntymisestä. Tämä tekniikka perustuu hypertekstitekniikkaan, joka on ulotettu kaikkiin Internetiin kytkettyihin tietokoneisiin.

Hypertekstiteknologiaa käytettäessä teksti on jäsennelty ja linkkisanat korostuvat siinä. Kun linkki aktivoidaan (esimerkiksi hiirtä käytettäessä), tapahtuu siirtymä linkissä määritettyyn tekstikatkelmaan tai toiseen asiakirjaan. Voisimme siis muuntaa tekstimme hyperteksiksi korostamalla sanat "hypertekstitekniikka" ensimmäisessä kappaleessa ja kirjaamalla, että kun tämä linkki aktivoituu, tapahtuu siirtyminen toisen kappaleen alkuun.

WWW-tekniikan avulla voit navigoida lähdeasiakirjan lisäksi myös mihin tahansa asiakirjaan, joka sijaitsee tietyllä tietokoneella, ja mikä tärkeintä, mihin tahansa asiakirjaan millä tahansa Internetiin liitetyllä tietokoneella. WWW-tekniikalla toteutettuja asiakirjoja kutsutaan web-sivuiksi.

Asiakirjojen jäsentäminen ja web-sivujen luominen tapahtuu HTML:llä (Hyper Text Markup Language). Wordin tekstieditorin avulla voit tallentaa asiakirjoja Web-sivumuotoon. Web-sivuja tarkastellaan erityisillä selaimen katseluohjelmilla. Tällä hetkellä yleisimmät selaimet ovat Internet Explorer, Netscape Navigator, Opera.

Jos tietokoneesi on yhteydessä Internetiin, voit ladata jonkin selaimista ja lähteä matkalle World Wide Webin läpi. Ensin sinun on ladattava Web-sivu yhdeltä Internet-palvelimelta, löydettävä sitten linkki ja aktivoitava se. Tämän seurauksena Web-sivu ladataan toiselta Internet-palvelimelta, joka saattaa sijaita toisessa osassa maailmaa. Voit puolestaan ​​aktivoida linkin tällä verkkosivulla, seuraava Web-sivu latautuu jne.

Internet kasvaa erittäin nopeasti, ja tarvittavan tiedon löytäminen kymmenien miljoonien asiakirjojen joukosta on yhä vaikeampaa. Tiedon etsimiseen käytetään erityisiä hakupalvelimia, jotka sisältävät tarkkaa ja jatkuvasti päivitettävää tietoa kymmenien miljoonien Web-sivujen sisällöstä.

World Wide Webin rakenne ja periaatteet

World Wide Web Wikipedian ympärillä

World Wide Web koostuu miljoonista Internet-verkkopalvelimista, jotka sijaitsevat ympäri maailmaa. Web-palvelin on ohjelma, joka toimii verkkoon kytketyssä tietokoneessa ja käyttää HTTP-protokollaa tiedonsiirtoon. Yksinkertaisimmassa muodossaan tällainen ohjelma vastaanottaa tietyn resurssin HTTP-pyynnön verkon kautta, löytää vastaavan tiedoston paikalliselta kiintolevyltä ja lähettää sen verkon kautta pyynnön esittäneelle tietokoneelle. Monimutkaisemmat verkkopalvelimet pystyvät dynaamisesti allokoimaan resursseja vastauksena HTTP-pyyntöön. Resurssien (usein tiedostojen tai niiden osien) tunnistamiseen World Wide Webissä käytetään yhtenäisiä resurssitunnisteita (URI). Uniform Resource Identifier). Yhtenäisiä URL-resurssien paikantimia käytetään resurssien paikantamiseen verkosta. Uniform Resource Locator). Nämä URL-paikantimet yhdistävät URI-tunnistustekniikan ja DNS-verkkotunnusjärjestelmän. Domain Name System) - verkkotunnuksen nimi (tai suoraan osoite numeerisena merkintänä) on osa URL-osoitetta, joka määrittää tietokoneen (tarkemmin sanottuna yhden sen verkkoliitännöistä), joka suorittaa halutun verkkopalvelimen koodin.

Verkkopalvelimelta vastaanotettujen tietojen tarkastelemiseksi asiakastietokoneessa käytetään erityistä ohjelmaa - verkkoselainta. Web-selaimen päätehtävä on näyttää hypertekstiä. World Wide Web liittyy erottamattomasti hypertekstin ja hyperlinkkien käsitteisiin. Suurin osa Internetin tiedoista on hypertekstiä. HTML:ää käytetään perinteisesti hypertekstin luomisen, tallentamisen ja näyttämisen helpottamiseksi World Wide Webissä. Hypertekstin merkintäkieli), hypertekstin kuvauskieli. Hypertekstin merkitsemistyötä kutsutaan layoutiksi (ilman yhdysviivaa). HTML-merkinnän jälkeen tuloksena oleva hyperteksti sijoitetaan tiedostoon. Tällainen HTML-tiedosto on World Wide Webin pääresurssi. Kun HTML-tiedosto on asetettu verkkopalvelimen saataville, sitä kutsutaan "verkkosivuksi". Joukko verkkosivuja muodostaa verkkosivuston. Hyperlinkit lisätään web-sivujen hypertekstiin. Hyperlinkit auttavat World Wide Web -käyttäjiä helposti navigoimaan resurssien (tiedostojen) välillä riippumatta siitä, sijaitsevatko resurssit paikallisessa tietokoneessa vai etäpalvelimessa. Web-hyperlinkit perustuvat URL-tekniikkaan.

World Wide Web Technologies

Webin visuaalisen havainnoinnin parantamiseksi CSS-tekniikkaa on käytetty laajalti, jonka avulla voit asettaa yhtenäisiä suunnittelutyylejä monille verkkosivuille. Toinen huomion arvoinen innovaatio on URN-resurssien merkintäjärjestelmä. Yhtenäinen resurssin nimi).

Suosittu World Wide Webin kehittämiskonsepti on semanttisen verkon luominen. Semanttinen verkko on lisäosa olemassa olevaan World Wide Webiin, jonka tarkoituksena on tehdä verkkoon lähetetyistä tiedoista ymmärrettävämpiä tietokoneille. Semanttinen verkko on käsite verkosta, jossa jokaiselle ihmiskieliselle resurssille annettaisiin kuvaus, jonka tietokone voi ymmärtää. Semanttinen verkko avaa pääsyn selkeästi jäsenneltyihin tietoihin kaikille sovelluksille alustasta ja ohjelmointikielistä riippumatta. Ohjelmat voivat löytää itse tarvittavat resurssit, käsitellä tietoa, luokitella tietoja, tunnistaa loogisia yhteyksiä, tehdä johtopäätöksiä ja jopa tehdä päätöksiä näiden johtopäätösten perusteella. Jos semanttinen verkko otetaan laajalti käyttöön ja toteutetaan viisaasti, se voi aiheuttaa vallankumouksen Internetissä. Semanttinen verkko käyttää englanninkielistä RDF-muotoa luodakseen tietokoneella luettavan kuvauksen resurssista. Resurssin kuvauskehys ), joka perustuu XML-syntaksiin ja käyttää URI-tunnisteita resurssien tunnistamiseen. Uutta tällä alueella on RDFS (Englanti) Venäjän kieli (Englanti) RDF-kaavio) ja SPARQL (eng. Protokolla ja RDF-kyselykieli ) (lausutaan "sparkle"), uusi kyselykieli RDF-tietojen nopeaan käyttöön.

World Wide Webin historia

Tim Berners-Leeä ja vähemmässä määrin Robert Cayoa pidetään World Wide Webin keksijöinä. Tim Berners-Lee on HTTP-, URI/URL- ja HTML-tekniikoiden alullepanija. Vuonna 1980 hän työskenteli Euroopan ydintutkimusneuvostossa (ranskalainen). Conseil Européen pour la Recherche Nucléaire, CERN ) ohjelmistokonsultti. Siellä, Genevessä (Sveitsi), hän kirjoitti Inquire-ohjelman omiin tarpeisiinsa. Tiedustella, voidaan kääntää löyhästi "Interrogatoriksi"), joka käytti satunnaisia ​​assosiaatioita tietojen tallentamiseen ja loi käsitteellisen perustan World Wide Webille.

Berners-Lee isännöi maailman ensimmäistä verkkosivustoa 6. elokuuta 1991 ensimmäisellä verkkopalvelimella, joka oli saatavilla osoitteessa http://info.cern.ch/, (). Resurssi määritteli käsitteen Maailman laajuinen verkko, sisälsi ohjeet verkkopalvelimen asettamiseen, selaimen käyttöön jne. Tämä sivusto oli myös maailman ensimmäinen Internet-hakemisto, koska Tim Berners-Lee julkaisi myöhemmin ja ylläpiti siellä listaa linkkejä muille sivustoille.

Ensimmäinen valokuva World Wide Webissä oli parodiafilk-yhtye Les Horribles Cernettes. Tim Bernes-Lee pyysi ryhmän johtajalta skannauksia niistä CERNin Hardronic Festivalin jälkeen.

Silti verkon teoreettinen perusta luotiin paljon aikaisemmin kuin Berners-Lee. Vuonna 1945 Vannaver Bush kehitti Memex-konseptin. (Englanti) Venäjän kieli - mekaaniset apuvälineet "ihmisen muistin laajentamiseen". Memex on laite, johon henkilö tallentaa kaikki kirjansa ja tietueensa (ja ihannetapauksessa kaiken muodollisesti kuvattavissa olevan tietonsa) ja joka toimittaa tarvittavat tiedot riittävän nopeasti ja joustavasti. Se on laajennus ja lisäys ihmisen muistiin. Bush ennusti myös kattavaa teksti- ja multimediaresurssien indeksointia mahdollisuudella löytää nopeasti tarvittavat tiedot. Seuraava merkittävä askel kohti World Wide Webiä oli hypertekstin luominen (Ted Nelsonin vuonna 1965 keksimä termi).

  • Semanttiseen verkkoon kuuluu World Wide Webin tiedon johdonmukaisuuden ja merkityksen parantaminen ottamalla käyttöön uusia metatietomuotoja.
  • Sosiaalinen verkko nojaa Webissä saatavilla olevan tiedon organisointityöhön, jonka web-käyttäjät itse tekevät. Toisessa suunnassa työkaluina käytetään aktiivisesti semanttiseen verkkoon kuuluvia kehityssuuntia (RSS ja muut verkkokanavaformaatit, OPML, XHTML-mikroformaatit). Wikipedian luokkapuun osittain semanttisoidut osiot auttavat käyttäjiä tietoisesti navigoimaan tietotilassa, mutta alakategorioiden erittäin pehmeät vaatimukset eivät anna aihetta toivoa tällaisten osioiden laajentamista. Tässä suhteessa yritykset laatia tietokartastoja voivat olla kiinnostavia.

On myös suosittu Web 2.0 -konsepti, joka tiivistää useita World Wide Webin kehityssuuntia.

Menetelmät tiedon aktiiviseen näyttämiseen World Wide Webissä

Tietoa verkossa voidaan näyttää joko passiivisesti (eli käyttäjä voi vain lukea) tai aktiivisesti - sitten käyttäjä voi lisätä tietoja ja muokata niitä. Menetelmiä tietojen aktiiviseen näyttämiseen World Wide Webissä ovat:

On huomattava, että tämä jako on hyvin mielivaltainen. Joten vaikkapa blogia tai vieraskirjaa voidaan pitää foorumin erikoistapauksena, joka puolestaan ​​on sisällönhallintajärjestelmän erikoistapaus. Yleensä ero ilmenee tietyn tuotteen tarkoituksessa, lähestymistavassa ja sijoittelussa.

Joihinkin verkkosivustojen tietoihin pääsee myös puheella. Intia on jo alkanut testata järjestelmää, joka mahdollistaa sivujen tekstisisällön pääsyn myös lukemattomille ja kirjoittamattomille.

World Wide Webiä kutsutaan joskus ironisesti Wild Wild Webiksi, viitaten elokuvan Wild Wild West nimeen.

Katso myös

Huomautuksia

Kirjallisuus

  • Fielding, R.; Gettys, J.; Mogul, J.; Fristik, G.; Mazinter, L.; Leach, P.; Berners-Lee, T. (kesäkuu 1999). "Hypertext Transfer Protocol - http://1.1" (Information Sciences Institute).
  • Berners-Lee, Tim; Bray, Tim; Connolly, Dan; Cotton, Paul; Fielding, Roy; Jeckle, Mario; Lilly, Chris; Mendelsohn, Nooa; Orcard, David; Walsh, Norman; Williams, Stuart (15. joulukuuta 2004). "World Wide Webin arkkitehtuuri, ensimmäinen osa" (W3C).
  • Polo, Luciano World Wide Web Technology Architecture: käsitteellinen analyysi. Uudet laitteet(2003). Arkistoitu alkuperäisestä 24. elokuuta 2011. Haettu 31. heinäkuuta 2005.

Linkit

  • World Wide Web Consortiumin (W3C) virallinen verkkosivusto (englanniksi)
  • Tim Berners-Lee, Mark Fischetti. Webin kudonta: World Wide Webin alkuperäinen suunnittelu ja lopullinen päämäärä. - New York: HarperCollins Publishers (Englanti) Venäjän kieli . - 256 s. - ISBN 0-06-251587-X, ISBN 978-0-06-251587-2(Englanti)
Muut organisaatiot, jotka osallistuvat World Wide Webin ja Internetin kehittämiseen yleensä

Mikä on World Wide Web?

Verkko tai "verkko" on kokoelma toisiinsa liittyviä sivuja, joissa on tiettyjä tietoja. Jokainen tällainen sivu voi sisältää tekstiä, kuvia, videoita, ääntä ja muita erilaisia ​​esineitä. Mutta tämän lisäksi web-sivuilla on niin sanottuja hyperlinkkejä. Jokainen tällainen linkki osoittaa toiselle sivulle, joka sijaitsee jollain toisella Internet-tietokoneella.

Erilaiset tietoresurssit, jotka ovat yhteydessä toisiinsa tietoliikenteen avulla ja perustuvat datan hypertekstiesitykseen, muodostavat World Wide Webin tai lyhennettynä WWW:n.

Hyperlinkit linkittävät sivuille, jotka sijaitsevat eri tietokoneilla eri puolilla maailmaa. Valtava määrä tietokoneita, jotka on yhdistetty yhdeksi verkkoksi, on Internet, ja "World Wide Web" on valtava määrä verkkotietokoneissa isännöityjä verkkosivuja.

Jokaisella Internet-sivulla on osoite - URL (Uniform Resource Locator - yksilöllinen osoite, nimi). Tästä osoitteesta löydät minkä tahansa sivun.

Miten World Wide Web luotiin?

12. maaliskuuta 1989 Tim Berners-Lee esitteli CERNin johdolle projektin yhtenäisestä organisaatio-, tallennus- ja tiedonsaannin järjestelmästä, jonka piti ratkaista tiedon ja kokemusten jakamisen ongelma keskuksen työntekijöiden välillä. Berners-Lee ehdotti ratkaisua ongelmaan, joka liittyy työntekijöiden eri tietokoneiden tietoihin pääsyyn selainohjelmilla, jotka tarjoavat pääsyn palvelintietokoneeseen, johon hypertekstitiedot on tallennettu. Projektin onnistuneen toteuttamisen jälkeen Berners-Lee onnistui vakuuttamaan muun maailman käyttämään yleisiä Internet-viestintästandardeja HTTP- (Hypertext Transfer Protocol) ja Universal Markup Language (HTML) -standardien avulla.

On huomattava, että Tim Berners-Lee ei ollut ensimmäinen Internetin luoja. Ensimmäisen protokollajärjestelmän, joka varmistaa tiedonsiirron verkkoon kytkettyjen tietokoneiden välillä, kehittivät Yhdysvaltain puolustusalan edistyneiden tutkimusprojektien viraston (DARPA) työntekijät. Vinton Cerf Ja Robert Kahn 60-luvun lopulla - viime vuosisadan 70-luvun alussa. Berners-Lee ehdotti vain tietokoneverkkojen ominaisuuksien käyttämistä uuden järjestelmän luomiseksi tiedon järjestämiseksi ja niiden käyttämiseksi.

Mikä oli World Wide Webin prototyyppi?

Jo 1900-luvun 60-luvulla Yhdysvaltain puolustusministeriö asetti tehtäväksi kehittää luotettava tiedonsiirtojärjestelmä sodan varalta. US Advanced Research Projects Agency (ARPA) ehdotti tietokoneverkon kehittämistä tätä tarkoitusta varten. He kutsuivat sitä ARPANETiksi (Advanced Research Projects Agency Network). Hanke yhdisti neljä tieteellistä laitosta - Los Angelesin yliopiston, Stanfordin tutkimusinstituutin sekä Santa Barbaran ja Utahin yliopistot. Kaikki työt rahoitettiin Yhdysvaltain puolustusministeriöltä.

Ensimmäinen tiedonsiirto tietokoneverkon kautta tapahtui vuonna 1969. Los Angelesin yliopiston professori ja hänen opiskelijansa yrittivät kirjautua Stanfordin tietokoneeseen ja välittää sanan "login". Vain kaksi ensimmäistä kirjainta L ja O lähetettiin onnistuneesti Kun he kirjoittivat kirjaimen G, viestintäjärjestelmä epäonnistui, mutta Internet-vallankumous tapahtui.

Vuoteen 1971 mennessä Yhdysvaltoihin luotiin 23 käyttäjän verkko. Ensimmäinen ohjelma kehitettiin sähköpostin lähettämiseen verkon kautta. Ja vuonna 1973 University College London ja Norjan julkishallinto liittyivät verkostoon, ja verkostosta tuli kansainvälinen. Vuonna 1977 Internetin käyttäjien määrä oli 100, vuonna 1984 - 1000, vuonna 1986 niitä oli jo yli 5 000, vuonna 1989 - yli 100 000 Vuonna 1991 CERN:ssä toteutettiin World-Wide Web (WWW) -projekti. Vuonna 1997 Internetin käyttäjiä oli jo 19,5 miljoonaa.

Jotkut lähteet osoittavat World Wide Webin ilmestymispäivän päivää myöhemmin - 13. maaliskuuta 1989.

Aluksi Internet oli tietojen välittämiseen tarkoitettu tietokoneverkko, joka kehitettiin Yhdysvaltain puolustusministeriön aloitteesta. Syynä oli ensimmäinen keinotekoinen maasatelliitti, jonka Neuvostoliitto laukaisi vuonna 1957. Yhdysvaltain armeija päätti, että tässä tapauksessa he tarvitsivat erittäin luotettavan viestintäjärjestelmän. ARPANET ei ollut pitkään salaisuus, ja sitä alettiin pian käyttää aktiivisesti eri tieteenaloilla.

Ensimmäinen onnistunut etäviestintäistunto järjestettiin vuonna 1969 Los Angelesista Stanfordiin. Vuonna 1971 kehitettiin välittömästi suosittu ohjelma sähköpostin lähettämiseen Internetin kautta. Ensimmäiset ulkomaiset organisaatiot, jotka liittyivät verkkoon, olivat Isossa-Britanniassa ja Norjassa. Atlantin ylittävän puhelinkaapelin asentamisen myötä näihin maihin ARPANETista tuli kansainvälinen verkko.

ARPANET oli ehkä edistyneempi viestintäjärjestelmä, mutta se ei ollut ainoa. Ja vasta vuoteen 1983 mennessä, kun amerikkalainen verkko täyttyi ensimmäisillä uutisryhmillä, ilmoitustauluilla ja siirtyi käyttämään TCP/IP-protokollaa, mikä mahdollisti integroinnin muihin tietokoneverkkoihin, ARPANETista tuli Internet. Kirjaimellisesti vuotta myöhemmin tämä nimike alkoi vähitellen siirtyä NSFNetille - yliopistojen väliselle verkolle, jolla oli suuri kapasiteetti ja joka keräsi 10 tuhatta kytkettyä tietokonetta vuosittain. Ensimmäinen Internet-chat ilmestyi vuonna 1988, ja vuonna 1989 Tim Berners-Lee ehdotti World Wide Webin konseptia.

Maailman laajuinen verkko

Vuonna 1990 ARPANET lopulta hävisi NSFNetille. On syytä huomata, että ne molemmat kehittivät samat tieteelliset organisaatiot, vain ensimmäinen oli Yhdysvaltain puolustuspalvelujen tilaama ja toinen omasta aloitteestaan. Tämä kilpaileva parisuhde johti kuitenkin tieteelliseen kehitykseen ja löytöihin, jotka tekivät World Wide Webistä todellisuuden, joka tuli julkisesti saataville vuonna 1991. Konseptin ehdottaja Berners Lee kehitti seuraavien kahden vuoden aikana HTTP (hypertext) -protokollan, HTML-kielen ja URL-tunnisteet, jotka ovat tavallisille käyttäjille tutumpia Internet-osoitteina, sivustoina ja sivuina.

World Wide Web on järjestelmä, joka tarjoaa pääsyn Internetiin yhdistetyn palvelintietokoneen tiedostoihin. Osittain tästä syystä käsitteet web ja Internet usein korvaavat toisensa. Itse asiassa Internet on viestintätekniikka, eräänlainen tietotila, ja World Wide Web täyttää sen. Tämä hämähäkkiverkko koostuu miljoonista verkkopalvelimista - tietokoneista ja niiden järjestelmistä, jotka vastaavat verkkosivustojen ja sivujen toiminnasta. Verkkoresurssien käyttämiseen (lataamiseen, katseluun) tavalliselta tietokoneelta käytetään selainohjelmaa. Web, WWW ovat synonyymejä World Wide Webille. WWW-käyttäjien määrä on miljardeja.

World Wide Web (lyhennetty Maailman laajuinen verkko tai WWW) on tietoresurssien kokonaisuus, jotka on yhdistetty toisiinsa tietoliikenteen avulla ja jotka perustuvat ympäri maailmaa hajallaan olevan datan hypertekstiesitykseen.

World Wide Webin syntymävuotena pidetään vuotta 1989. Tänä vuonna Tim Berners-Lee ehdotti yhteistä hypertekstiprojektia, joka myöhemmin tuli tunnetuksi nimellä World Wide Web.

"Verkon" luoja Tim Bernes-Lee, joka työskentelee Genevessä (Sveitsissä) Euroopan ydintutkimuskeskuksen "CERNin" alkuainehiukkasfysiikan laboratoriossa yhdessä kumppani Robert Caillotin kanssa, työskenteli hyperteksti-ideoiden soveltamisen ongelmissa. rakentaa tietoympäristö, joka yksinkertaistaisi fyysikkojen välistä tiedonvaihtoa.

Tämän työn tuloksena syntyi asiakirja, jossa tutkittiin käsitteitä, jotka ovat perustavanlaatuisia "webille" sen nykyaikaisessa muodossa, ja ehdotettiin URI:itä, HTTP-protokollaa ja HTML-kieltä. Ilman näitä tekniikoita ei ole enää mahdollista kuvitella nykyaikaista Internetiä.

Berners-Lee loi maailman ensimmäisen verkkopalvelimen ja maailman ensimmäisen hypertekstiverkkoselaimen. Maailman ensimmäisellä verkkosivustolla hän kuvaili, mitä World Wide Web on ja kuinka verkkopalvelin asennetaan, kuinka selainta käytetään jne. Tämä sivusto oli myös maailman ensimmäinen Internet-luettelo.

Vuodesta 1994 lähtien World Wide Webin kehittämisen tärkeimmät tehtävät on ottanut World Wide Web Consortium ( World Wide Web Consortium, WZS), jonka järjesti ja johti edelleen Kim Bernes-Lee. Konsortio kehittää ja toteuttaa teknologiastandardeja Internetiä ja World Wide Webiä varten. WZS:n tehtävä: "Vapauta World Wide Webin koko potentiaali luomalla protokollia ja periaatteita, jotka takaavat verkon pitkän aikavälin kehityksen." WZS kehittää "suosituksia" saavuttaakseen yhteensopivuuden ohjelmistotuotteiden ja eri yritysten laitteiden välillä, mikä tekee World Wide Webistä edistyneemmän, yleisemmän ja kätevämmän.

Hakukoneet: koostumus, toiminnot, toimintaperiaatteet.

Hakujärjestelmä on ohjelmisto- ja laitteistokompleksi, joka on suunniteltu etsimään Internetistä ja vastaamaan käyttäjän pyyntöön, joka on määritelty tekstilausekkeen muodossa (hakukysely) tuottamalla luettelon linkeistä tietolähteisiin merkityksen mukaisessa järjestyksessä. pyyntö). Suurimmat kansainväliset hakukoneet: "Google", "Yahoo", "MSN". Venäjän Internetissä se on - "Yandex", "Rambler", "Aportti".

Kuvataanpa hakukoneiden tärkeimmät ominaisuudet :

    Täydellisyys

Täydellisyys on yksi hakujärjestelmän pääominaisuuksista, joka ilmaisee pyynnön perusteella löydettyjen asiakirjojen määrän suhdetta Internetissä olevien asiakirjojen kokonaismäärään, jotka täyttävät tietyn pyynnön. Esimerkiksi, jos Internetissä on 100 sivua, jotka sisältävät lauseen "miten valita auto", ja niistä löytyi vain 60 vastaavaa kyselyä varten, haun täydellisyys on 0,6. On selvää, että mitä täydellisempi haku on, sitä epätodennäköisempää on, että käyttäjä ei löydä tarvitsemaansa asiakirjaa, jos se on olemassa Internetissä.

    Tarkkuus

Tarkkuus on toinen hakukoneen pääominaisuus, joka määräytyy sen mukaan, missä määrin löydetyt asiakirjat vastaavat käyttäjän kyselyä. Esimerkiksi jos kysely "miten valita auto" sisältää 100 asiakirjaa, 50 niistä sisältää lauseen "miten valita auto" ja loput yksinkertaisesti nämä sanat ("miten valitaan oikea radio ja asennetaan se auto”), niin hakutarkkuuden katsotaan olevan 50/100 (=0,5). Mitä tarkempi haku, sitä nopeammin käyttäjä löytää tarvitsemansa asiakirjat, mitä vähemmän erilaista "roskaa" niiden joukosta löytyy, sitä harvemmin löydetyt asiakirjat eivät vastaa pyyntöä.

    Merkityksellisyys

Relevanssi on yhtä tärkeä osa hakua, jolle on ominaista aika, joka kuluu siitä hetkestä, kun asiakirjat julkaistaan ​​Internetissä, kunnes ne saapuvat hakukoneen hakemistotietokantaan. Esimerkiksi seuraavana päivänä mielenkiintoisten uutisten ilmestymisen jälkeen suuri joukko käyttäjiä kääntyi hakukoneiden puoleen asianmukaisilla kyselyillä. Objektiivisesti tätä aihetta koskevien uutistietojen julkaisemisesta on kulunut alle päivä, mutta tärkeimmät asiakirjat on jo indeksoitu ja haettavissa suurten hakukoneiden ns. nopean tietokannan ansiosta. päivitetään useita kertoja päivässä.

    Hakunopeus

Hakunopeus liittyy läheisesti sen kuormituskestävyyteen. Esimerkiksi Rambler Internet Holding LLC:n mukaan Rambler-hakukone vastaanottaa nykyään työaikana noin 60 pyyntöä sekunnissa. Tällainen työmäärä edellyttää yksittäisen pyynnön käsittelyajan lyhentämistä. Tässä käyttäjän ja hakukoneen edut kohtaavat: vierailija haluaa saada tuloksia mahdollisimman nopeasti, ja hakukoneen on käsiteltävä pyyntö mahdollisimman nopeasti, jotta se ei hidasta myöhempien kyselyiden laskemista.

    Näkyvyys

Tulosten visuaalinen esitys on tärkeä osa kätevää hakua. Useimmissa kyselyissä hakukone löytää satoja tai jopa tuhansia asiakirjoja. Epäselvien kyselyiden tai epätarkkojen hakujen vuoksi hakutulosten ensimmäisillä sivuilla ei aina ole vain tarpeellista tietoa. Tämä tarkoittaa, että käyttäjän on usein tehtävä oma haku löydettyjen listan sisällä. Hakukoneen tulossivun eri elementit auttavat sinua navigoimaan hakutuloksissa. Yksityiskohtaiset selitykset hakutulossivusta, esimerkiksi Yandexille, löytyvät linkistä http://help.yandex.ru/search/?id=481937.

Lyhyt historia hakukoneiden kehityksestä

Internetin kehityksen alkuvaiheessa sen käyttäjien määrä oli pieni ja saatavilla olevan tiedon määrä suhteellisen pieni. Suurimmaksi osaksi vain tutkimushenkilöstöllä oli pääsy Internetiin. Tällä hetkellä tiedonhaku Internetistä ei ollut niin kiireellinen kuin nyt.

Yksi ensimmäisistä tavoista organisoida pääsy verkon tietoresursseihin oli avoimien sivustohakemistojen luominen, joissa linkit resursseihin oli ryhmitelty aiheen mukaan. Ensimmäinen tällainen projekti oli Yahoo.com-verkkosivusto, joka avattiin keväällä 1994. Yahoo-hakemiston sivustojen määrän lisääntymisen jälkeen lisättiin mahdollisuus etsiä tarvittavia tietoja hakemistosta. Täydellisessä mielessä se ei ollut vielä hakukone, koska hakualue rajoittui vain luettelossa oleviin resursseihin, ei kaikkiin Internet-resursseihin.

Linkkihakemistoja käytettiin laajalti aiemmin, mutta ne ovat nykyään lähes kokonaan menettäneet suosionsa. Koska jopa nykyaikaiset, valtavan volyymin luettelot sisältävät tietoa vain vähäisestä osasta Internetiä. DMOZ-verkon suurin hakemisto (kutsutaan myös Open Directory Projectiksi) sisältää tietoja noin 5 miljoonasta resurssista, kun taas Googlen hakukoneen tietokanta koostuu yli 8 miljardista asiakirjasta.

Ensimmäinen täysimittainen hakukone oli WebCrawler-projekti, joka julkaistiin vuonna 1994.

Vuonna 1995 ilmestyivät hakukoneet Lycos ja AltaVista. Jälkimmäinen on ollut Internetin tiedonhaun johtaja useiden vuosien ajan.

Vuonna 1997 Sergey Brin ja Larry Page loivat Google-hakukoneen osana tutkimusprojektia Stanfordin yliopistossa. Google on tällä hetkellä maailman suosituin hakukone!

Syyskuussa 1997 julkistettiin virallisesti Yandex-hakukone, joka on suosituin venäjänkielisessä Internetissä.

Tällä hetkellä on kolme kansainvälistä päähakukonetta - Google, Yahoo ja MSN, joilla on omat tietokannat ja hakualgoritmit. Useimmat muut hakukoneet (joita on paljon) käyttävät tavalla tai toisella kolmen luettelon tuloksia. Esimerkiksi AOL-haku (search.aol.com) käyttää Googlen tietokantaa, kun taas AltaVista, Lycos ja AllTheWeb käyttävät Yahoo-tietokantaa.

Hakujärjestelmän kokoonpano ja toimintaperiaatteet

Venäjällä päähakukone on Yandex, jota seuraavat Rambler.ru, Google.ru, Aport.ru, Mail.ru. Lisäksi tällä hetkellä Mail.ru käyttää Yandex-hakukonetta ja tietokantaa.

Lähes kaikilla suurimmilla hakukoneilla on oma rakenne, joka eroaa muista. On kuitenkin mahdollista tunnistaa kaikille hakukoneille yhteiset pääkomponentit. Rakenteelliset erot voivat olla vain näiden komponenttien vuorovaikutusmekanismien toteuttamisen muodossa.

Indeksointimoduuli

Indeksointimoduuli koostuu kolmesta apuohjelmasta (robotista):

Hämähäkki – Web-sivujen lataamiseen suunniteltu ohjelma. Hämähäkki lataa sivun ja hakee kaikki sisäiset linkit siltä sivulta. Jokaisen sivun html-koodi ladataan. Robotit käyttävät HTTP-protokollia sivujen lataamiseen. Hämähäkki toimii seuraavasti. Robotti lähettää palvelimelle pyynnön “get/path/document” ja joitain muita HTTP-pyyntökomentoja. Vastauksena robotti vastaanottaa tekstivirran, joka sisältää palvelutiedot ja itse asiakirjan.

    Sivun URL-osoite

    päivämäärä, jolloin sivu on ladattu

    Palvelimen vastauksen http-otsikko

    sivun teksti (html-koodi)

Indeksoija ("matkustava" hämähäkki) – ohjelma, joka seuraa automaattisesti kaikkia sivulta löytyviä linkkejä. Valitsee kaikki sivulla olevat linkit. Sen tehtävänä on määrittää, minne hämähäkin pitäisi mennä seuraavaksi linkkien tai ennalta määrätyn osoiteluettelon perusteella. Indeksoija etsii löydettyjä linkkejä seuraamalla uusia asiakirjoja, jotka ovat hakukoneelle vielä tuntemattomia.

Indeksoija (robotti-indeksoija) - ohjelma, joka analysoi hämähäkkien lataamia verkkosivuja. Indeksoija jäsentää sivun osiin ja analysoi ne omilla leksikaalisilla ja morfologisilla algoritmillaan. Analysoidaan erilaisia ​​sivuelementtejä, kuten tekstiä, otsikoita, linkkejä, rakenne- ja tyyliominaisuuksia, erikoispalvelun HTML-tageja jne.

Näin ollen indeksointimoduulin avulla voit indeksoida tiettyjä resursseja linkkien avulla, ladata havaittuja sivuja, poimia linkkejä uusille sivuille vastaanotetuista asiakirjoista ja suorittaa näiden asiakirjojen täydellisen analyysin.

Tietokanta

Tietokanta eli hakukoneindeksi on tiedontallennusjärjestelmä, tietotaulukko, johon on tallennettu erityisesti muunnetut parametrit kaikista indeksointimoduulin lataamista ja käsittelemistä asiakirjoista.

Hakupalvelin

Hakupalvelin on koko järjestelmän tärkein elementti, sillä haun laatu ja nopeus riippuvat suoraan sen toiminnan taustalla olevista algoritmeista.

Hakupalvelin toimii seuraavasti:

    Käyttäjältä saadulle pyynnölle tehdään morfologinen analyysi. Jokaiselle tietokantaan sisältyvälle asiakirjalle luodaan tietoympäristö (joka näytetään myöhemmin katkelmana eli hakutulossivulla pyyntöä vastaavana tekstitiedona).

    Vastaanotetut tiedot välitetään syöttöparametreina erityiseen ranking-moduuliin. Kaikkien asiakirjojen tietoja käsitellään, minkä seurauksena jokaisella asiakirjalla on oma luokitus, joka kuvaa käyttäjän kirjoittaman kyselyn ja tämän asiakirjan hakukonehakemistoon tallennettujen eri komponenttien relevanssia.

    Käyttäjän valinnasta riippuen tätä luokitusta voidaan säätää lisäehdoilla (esimerkiksi ns. "tarkennettu haku").

    Seuraavaksi luodaan katkelma, eli jokaisesta löydetystä dokumentista poimitaan asiakirjataulukosta otsikko, kyselyä parhaiten vastaava lyhyt tiivistelmä ja linkki itse asiakirjaan, ja löydetyt sanat korostetaan.

    Tuloksena olevat hakutulokset välitetään käyttäjälle SERP-muodossa (Search Engine Result Page) – hakutulossivu.

Kuten näet, kaikki nämä komponentit liittyvät läheisesti toisiinsa ja toimivat vuorovaikutuksessa muodostaen selkeän, melko monimutkaisen mekanismin hakujärjestelmän toimintaan, mikä vaatii valtavia resursseja.

Mikään hakukone ei kata kaikkia Internet-resursseja.

Jokainen hakukone kerää tietoa Internet-resursseista omilla ainutlaatuisilla menetelmillään ja muodostaa oman säännöllisesti päivitettävän tietokantansa. Pääsy tähän tietokantaan myönnetään käyttäjälle.

Hakukoneet toteuttavat kaksi tapaa etsiä resurssia:

    Hae aiheen mukaan luettelot - tiedot on esitetty hierarkkisen rakenteen muodossa. Ylimmällä tasolla on yleisluokat ("Internet", "Business", "Taide", "Koulutus" jne.), seuraavalla tasolla luokat on jaettu osioihin jne. Alin taso on linkit tietyille verkkosivuille tai muihin tietolähteisiin.

    Avainsanahaku (indeksihaku tai yksityiskohtainen haku) - käyttäjä lähettää hakukoneeseen pyyntö, joka koostuu avainsanoista. Järjestelmä palaa käyttäjälle luettelon pyynnöstä löydetyistä resursseista.

Useimmat hakukoneet yhdistävät molemmat hakutavat.

Hakukoneet voivat olla paikallisia, globaaleja, alueellisia ja erikoistuneita.

Internetin venäläisessä osassa (Runet) suosituimmat yleiskäyttöiset hakukoneet ovat Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www. google.ru).

Useimmat hakukoneettoteutetaan portaalien muodossa.

Portaali (englanniksi.portaali- pääsisäänkäynti, portti) on verkkosivusto, joka yhdistää erilaisia ​​Internet-palveluita: hakutyökalut, sähköposti, uutiset, sanakirjat jne.

Portaalit voivat olla erikoistuneita (esim.www. museo. ru) ja yleisiä (esim.www. km. ru).

Hae avainsanoilla

Hakuun käytettyä avainsanajoukkoa kutsutaan myös hakukriteeriksi tai hakuaiheeksi.

Pyyntö voi koostua joko yhdestä sanasta tai sanojen yhdistelmästä, joka on yhdistetty operaattoreilla - symboleilla, joiden avulla järjestelmä määrittää, mitä toimia sen tarvitsee suorittaa. Esimerkiksi: pyyntö "Moskova Pietari" sisältää AND-operaattorin (näin välilyönti havaitaan), mikä osoittaa, että tulee etsiä asiakirjoja, jotka sisältävät molemmat sanat - Moskova ja Pietari.

Jotta haku olisi merkityksellinen (englannin kielestä relevantti - relevant, relevant), tulee ottaa huomioon useita yleisiä sääntöjä:

    Riippumatta siitä, missä muodossa sanaa kyselyssä käytetään, haku ottaa huomioon kaikki sen sanamuodot venäjän kielen sääntöjen mukaisesti. Esimerkiksi kysely "lippu" löytää myös sanat "lippu", "lippu" jne.

    Isoja kirjaimia tulee käyttää vain erisnimissä tarpeettomien viittausten välttämiseksi. Esimerkiksi "seppien" pyynnöstä löydetään asiakirjoja, joissa puhutaan sekä sepistä että Kuznetsovista.

    On suositeltavaa rajata hakua muutamalla avainsanalla.

    Jos vaadittu osoite ei ole kahdenkymmenen ensimmäisen löydetyn osoitteen joukossa, sinun tulee muuttaa pyyntöä.

Jokainen hakukone käyttää omaa hakukieltään. Voit tutustua siihen käyttämällä hakukoneen sisäänrakennettua apua

Suurilla sivustoilla voi olla sisäänrakennettuja tiedonhakujärjestelmiä verkkosivuillaan.

Kyselyt tällaisissa hakujärjestelmissä rakennetaan pääsääntöisesti samojen sääntöjen mukaan kuin globaaleissa hakukoneissa, mutta tämän ohjeen tunteminen ei ole tarpeetonta.

Tarkennettu Haku

Hakukoneet voivat tarjota käyttäjälle mekanismin monimutkaisen kyselyn luomiseen. Linkin perässä Tarkennettu Haku mahdollistaa hakuparametrien muokkaamisen, lisäparametrien määrittämisen ja sopivimman muodon valitsemisen hakutulosten näyttämiseen. Seuraavassa kuvataan parametrit, jotka voidaan määrittää tarkennetun haun aikana Yanex- ja Rambler-järjestelmissä.

Parametrin kuvaus

Nimi Yandexissa

Nimi sisäänRambler

Mistä etsiä avainsanoja (asiakirjan otsikko, leipäteksti jne.)

Sanakirjan suodatin

Hae tekstillä...

Mitä sanoja asiakirjassa pitäisi olla tai ei pitäisi olla ja kuinka tarkka vastaavuuden tulee olla

Sanakirjan suodatin

Hae hakusanoja... Sulje pois asiakirjat, jotka sisältävät seuraavat sanat...

Kuinka kaukana toisistaan ​​avainsanojen tulisi sijaita?

Sanakirjan suodatin

Hakusanojen välinen etäisyys...

Asiakirjan päivämäärän rajoitus

Dokumentin päivämäärä...

Rajoita haku yhteen tai useampaan sivustoon

Sivusto/yläosa

Hae asiakirjoja vain seuraavilta sivustoilta...

Haun rajoittaminen asiakirjan kielen mukaan

Asiakirjan kieli...

Etsi asiakirjoja, jotka sisältävät kuvan tietyllä nimellä tai allekirjoituksella

Kuva

Objekteja sisältävien sivujen etsiminen

Erikoisesineitä

Hakutulosten esittelylomake

Ongelman muoto

Hakutulosten näyttäminen

Jotkut hakukoneet (esimerkiksi Yandex) antavat sinun kirjoittaa kyselyitä luonnollisella kielellä. Kirjoitat mitä tarvitset (esimerkiksi junalippujen tilaaminen Moskovasta Pietariin). Järjestelmä analysoi pyynnön ja tuottaa tuloksen. Jos et ole tyytyväinen, vaihda kyselykieleen.