Maailmanlaajuinen verkko Internet World Wide Web. Mikä on World Wide Web ja kuka sen keksi? Katso, mitä "World Wide Web" on muissa sanakirjoissa

"World Wide Web" (WWW)

World Wide Web (WWW) on suosituin ja kiinnostavin Internet-palvelu, suosittu ja kätevä tapa käsitellä tietoa. Internetin yleisin nimi nykyään on www. yli puolet Internetin tietovirrasta tulee WWW:stä. WWW-palvelimien määrää ei voi tällä hetkellä arvioida tarkasti, mutta joidenkin arvioiden mukaan niitä on yli 30 miljoonaa. WWW:n kasvuvauhti on jopa korkeampi kuin itse Internetin.

WWW on maailmanlaajuinen tietovarasto, jossa tietoobjekteja yhdistää hypertekstin rakenne. Hyperteksti on ensisijaisesti ristiviittattujen asiakirjojen järjestelmä, tapa esittää tietoa dokumenttien välisten linkkien avulla. Koska WWW-järjestelmä mahdollistaa näiden asiakirjojen sisällyttämisen tekstin lisäksi myös grafiikkaa, ääntä ja videota, hypertekstidokumentista on tullut hypermediadokumentti.

Vähän WWW-historiaa. World Wide Web (WWW) on yksi World Wide Webin tärkeistä osista. Ja hänellä on oma tarinansa.

Tämä on mielenkiintoista. Euroopan hiukkasfysiikan laboratorio (CERN) sijaitsee Sveitsissä Vuonna 1980 mies nimeltä Tim Bernes-Lee, joka työskenteli tuolloin CERN:ssä, alkoi kehittää projektia maailmanlaajuista tietokoneverkkoa varten, joka tarjoaisi fyysikot ympäri maailmaa. erilaisia tietoja. Se kesti yhdeksän vuotta. Vuonna 1989, monien vuosien teknisten kokeilujen jälkeen, Mr. Tim ehdotti erityistä vaihtoehtoa, joka oli World Wide Webin tai lyhyesti WWW:n alku.

Ajan myötä monet ymmärsivät, että he voisivat käyttää tällaisia palveluita erilaiset ihmiset, ei vain fyysikot. WWW alkoi kasvaa nopeasti. Monet ihmiset auttoivat häntä tässä: jotkut kehittivät laitteistoa, toiset loivat ohjelmistoja, jotka kehittivät WWW:tä, ja toiset paransivat viestintälinjoja. Kaiken tämän ansiosta siitä tuli nykyinen - "World Wide Web".

Asiakkaan ja palvelimen toiminnan periaatteet. WWW toimii asiakas-palvelin-periaatteella, tai tarkemmin sanottuna asiakas-palvelimet: on monia palvelimia, jotka asiakkaan pyynnöstä palauttavat hänelle hypermedia-asiakirjan - dokumentin, joka koostuu osista, joissa on monipuolinen informaatioesitys (teksti, ääni). , grafiikka, kolmiulotteisia esineitä jne.), jossa jokainen elementti voi olla linkki toiseen asiakirjaan tai sen osaan. WWW-dokumenttien linkit on järjestetty siten, että jokainen Internetin tietoresurssi on yksilöllisesti osoitettu ja asiakirja, jota luet Tämä hetki, pystyy linkittämään sekä muihin asiakirjoihin samalla palvelimella että asiakirjoihin (ja Internet-resursseihin yleensä) muissa Internet-tietokoneissa. Lisäksi käyttäjä ei huomaa tätä ja työskentelee koko Internetin tietotilan kanssa yhtenä kokonaisuutena.

WWW-linkit osoittavat paitsi itse WWW-kohtaisiin asiakirjoihin, myös muihin Internetin palveluihin ja tietolähteisiin. Lisäksi useimmat WWW-asiakasohjelmat (selaimet, navigaattorit) eivät vain ymmärrä tällaisia linkkejä, vaan ovat myös asiakasohjelmia vastaaville palveluille: FTP, gopher, Usenet-verkkouutiset, Sähköposti jne. Siten WWW-ohjelmistotyökalut ovat yleiskäyttöisiä erilaisia palveluita Internet ja hän itse Tietojärjestelmä WWW:llä on integroiva rooli.

Listataan joitain WWW:ssä käytettyjä termejä.

Ensimmäinen termi - html - on joukko komentosarjoja, jotka sisältyvät html-dokumenttiin ja jotka määrittelevät toiminnot, jotka katsojan (selaimen) tulee suorittaa tätä asiakirjaa ladattaessa. Tämä tarkoittaa, että jokainen sivu on normaali tekstitiedosto, joka sisältää kaikille näkyvää tekstiä ja joitain ohjelman ohjeita, jotka ovat näkymättömiä ihmisille linkkien muodossa muille sivuille, kuviin, palvelimiin. Siten täytetään kyselylomakkeita ja rekisteröintikortteja ja tehdään sosiologisia tutkimuksia.

Toinen termi on URL (uniform Resource locator - universaali osoitin resurssia kohti). Näin niitä linkkejä Internetin tietolähteisiin kutsutaan.

Toinen termi on http (hypertext transfer protocol). Tämä on protokollan nimi, jolla asiakas ja WWW-palvelin ovat vuorovaikutuksessa.

WWW on suora pääsypalvelu, joka vaatii täyden Internet-yhteyden ja vaatii lisäksi usein nopeita viestintälinjoja, jos luettavat asiakirjat sisältävät paljon grafiikkaa tai muuta ei-tekstitietoa.

Internetin nopea kehitys, joka alkoi 90-luvun alussa, johtuu suurelta osin syntymisestä uusi teknologia www. Tämä tekniikka perustuu hypertekstitekniikkaan, joka on ulotettu kaikkiin Internetiin kytkettyihin tietokoneisiin.

Hypertekstiteknologiaa käytettäessä teksti on jäsennelty ja linkkisanat korostuvat siinä. Kun linkki aktivoidaan (esimerkiksi hiirtä käytettäessä), tapahtuu siirtymä linkissä määritettyyn tekstikatkelmaan tai toiseen asiakirjaan. Voisimme siis muuntaa tekstimme hyperteksiksi korostamalla sanat "hypertekstitekniikka" ensimmäisessä kappaleessa ja kirjaamalla, että kun tämä linkki aktivoituu, tapahtuu siirtyminen toisen kappaleen alkuun.

WWW-tekniikka mahdollistaa siirtymät paitsi sisällä alkuperäinen dokumentti, mutta myös kaikille asiakirjoille, jotka sijaitsevat osoitteessa Tämä tietokone ja mikä tärkeintä, mihin tahansa asiakirjaan missä tahansa Internetiin yhteydessä olevalla tietokoneella. WWW-tekniikalla toteutettuja asiakirjoja kutsutaan web-sivuiksi.

Asiakirjojen jäsentäminen ja web-sivujen luominen tapahtuu HTML:llä (Hyper Text Markup Language). Teksti Sanaeditori voit tallentaa asiakirjoja Web-sivun muodossa. Web-sivuja tarkastellaan erityisillä selaimen katseluohjelmilla. Tällä hetkellä yleisimmät selaimet ovat Internet Explorer, Netscape Navigator, Opera.

Jos tietokoneesi on yhteydessä Internetiin, voit ladata jonkin selaimista ja lähteä matkalle World Wide Webin läpi. Ensin sinun on ladattava Web-sivu yhdeltä Internet-palvelimelta, löydettävä sitten linkki ja aktivoitava se. Tämän seurauksena Web-sivu ladataan toisesta Internet-palvelimesta, joka saattaa sijaita toisessa osassa maailmaa. Voit puolestaan aktivoida linkin tällä verkkosivulla, seuraava Web-sivu latautuu jne.

Internet kasvaa erittäin kovaa vauhtia, ja tarvittavan tiedon löytäminen kymmenien miljoonien asiakirjojen joukosta on yhä vaikeampaa. Etsiäksesi tietoa, erityistä hakupalvelimia, jotka sisältävät tarkkaa ja jatkuvasti päivitettävää tietoa kymmenien miljoonien Web-sivujen sisällöstä.

Tietojenkäsittelytieteessä kiinnitetään paljon huomiota Tietokoneverkot. Niiden merkittävimmät edustajat ovat Internet ja World Wide Web. Internet on tietokoneiden tietoliikenneverkko. Se on perusta World Wide Webille (Network), joka on toisiinsa yhdistettyjen asiakirjojen järjestelmä, joka sijaitsee useissa Internetiin yhteydessä olevissa tietokoneissa. Jos haluat korostaa asiakirjojen virtuaalista luonnetta, niiden kokonaisuutta luonnehditaan mm hyperavaruus. On aivan ilmeistä, että Internet, World Wide Web ja hyperavaruus ovat erottamaton kolminaisuus. Heidän aiheensa eivät ole yksilöt, vaan verkkoviestintäyhteisö. Tämän seikan mukaisesti käsitteet tulevat etualalle viestintä, ryhmäkeskustelu Ja ihmisten sosiaalinen yhteisö. Filosofit harkitsivat kaikkia näitä käsitteitä kauan ennen niiden ilmestymistä 1980-luvulla. Maailman laajuinen verkko. Heidän analyysinsa tulokset voivat valaista Internetin ja verkon luonnetta1. Esitellään ne edullisimmassa muodossa.

Viestinnän käsite on seurausta monimutkaisesta prosessista, jossa ymmärretään ihmisten välisen vuorovaikutuksen luonne. Mutta ei riitä, että sanotaan, että ihmiset ovat vuorovaikutuksessa toistensa kanssa: on tärkeää ymmärtää tällaisen vuorovaikutuksen käsitteellinen sisältö. Toimiessaan sosiaalisina olentoina ihmiset pyrkivät optimoimaan arvonsa. Viestintä on arvojen vaihtoa, jonka tuloksena päästään yhteisymmärrykseen (yhteisymmärrys) tai erimielisyyttä (dissensus). Hermeneutiikka (H.-G. Gadamer, J. Habermas) antaa yhteisymmärrykselle suuremman eettisen painoarvon kuin erimielisyydelle. Poststrukturalistit (J. Derrida, J.-F. Lyotard) noudattavat täysin päinvastaista näkemystä. Heille erimielisyys on eettisesti tärkeämpää kuin yksimielisyys. Molemmat kiistelevät osapuolet eivät voi kuvitella sosiaalista todellisuutta ilman diskurssia - arvosisällön tuomioiden vaihtoa. Diskurssi osoittaa aina jonkin ihmisyhteisön läsnäolon: diskurssin osallistujat eivät määritelmän mukaan ole atomeja, jotka vaativat yksilön yksityisyyttä.

Tulevaisuudessa meidän on siis jatkuvasti pidettävä mielessä käsitteiden erottamaton kolminaisuus: kommunikaatio, keskustelu, ihmisten yhteisö. Lisäksi ne kaikki esiintyvät eri muodoissa riippuen kyseessä olevan tiedon luonteesta. Mainittuja käsitteitä tarkastellaan useimmiten seuraavien asioiden yhteydessä: 1) tietojenkäsittelytiede; 2) johtaminen; 3) taloustiede; 4) valtiotiede; 5) sosiologia; 6) psykologia; 7) tavallinen tieto.

Tutkijat eivät aina tee eroa tiedon tasojen välillä. Tässä tapauksessa yleismaailmallisia arvoja tavoittelevat pinnalliset päättelyt, kuten "Verkko on hyvä", "Internet on paha", johdattavat heidät harhaan. Tällainen päättely on sisällöllistä vain ensi silmäyksellä. Tarkemmin tarkasteltuna käy ilmi, että ne tarvitsevat täsmentämistä, ja tämä on mahdotonta turvautumatta tieteiden käsitteelliseen rikkauteen. Kun otetaan huomioon tämä seikka, tarkastellaan Internetiä ja verkkoa kontekstissa erilaisia tieteitä, sekä ei-tieteellistä tietoa.

Verkko tietojenkäsittelytieteen näkökulmasta

Tietenkin meitä kiinnostavat ilmiöt ovat imeneet kaiken tietojenkäsittelytieteen rikkauden tieteenä. Mutta ratkaiseva Verkon muodostumisessa ja kehittämisessä oli viisi "pilaria": hyperteksti, HTML, URL, HTTP ja hakukoneet.

Hyperteksti on asiakirja, joka sisältää viittauksia muihin teksteihin. Amerikkalainen T. Nelson loi termin ja otti sen tietotekniikkaan käyttöön vuonna 1969. Hypertekstin ensisijainen piirre on sen haarautuminen lineaarisen luonteen sijaan. Tieto toteutuu ristiviittausten muodossa. Tästä seuraa, että tekstit risteytyvät, ja tämä, kuten tiedetään, on dialogin välttämätön piirre1. Hypertekstin käsitteen kehittäneiden asiantuntijoiden merkittävä saavutus oli teknologisen kyvyn luominen toistaa keskustelu intertekstuaalisuuden muodossa. Sen erikoisuus on, että aloite siirtyy jatkuvasti henkilöltä toiselle. Hyperteksti tarjoaa tämän mahdollisuuden. 1900-luvun alussa. filosofit L. Wittgenstein ja M. Heidegger aloittivat kielellisen käänteen mottona "kieli on mentaliteettia tärkeämpää". Toteutusprosessissa huomattiin myös, että dialogi on monologia tärkeämpää. Leikkaavat tekstit ovat rakenteellisesti ja semanttisesti paljon rikkaampia kuin lineaarinen rakenne.

HTML(Englanti) Hypertext Markup Language) - vakiokieli asiakirjojen jäsentämiseen ja muotoiluun verkossa. Tekstiasiakirjat, jotka sisältävät HTML-koodia, käsitellään ja näytetään selaimissa muotoillussa muodossa.

URL-osoite(Englanti) Uniform Resource Locator) - Internetin resurssin yhtenäinen paikannus (sijaintitunniste). Kaikille resursseille annetaan nimet, joilla ne löytyvät Internetistä ja joihin ne vastaavat.

HTTP(Englanti) Hypertext Transfer Protocol) - hypertekstin siirtoprotokolla. Kuluttaja (asiakas) lähettää pyynnön palveluntarjoajalle (palvelimelle). Hän tuottaa Tarvittavat toimet ja palauttaa viestin tuloksella. Pyynnössä ja vastauksessa resurssi määritellään tietyn koodausmenetelmän mukaisesti.

HTML-, URL- ja HTTP-käsitteet kehitti World Wide Webin luoja, angloamerikkalainen tiedemies T. B. Lee vuosina 1990-1992. T. B. Leen nerokkuus ilmeni ensisijaisesti hänen syvässä ymmärryksessään Webin käsitteellisestä rakenteesta.

Hakujärjestelmä on ohjelmisto- ja laitteistokompleksi, joka tarjoaa mahdollisuuden etsiä asiakirjoja Internetistä. Hakukoneen ohjelmistoosa, joka tarjoaa sen toiminnallisuuden, on nimeltään hakukone. Hakukoneen laadun tärkein kriteeri on merkityksellisyys, nuo. löydetyn kyselyn vastaavuusaste. Lukuisten tutkimusten mukaan Google on tämän hetken suosituin hakukone. Universaalia hakukonetta ei tietenkään ole olemassa. Erilaiset hakustrategiat johtavat uuteen tietoon. On aina tärkeää muistaa, että mitään hakua ei tehdä sattumalta, vaan sen yhteydessä päätöksellä. Siten haku laukaisee mekanismin uuden tiedon syntetisoimiseksi, ja tämä on mahdotonta ilman viestintää verkon muiden aiheiden kanssa ja siten ilman yhden tai toisen virtuaalisen ihmisyhteisön muodostumista, esimerkiksi Yandex-hakukoneen kannattajia, joten suosittu Runetissa. Kuten näemme, viestinnän, keskustelun ja ihmisten yhteisön käsitteet saavat tietotekniikassa tietyn muodon.

Internetin ja verkoston käsitteellisiä perusteita käsiteltiin edellä. Tietenkin ne kaikki ovat käyneet läpi ja käyvät läpi lukuisia muodonmuutoksia. HTML:llä, URL-osoitteilla, HTTP:llä, hakukoneilla ja selaimilla on lukuisia kilpailijoita. Jos haluat ymmärtää niiden historiaa, on välttämätöntä rakentaa sopivat ongelmasarjat ja niiden tulkinnat. Meille oli tärkeää tunnistaa verkon tärkeimmät käsitteelliset solmut, jotka ovat itse tietojenkäsittelytieteen omaisuutta.

World Wide Webin rakenne ja periaatteet

World Wide Web Wikipedian ympärillä

World Wide Web koostuu miljoonista Internet-verkkopalvelimista, jotka sijaitsevat ympäri maailmaa. Web-palvelin on ohjelma, joka toimii verkkoon kytketyssä tietokoneessa ja käyttää HTTP-protokollaa tiedonsiirtoon. Yksinkertaisimmassa muodossaan tällainen ohjelma vastaanottaa tietyn resurssin HTTP-pyynnön verkon kautta, löytää vastaavan tiedoston paikalliselta kiintolevyltä ja lähettää sen verkon kautta pyynnön esittäneelle tietokoneelle. Monimutkaisemmat verkkopalvelimet pystyvät dynaamisesti allokoimaan resursseja vastauksena HTTP-pyyntöön. Resurssien (usein tiedostojen tai niiden osien) tunnistamiseen World Wide Webissä käytetään yhtenäisiä resurssitunnisteita (URI). Uniform Resource Identifier). Yhtenäisiä URL-resurssien paikantimia käytetään resurssien paikantamiseen verkosta. Uniform Resource Locator). Nämä URL-paikantimet yhdistävät URI-tunnistustekniikan ja DNS-verkkotunnusjärjestelmän. Domain Name System) - verkkotunnuksen nimi (tai suoraan osoite numeerisessa merkinnässä) on osa URL-osoitetta, joka osoittaa tietokoneen (tarkemmin sanottuna yksi sen verkkoliitännät), joka suorittaa halutun verkkopalvelimen koodin.

Voit tarkastella verkkopalvelimelta saatuja tietoja siirtymällä osoitteeseen asiakastietokone käytetään erityistä ohjelmaa - verkkoselainta. Web-selaimen päätehtävä on näyttää hypertekstiä. World Wide Web liittyy erottamattomasti hypertekstin ja hyperlinkkien käsitteisiin. Suurin osa Internetin tiedoista on hypertekstiä. HTML:ää käytetään perinteisesti hypertekstin luomisen, tallentamisen ja näyttämisen helpottamiseksi World Wide Webissä. Hypertekstin merkintäkieli), hypertekstin kuvauskieli. Hypertekstin merkitsemistyötä kutsutaan layoutiksi (ilman yhdysviivaa). HTML-merkinnän jälkeen tuloksena oleva hyperteksti sijoitetaan tiedostoon. Tällainen HTML-tiedosto on World Wide Webin pääresurssi. Kun HTML-tiedosto on asetettu verkkopalvelimen saataville, sitä kutsutaan "verkkosivuksi". Joukko verkkosivuja muodostaa verkkosivuston. Hyperlinkit lisätään verkkosivujen hypertekstiin. Hyperlinkit auttavat World Wide Web -käyttäjiä helposti navigoimaan resurssien (tiedostojen) välillä riippumatta siitä, sijaitsevatko resurssit paikallinen tietokone tai klo etäpalvelin. Web-hyperlinkit perustuvat URL-tekniikkaan.

World Wide Web Technologies

Webin visuaalisen havainnoinnin parantamiseksi CSS-tekniikkaa on käytetty laajalti, mikä mahdollistaa määrittelyn yhtenäisiä tyylejä suunnittelu monille verkkosivuille. Toinen huomion arvoinen innovaatio on URN-resurssien merkintäjärjestelmä. Yhtenäinen resurssin nimi).

Suosittu World Wide Webin kehittämiskonsepti on semanttisen verkon luominen. Semanttinen verkko on lisäosa olemassa olevaan World Wide Webiin, jonka tarkoituksena on tehdä verkkoon lähetetyistä tiedoista tietokoneille ymmärrettävämpiä. Semanttinen verkko on verkkokonsepti, jossa kaikki resurssit ovat päällä ihmisen kieli olisi varustettu kuvauksella, jonka tietokone voi ymmärtää. Semanttinen verkko avaa pääsyn selkeästi jäsenneltyihin tietoihin kaikille sovelluksille alustasta ja ohjelmointikielistä riippumatta. Ohjelmat voivat löytää itse tarvittavat resurssit, käsitellä tietoa, luokitella tietoja, tunnistaa loogisia yhteyksiä, tehdä johtopäätöksiä ja jopa tehdä päätöksiä näiden johtopäätösten perusteella. Jos semanttinen verkko otetaan laajalti käyttöön ja toteutetaan viisaasti, se voi aiheuttaa vallankumouksen Internetissä. Semanttinen verkko käyttää englanninkielistä RDF-muotoa luodakseen tietokoneella luettavan kuvauksen resurssista. Resurssin kuvauskehys ), joka perustuu XML-syntaksiin ja käyttötarkoituksiin URI:t osoittaa resursseja. Uutta tällä alueella on RDFS (Englanti) Venäjän kieli (Englanti) RDF-kaavio) ja SPARQL (eng. Protokolla ja RDF-kyselykieli ) (lausutaan "sparkle") uutta kieltä kyselyt nopeaa pääsyä varten RDF-tietoihin.

World Wide Webin historia

Tim Berners-Leeä ja vähemmässä määrin Robert Cayoa pidetään World Wide Webin keksijöinä. Tim Berners-Lee on HTTP-, URI/URL- ja HTML-tekniikoiden alullepanija. Vuonna 1980 hän työskenteli Euroopan ydintutkimusneuvostossa (ranskalainen). Conseil Européen pour la Recherche Nucléaire, CERN ) ohjelmistokonsultti. Siellä, Genevessä (Sveitsi), hän kirjoitti Inquire-ohjelman omiin tarpeisiinsa. Tiedustella, voidaan kääntää löyhästi "Interrogatoriksi"), joka käytti satunnaisia assosiaatioita tietojen tallentamiseen ja loi käsitteellisen perustan World Wide Webille.

Berners-Lee isännöi maailman ensimmäistä verkkosivustoa 6. elokuuta 1991 ensimmäisellä verkkopalvelimella, joka oli saatavilla osoitteessa http://info.cern.ch/, (). Resurssi määritteli käsitteen Maailman laajuinen verkko, sisälsi ohjeet verkkopalvelimen asettamiseen, selaimen käyttöön jne. Tämä sivusto oli myös maailman ensimmäinen Internet-hakemisto, koska Tim Berners-Lee julkaisi myöhemmin ja ylläpiti siellä listaa linkkejä muille sivustoille.

Ensimmäinen valokuva World Wide Webissä oli parodiafilk-yhtye Les Horribles Cernettes. Tim Bernes-Lee pyysi ryhmän johtajalta skannauksia niistä CERNin Hardronic Festivalin jälkeen.

Mutta silti teoreettinen perusta Verkko perustettiin paljon aikaisemmin kuin Berners-Lee. Vuonna 1945 Vannaver Busch kehitti Memex-konseptin. (Englanti) Venäjän kieli - apu mekaanisia keinoja"ihmisen muistin laajentaminen". Memex on laite, johon henkilö tallentaa kaikki kirjansa ja tietueensa (ja mieluiten kaiken tietonsa, joka voi olla muodollinen kuvaus) ja joka tarjoaa tarvittavat tiedot riittävän nopeasti ja joustavasti. Se on laajennus ja lisäys ihmisen muistiin. Bush ennusti myös kattavaa teksti- ja multimediaresurssien indeksointia mahdollisuudella löytää nopeasti tarvittavat tiedot. Seuraava merkittävä askel kohti World Wide Webiä oli hypertekstin luominen (Ted Nelsonin vuonna 1965 keksimä termi).

Semanttiseen verkkoon kuuluu World Wide Webin tiedon johdonmukaisuuden ja merkityksen parantaminen ottamalla käyttöön uusia metatietomuotoja.
Sosiaalinen verkko nojaa Webissä saatavilla olevan tiedon organisointityöhön, jonka web-käyttäjät itse tekevät. Toisen suunnan puitteissa kehitys, joka on osa semanttinen verkko, käytetään aktiivisesti työkaluina (RSS ja muut verkkosyötemuodot, OPML, XHTML-mikromuodot). Wikipedian luokkapuun osittain semanttisoidut osat auttavat käyttäjiä tietoisessa navigoinnissa tietotilaa Erittäin kevyet alakategorioiden vaatimukset eivät kuitenkaan anna aihetta toivoa tällaisten alueiden laajentumista. Tässä suhteessa yritykset laatia tietokartastoja voivat olla kiinnostavia.

On myös suosittu Web 2.0 -konsepti, joka tiivistää useita World Wide Webin kehityssuuntia.

Menetelmät tiedon aktiiviseen näyttämiseen World Wide Webissä

Tietoa verkossa voidaan näyttää joko passiivisesti (eli käyttäjä voi vain lukea) tai aktiivisesti - sitten käyttäjä voi lisätä tietoja ja muokata niitä. Menetelmiä tietojen aktiiviseen näyttämiseen World Wide Webissä ovat:

On huomattava, että tämä jako on hyvin mielivaltainen. Joten sanotaanpa blogi tai vieraskirja voidaan pitää foorumin erikoistapauksena, joka puolestaan on sisällönhallintajärjestelmän erikoistapaus. Yleensä ero ilmenee tietyn tuotteen tarkoituksessa, lähestymistavasta ja sijoittelussa.

Joihinkin verkkosivustojen tietoihin pääsee myös puheella. Intia on jo alkanut testata järjestelmää, joka tekee sivujen tekstisisällön luettavissa ja lukemattomillekin luettavissa.

World Wide Webiä kutsutaan joskus ironisesti Wild Wild Webiksi, viitaten elokuvan Wild Wild West nimeen.

Katso myös

Huomautuksia

Kirjallisuus

Fielding, R.; Gettys, J.; Mogul, J.; Fristik, G.; Mazinter, L.; Leach, P.; Berners-Lee, T. (kesäkuu 1999). "Hypertext Transfer Protocol - http://1.1" (Information Sciences Institute).
Berners-Lee, Tim; Bray, Tim; Connolly, Dan; Cotton, Paul; Fielding, Roy; Jeckle, Mario; Lilly, Chris; Mendelsohn, Nooa; Orcard, David; Walsh, Norman; Williams, Stuart (15. joulukuuta 2004). "World Wide Webin arkkitehtuuri, ensimmäinen osa" (W3C).
Polo, Luciano World Wide Web Technology Architecture: käsitteellinen analyysi. Uudet laitteet(2003). Arkistoitu alkuperäisestä 24. elokuuta 2011. Haettu 31. heinäkuuta 2005.

Linkit

World Wide Web Consortiumin (W3C) virallinen verkkosivusto (englanniksi)
Tim Berners-Lee, Mark Fischetti. Webin kudonta: World Wide Webin alkuperä ja tulevaisuus = Weaving verkko: World Wide Webin alkuperäinen suunnittelu ja lopullinen kohtalo. - New York: HarperCollins Publishers (Englanti) Venäjän kieli . - 256 s. - ISBN 0-06-251587-X, ISBN 978-0-06-251587-2(Englanti)

Muut organisaatiot, jotka osallistuvat World Wide Webin ja Internetin kehittämiseen yleensä

Web ja verkkosivustot
Globaalisti
Paikallisesti
Sivujen tyypit ja palvelut
Luominen ja palvelua
Asettelutyypit, sivuja, sivustoja
Tekninen
Markkinointi
Yhteiskunta ja kulttuuri

Semanttinen verkko
Perusasiat	World Wide Web · Internet · Hyperteksti · Tietokanta · Semanttiset verkot · Ontologiat · Kuvauslogiikka
alajaksot	Linkitetyt tiedot · Data Web · Hyperdata · URI:t, joista ei voi tehdä viittauksia · Sääntöperusteet · Data Spaces
Sovellukset	Semanttinen wiki · Semanttinen julkaisu · Semanttinen haku · Semanttinen laskenta · Semanttinen mainonta · Semanttinen päättelijä · Semanttinen vastaavuus · Semanttinen kartoittaja · Semanttinen välittäjä · Semanttinen analytiikka · Semanttinen palvelukeskeinen arkkitehtuuri
Liittyvät aiheet	Folksonomia · Kirjasto 2.0 · Web 2.0 -linkit · Tietoarkkitehtuuri · Tietämyksen hallinta · Kollektiivinen älykkyys · Temaattiset kartat · Mindmapping · Metatiedot · Geotagging · Verkkotiede
Standardit	Syntaksi: RDF (RDF/XML · Merkintä 3 · Kilpikonna · N-Triples) · SPARQL · URI · HTTP · XML Kaaviot, ontologiat:RDFS · PÖLLÖ · Sääntöjen vaihtomuoto · Semantic Web Rule Language · Yhteinen logiikka ·

Internetistä puhuttaessa he tarkoittavat usein World Wide Webiä. On kuitenkin tärkeää ymmärtää, että nämä eivät ole sama asia.

Rakenne ja periaatteet

World Wide Web koostuu miljoonista Internet-verkkopalvelimista, jotka sijaitsevat ympäri maailmaa. Web-palvelin on tietokoneohjelma, joka toimii verkkoon kytketyssä tietokoneessa ja käyttää HTTP-protokollaa tiedonsiirtoon. Yksinkertaisimmassa muodossaan tällainen ohjelma vastaanottaa tietyn resurssin HTTP-pyynnön verkon kautta, löytää vastaavan tiedoston paikalliselta kiintolevyltä ja lähettää sen verkon kautta pyytävälle tietokoneelle. Monimutkaisemmat verkkopalvelimet pystyvät luomaan dynaamisesti asiakirjoja vastauksena HTTP-pyyntöön käyttämällä malleja ja komentosarjoja.

Verkkopalvelimelta vastaanotettujen tietojen tarkastelemiseksi käytetään erityistä ohjelmaa asiakastietokoneessa - verkkoselaimessa. Web-selaimen päätehtävä on näyttää hypertekstiä. World Wide Web liittyy erottamattomasti hypertekstin ja hyperlinkkien käsitteisiin. Suurin osa Internetin tiedoista on hypertekstiä.

HTML:ää (HyperText Markup Language) käytetään perinteisesti hypertekstin luomiseen, tallentamiseen ja näyttämiseen World Wide Webissä. Hypertekstiasiakirjojen luomista (merkintää) kutsutaan taittotyöksi, sen tekee webmaster tai erillinen merkintäasiantuntija - taittosuunnittelija. HTML-merkinnän jälkeen tuloksena oleva asiakirja tallennetaan tiedostoon, ja tällaiset HTML-tiedostot ovat pääasiallinen resurssityyppi World Wide Webissä. Kun HTML-tiedosto on asetettu verkkopalvelimen saataville, sitä kutsutaan "verkkosivuksi". Joukko verkkosivuja muodostaa verkkosivuston.

Web-sivujen hyperteksti sisältää hyperlinkkejä. Hyperlinkit auttavat World Wide Web -käyttäjiä helposti navigoimaan resurssien (tiedostojen) välillä riippumatta siitä, sijaitsevatko resurssit paikallisessa tietokoneessa vai etäpalvelimessa. Resurssien sijainnin määrittämiseen World Wide Webissä käytetään yhtenäisiä resurssien paikantimia URL (englanniksi Uniform Resource Locator). Esimerkiksi Wikipedian venäjänkielisen osan pääsivun koko URL-osoite näyttää tältä: http://ru.wikipedia.org/wiki/Main_page. Tällaiset URL-paikantimet yhdistävät URI-tunnistustekniikan (English Uniform Resource Identifier) ja DNS-verkkotunnusjärjestelmän (English Domain Name System). Verkkotunnuksen nimi (in tässä tapauksessa ru.wikipedia.org) URL-osoitteessa tarkoittaa tietokonetta (tarkemmin sanottuna yhtä sen verkkoliitännöistä), joka suorittaa halutun verkkopalvelimen koodin. Nykyisen sivun URL-osoite näkyy yleensä selaimen osoitepalkissa, vaikka monet nykyaikaiset selaimet he haluavat oletusarvoisesti näyttää vain nykyisen sivuston verkkotunnuksen.

Teknologiat

Webin visuaalisen havainnoinnin parantamiseksi CSS-tekniikkaa on käytetty laajalti, jonka avulla voit asettaa yhtenäisiä suunnittelutyylejä monille verkkosivuille. Toinen huomion arvoinen innovaatio on resurssien nimeämisjärjestelmä URN (Uniform Resource Name).

Suosittu World Wide Webin kehittämiskonsepti on semanttisen verkon luominen. Semanttinen verkko on lisäosa olemassa olevaan World Wide Webiin, jonka tarkoituksena on tehdä verkkoon lähetetyistä tiedoista tietokoneille ymmärrettävämpiä. Semanttinen verkko on käsite verkosta, jossa jokaiselle ihmiskieliselle resurssille annettaisiin kuvaus, jonka tietokone ymmärtää. Semanttinen verkko avaa pääsyn selkeästi jäsenneltyihin tietoihin kaikille sovelluksille alustasta ja ohjelmointikielistä riippumatta. Ohjelmat voivat löytää itse tarvittavat resurssit, käsitellä tietoa, luokitella tietoja, tunnistaa loogisia yhteyksiä, tehdä johtopäätöksiä ja jopa tehdä päätöksiä näiden johtopäätösten perusteella. Jos semanttinen verkko otetaan laajalti käyttöön ja toteutetaan viisaasti, se voi aiheuttaa vallankumouksen Internetissä. Semanttinen verkko käyttää englanninkielistä RDF-muotoa luodakseen tietokoneella luettavan kuvauksen resurssista. Resurssin kuvauskehys), joka perustuu XML-syntaksiin ja käyttää URI-tunnisteita resurssien tunnistamiseen. Uusia tuotteita tällä alueella ovat RDFS (eng. RDF Schema) ja SPARQL (eng. Protokolla ja RDF-kyselykieli) (lausutaan "sparkle"), uusi kyselykieli RDF-tietojen nopeaan käyttöön.

Tarina

Pääartikkeli: World Wide Webin historia

Tim Berners-Lee ja vähemmässä määrin Robert Caillot pidetään World Wide Webin keksijöinä. Tim Berners-Lee on HTTP-, URI/URL- ja HTML-tekniikoiden alullepanija. Vuonna 1980 hän työskenteli Euroopan ydintutkimusneuvostossa (ranskalainen). conseil européen pour la recherche nucléaire, CERN) ohjelmistokonsultti. Siellä Genevessä (Sveitsi) hän kirjoitti omiin tarpeisiinsa Inquire-ohjelman, joka käytti satunnaisia assosiaatioita tietojen tallentamiseen ja loi käsitteellisen perustan World Wide Webille.

Osana projektia Berners-Lee kirjoitti maailman ensimmäisen web-palvelimen nimeltä "httpd" ja maailman ensimmäisen hyperteksti-web-selaimen nimeltä "WorldWideWeb". Tämä selain oli myös WYSIWYG-editori (lyhenne sanoista what you see is what you get - what you see is what you get), sen kehitys alkoi lokakuussa 1990 ja valmistui saman vuoden joulukuussa. Ohjelma ajettiin NeXTStep-ympäristössä ja alkoi levitä Internetiin kesällä 1991.

Mike Sendall ostaa tällä hetkellä NeXT-kuutiotietokoneen ymmärtääkseen sen arkkitehtuurin ominaisuudet ja antaa sen sitten Timille [Berners-Leelle]. Täydellisyyden ansiosta ohjelmistojärjestelmä"SeXT-kuutio" Tim kirjoitti prototyypin, joka havainnollistaa projektin pääkonsepteja muutamassa kuukaudessa. Tämä oli vaikuttava tulos: prototyyppi tarjosi käyttäjille muun muassa sellaisia edistyneitä ominaisuuksia kuin WYSIWYG-selailu/kirjoitus!... Yhdessä projektin yhteiskeskusteluistunnossa CERN-kahvilassa Tim ja minä yritimme löytää "kiinni" nimi luotavalle järjestelmälle . Ainoa asia, jota vaadin, oli, ettei nimeä saisi jälleen kerran ottaa samasta kreikkalaisesta mytologiasta. Tim ehdotti "maailmanlaajuista verkkoa". Pidin heti todella kaikesta tästä nimestä, mutta sitä on vaikea lausua ranskaksi.

Berners-Lee isännöi maailman ensimmäistä verkkosivustoa 6. elokuuta 1991 ensimmäisellä verkkopalvelimella, joka on saatavilla osoitteessa http://info.cern.ch/, (). Resurssi määritteli käsitteen " Maailman laajuinen verkko", sisälsi ohjeet web-palvelimen asentamiseen, selaimen käyttöön jne. Tämä sivusto oli myös maailman ensimmäinen Internet-hakemisto, koska Tim Berners-Lee julkaisi ja ylläpiti siellä myöhemmin luetteloa linkkejä muille sivustoille.

Ensimmäinen World Wide Webiin ilmestynyt valokuva oli parodiafilk-yhtye Les Horribles Cernettes. Tim Berners-Lee pyysi bändin johtajalta skannattuja valokuvia CERNin hardronic-festivaalin jälkeen.

Silti verkon teoreettinen perusta luotiin paljon aikaisemmin kuin Berners-Lee. Vuonna 1945 Vannaver Bush kehitti Memex-konseptin - mekaaniset apuvälineet "ihmisen muistin laajentamiseen". Memex on laite, johon henkilö tallentaa kaikki kirjansa ja tietueensa (ja ihannetapauksessa kaiken muodollisesti kuvattavissa olevan tietonsa) ja joka toimittaa tarvittavat tiedot riittävän nopeasti ja joustavasti. Se on laajennus ja lisäys ihmisen muistiin. Bush ennusti myös kattavaa teksti- ja multimediaresurssien indeksointia mahdollisuudella löytää nopeasti tarvittavat tiedot. Seuraava merkittävä askel kohti World Wide Webiä oli hypertekstin luominen (Ted Nelsonin vuonna 1965 keksimä termi).

Vuodesta 1994 lähtien päätyön World Wide Webin kehittämiseksi on tehnyt World Wide Web Consortium (englanniksi: world wide web consortium, lyhenne W3C), jonka perusti ja jota edelleen johtaa Tim Berners-Lee. Tämä konsortio on organisaatio, joka kehittää ja toteuttaa teknologiastandardeja Internetiä ja World Wide Webiä varten. W3C:n tehtävä: "Vapauta World Wide Webin koko potentiaali luomalla protokollia ja periaatteita verkon pitkän aikavälin kehityksen varmistamiseksi." Kaksi muuta konsortion päätavoitetta on varmistaa "verkon täysi kansainvälistyminen" ja tehdä verkko vammaisten käytettävissä.

W3C kehittää Internetille yhtenäisiä periaatteita ja standardeja (kutsutaan nimellä "suositukset", englanninkieliset W3C-suositukset), jotka ohjelmisto- ja laitevalmistajat sitten toteuttavat. Tämä varmistaa yhteensopivuuden ohjelmistotuotteita ja eri yritysten laitteita, mikä tekee World Wide Webistä edistyneemmän, yleisemmän ja kätevämmän. Kaikki World Wide Web -konsortion suositukset ovat avoimia, eli niitä ei suojata patenteilla ja kuka tahansa voi toteuttaa ne ilman taloudellista tukea konsortiolle.

Kehitysnäkymät

Tällä hetkellä World Wide Webin kehityksessä on kaksi suuntaa: semanttinen verkko ja sosiaalinen verkko.

Semanttiseen verkkoon kuuluu World Wide Webin tiedon johdonmukaisuuden ja merkityksen parantaminen ottamalla käyttöön uusia metatietomuotoja.
Sosiaalinen verkko luottaa siihen, että käyttäjät järjestävät verkossa saatavilla olevan tiedon.

Toisessa suunnassa semanttiseen verkkoon kuuluvia kehityssuuntia käytetään aktiivisesti työkaluina (RSS ja muut formaatit, verkkokanavat, OPML, XHTML-mikroformaatit). Wikipedian luokkapuun osittain semanttisoidut osiot auttavat käyttäjiä tietoisesti navigoimaan tietotilassa, mutta alakategorioiden erittäin pehmeät vaatimukset eivät anna aihetta toivoa tällaisten osioiden laajentamista. Tässä suhteessa yritykset laatia tietokartastoja voivat olla kiinnostavia.

On myös suosittu Web 2.0 -konsepti, joka tiivistää useita World Wide Webin kehityssuuntia.

Tapoja näyttää tietoja aktiivisesti

Verkossa esitetyt tiedot voivat olla saatavilla:

vain luku ("passiivinen");
lukemista ja lisäämistä/muokkausta varten ("aktiivinen").

Menetelmiä tietojen aktiiviseen näyttämiseen World Wide Webissä ovat:

Tämä jako on hyvin mielivaltainen. Joten vaikkapa blogia tai vieraskirjaa voidaan pitää foorumin erikoistapauksena, joka puolestaan on sisällönhallintajärjestelmän erikoistapaus. Yleensä ero ilmenee tietyn tuotteen tarkoituksessa, lähestymistavasta ja sijoittelussa.

Joihinkin verkkosivustojen tietoihin pääsee myös puheella. Intia on jo alkanut testata järjestelmää, joka tekee sivujen tekstisisällön luettavissa ja lukemattomillekin luettavissa.

Turvallisuus

Leviäminen

Vuosina 2005–2010 verkon käyttäjien määrä kaksinkertaistui ja nousi kahteen miljardiin. Varhaisen vuonna 1999 tehdyn tutkimuksen mukaan hakukoneet eivät indeksoineet useimpia olemassa olevia verkkosivustoja oikein, ja itse verkko oli odotettua suurempi. Vuoteen 2001 mennessä oli jo luotu yli 550 miljoonaa verkkodokumenttia, joista suurin osa kuitenkin sijaitsi näkymättömän verkon sisällä. Vuoteen 2002 mennessä luotiin yli 2 miljardia web-sivua, 56,4 % kaikesta Internet-sisällöstä oli englanninkielistä. Seuraavaksi tulivat saksaksi (7,7 %), ranskaksi (5,6 %) ja japaniksi (4,9 %). Tammikuun 2005 lopussa tehdyn tutkimuksen mukaan yli 11,5 miljardia verkkosivua tunnistettiin 75 eri kielellä ja indeksoitiin avoimessa verkossa. Ja maaliskuun 2009 tietojen mukaan sivumäärä kasvoi 25,21 miljardiin. Googlen ohjelmistosuunnittelijat Jesse Alpert ja Nissan Hiai ilmoittivat 25. heinäkuuta 2008, että Googlen hakukone oli havainnut yli miljardi yksilöllistä URL-osoitetta.

Monumentti

Katso myös

Huomautuksia

"Web like" seuraava askel"(NextStep) henkilökohtaisen tietojenkäsittelyn vallankumous."
LHC: Ensimmäinen bändi verkossa
IBM kehitti puhe-Internetin
Ben-Itzhak, Yuval. Infosecurity 2008 – Uusi puolustusstrategia taistelussa sähköistä rikollisuutta vastaan, Computer Weekly, Reed Business Information (18. huhtikuuta 2008). Haettu 20. huhtikuuta 2008.
Christey, Steve ja Martin, Robert A. CVE:n haavoittuvuustyyppien jakelu (versio 1.1) (määrittämätön) . MITER Corporation (22. toukokuuta 2007). Haettu 7. kesäkuuta 2008. Arkistoitu 15. huhtikuuta 2013.
"Symantec Internet Security Threat Report: Trends for heinä-joulukuu 2007 (Executive Summary)" (PDF). XIII. Symantec Corp. Huhtikuu 2008: 1-2 . Haettu 11. toukokuuta 2008.
Google etsii verkon pimeää puolta, BBC News (11. toukokuuta 2007).
Tietoturvauhkaraportti (määrittämätön) (PDF). Sophos (Q1 2008). Haettu 24. huhtikuuta 2008. Arkistoitu 15. huhtikuuta 2013.
Turvallisuusuhkaraportti (määrittämätön) (PDF). Sophos (heinäkuu 2008). Haettu 24. elokuuta 2008. Arkistoitu 15. huhtikuuta 2013.
Fogie, Seth, Jeremiah Grossman, Robert Hansen ja Anton Rager. Sivustojen väliset komentosarjahyökkäykset: XSS-hyökkääjät ja puolustus. - Syngress, Elsevier Science & Technology, 2007. - S. 68–69, 127. - ISBN 1-59749-154-3.
O'Reilly, Tim. Mikä on Web 2.0 (määrittämätön) 4–5. O"Reilly Media (30. syyskuuta 2005). Haettu 4. kesäkuuta 2008. Arkistoitu 15. huhtikuuta 2013.
Ritchie, Paul (maaliskuu 2007). "AJAX/web 2.0 -sovellusten tietoturvariskit" (PDF). Tietoturva. Elsevier. Arkistoitu alkuperäisestä (PDF) 25.06.2008 . Haettu 6. kesäkuuta 2008.
Berinato, Scott. Ohjelmiston haavoittuvuuden paljastaminen: hyytävä vaikutus, CSO, CXO Media (1. tammikuuta 2007), sivu 7. Arkistoitu 18. huhtikuuta 2008. Haettu 7. kesäkuuta 2008.
Prinssi, Brian. McAfee Governance, Risk and Compliance -liiketoimintayksikkö, eWEEK, Ziff Davis Enterprise Holdings (9. huhtikuuta 2008). Haettu 25. huhtikuuta 2008.
Preston, Rob. Asiaan: Nyt on aika nostaa Infosec-keskustelu, Tietoviikko, United Business Media (12. huhtikuuta 2008). Haettu 25. huhtikuuta 2008.
Claburn, Thomas. RSA:n Coviello ennustaa tietoturvan konsolidoitumista, Tietoviikko, United Business Media (6. helmikuuta 2007). Haettu 25. huhtikuuta 2008.
poika, danah; Hargittai, Eszter (heinäkuu 2010). "Facebookin tietosuoja-asetukset: ketä kiinnostaa?" . Ensimmäinen maanantai. Illinoisin yliopisto Chicagossa. 15 (8). Käyttää vanhentunutta |month=-parametria (ohje)
Lynn, Jonathan. Internetin käyttäjien määrä ylittää 2 miljardia…, Reuters (19. lokakuuta 2010). Haettu 9. helmikuuta 2011.
S. Lawrence, C.L. Giles, "Searching the World Wide Web", Science, 280(5360), 98-100, 1998.
S. Lawrence, C.L. Giles, "Accessibility of Information on the Web", Nature, 400, 107-109, 1999.
(määrittämätön) . brightplanet.com. Haettu 27. heinäkuuta 2009.

World Wide Web (lyhennetty Maailman laajuinen verkko tai WWW) on tietoresurssien kokonaisuus, jotka on yhdistetty toisiinsa tietoliikenteen avulla ja jotka perustuvat ympäri maailmaa hajallaan olevan datan hypertekstiesitykseen.

World Wide Webin syntymävuotena pidetään vuotta 1989. Tänä vuonna Tim Berners-Lee ehdotti yhteistä hypertekstiprojektia, joka myöhemmin tuli tunnetuksi nimellä World Wide Web.

"Verkon" luoja Tim Bernes-Lee, joka työskentelee Genevessä (Sveitsissä) Euroopan ydintutkimuskeskuksen "CERNin" alkuainehiukkasfysiikan laboratoriossa, yhdessä kumppani Robert Caillotin kanssa työskenteli hyperteksti-ideoiden soveltamisen ongelmissa. rakentaa tietoympäristö, joka yksinkertaistaisi fyysikkojen välistä tiedonvaihtoa.

Tämän työn tuloksena syntyi asiakirja, joka tutki käsitteitä, jotka ovat perustavanlaatuisia "webille" sen nykyaikaisessa muodossa, ja ehdotti URI:itä, HTTP-protokollaa ja HTML-kieltä. Ilman näitä tekniikoita ei ole enää mahdollista kuvitella nykyaikaista Internetiä.

Berners-Lee loi maailman ensimmäisen verkkopalvelimen ja maailman ensimmäisen hypertekstiverkkoselaimen. Maailman ensimmäisellä verkkosivustolla hän kuvaili, mitä World Wide Web on ja kuinka verkkopalvelin asennetaan, kuinka selainta käytetään jne. Tämä sivusto oli myös maailman ensimmäinen Internet-luettelo.

Vuodesta 1994 lähtien World Wide Webin kehittämisen tärkeimmät tehtävät on ottanut World Wide Web Consortium ( World Wide Web Consortium, WZS), jonka järjesti ja johti edelleen Kim Bernes-Lee. Konsortio kehittää ja toteuttaa teknologiastandardeja Internetiä ja World Wide Webiä varten. WZS:n tehtävä: "Vapauta World Wide Webin koko potentiaali luomalla protokollia ja periaatteita, jotka takaavat verkon pitkän aikavälin kehityksen." WZS kehittää ”suosituksia” eri yritysten ohjelmistotuotteiden ja laitteiden yhteensopivuuden saavuttamiseksi, mikä tekee World Wide Webistä edistyneemmän, yleisemmän ja kätevämmän.

Hakukoneet: koostumus, toiminnot, toimintaperiaatteet.

Hakujärjestelmä on ohjelmisto- ja laitteistokompleksi, joka on suunniteltu etsimään Internetistä ja vastaamaan käyttäjän pyyntöön, joka on määritelty tekstilausekkeen muodossa (hakukysely) tuottamalla luettelon linkeistä tietolähteisiin tärkeysjärjestyksessä ( pyyntö). Suurimmat kansainväliset hakukoneet: "Google", "Yahoo", "MSN". Venäjän Internetissä se on - "Yandex", "Rambler", "Aportti".

Kuvataanpa hakukoneiden tärkeimmät ominaisuudet :

Täydellisyys

Täydellisyys on yksi hakujärjestelmän tärkeimmistä ominaisuuksista, joka on pyynnön perusteella löydettyjen asiakirjojen määrän suhde Internetissä olevien asiakirjojen kokonaismäärään, jotka täyttävät tietyn pyynnön. Esimerkiksi, jos Internetissä on 100 sivua, jotka sisältävät lauseen "miten valita auto", ja niistä löytyi vain 60 vastaavaa kyselyä varten, haun täydellisyys on 0,6. On selvää, että mitä täydellisempi haku on, sitä epätodennäköisempää on, että käyttäjä ei löydä tarvitsemaansa asiakirjaa, jos se on olemassa Internetissä.

Tarkkuus

Tarkkuus on toinen hakukoneen pääominaisuus, joka määräytyy sen mukaan, missä määrin löydetyt asiakirjat vastaavat käyttäjän kyselyä. Jos esimerkiksi kysely "miten valitaan auto" sisältää 100 asiakirjaa, 50 niistä sisältää lauseen "miten valita auto" ja loput yksinkertaisesti nämä sanat ("miten valitaan oikea radio ja asennetaan se auto”), niin hakutarkkuuden katsotaan olevan 50/100 (=0,5). Mitä tarkempi haku, sitä nopeampi käyttäjä löytää tarvitsemansa asiakirjat, mitä vähemmän erilaista "roskaa" niiden joukosta löytyy, sitä harvemmin löydetyt asiakirjat eivät vastaa pyyntöä.

Merkityksellisyys

Relevanssi on yhtä tärkeä osa hakua, jolle on ominaista aika, joka kuluu siitä hetkestä, kun asiakirjat julkaistaan Internetissä, kunnes ne on syötetty hakukoneen hakemistotietokantaan. Esimerkiksi seuraavana päivänä mielenkiintoisten uutisten ilmestymisen jälkeen suuri joukko käyttäjiä kääntyi hakukoneiden puoleen asianmukaisilla kyselyillä. Objektiivisesti tätä aihetta koskevien uutistietojen julkaisemisesta on kulunut alle päivä, mutta tärkeimmät asiakirjat on jo indeksoitu ja haettavissa suurten hakukoneiden ns. nopean tietokannan ansiosta. päivitetään useita kertoja päivässä.

Hakunopeus

Hakunopeus liittyy läheisesti sen kuormituskestävyyteen. Esimerkiksi Rambler Internet Holding LLC:n mukaan Rambler-hakukone vastaanottaa nykyään työaikana noin 60 pyyntöä sekunnissa. Tällainen työmäärä edellyttää yksittäisen pyynnön käsittelyajan lyhentämistä. Tässä käyttäjän ja hakukoneen intressit osuvat yhteen: vierailija haluaa saada tuloksia mahdollisimman nopeasti, ja hakukoneen on käsiteltävä pyyntö mahdollisimman nopeasti, jotta se ei hidasta myöhempien kyselyiden laskemista.

Näkyvyys

Tulosten visuaalinen esitys on tärkeä osa kätevää hakua. Useimmissa kyselyissä hakukone löytää satoja tai jopa tuhansia asiakirjoja. Epäselvien kyselyiden tai epätarkkojen hakujen vuoksi hakutulosten ensimmäisillä sivuilla ei aina ole vain tarpeellista tietoa. Tämä tarkoittaa, että käyttäjän on usein tehtävä oma haku löydettyjen listan sisällä. Hakukoneen tulossivun eri elementit auttavat sinua navigoimaan hakutuloksissa. Yksityiskohtaiset selitykset hakutulossivusta, esimerkiksi Yandexille, löytyvät linkistä http://help.yandex.ru/search/?id=481937.

Lyhyt historia hakukoneiden kehityksestä

Internetin kehityksen alkuvaiheessa sen käyttäjien määrä oli pieni ja saatavilla olevan tiedon määrä suhteellisen pieni. Suurimmaksi osaksi vain tutkimushenkilöstöllä oli pääsy Internetiin. Tällä hetkellä tiedonhaku Internetistä ei ollut niin kiireellinen kuin nyt.

Yksi ensimmäisistä tavoista järjestää pääsy tietolähteitä Verkosto alkoi luoda sivustoista avoimia hakemistoja, linkkejä resursseihin, joihin ryhmiteltiin aiheen mukaan. Ensimmäinen tällainen projekti oli Yahoo.com-verkkosivusto, joka avattiin keväällä 1994. Yahoo-hakemiston sivustojen määrän lisääntymisen jälkeen lisättiin mahdollisuus etsiä tarvittavia tietoja hakemistosta. Täydellisessä mielessä se ei ollut vielä hakukone, koska hakualue rajoittui vain luettelossa oleviin resursseihin, ei kaikkiin Internet-resursseihin.

Linkkihakemistoja käytettiin laajalti aiemmin, mutta ne ovat nykyään lähes kokonaan menettäneet suosionsa. Koska jopa nykyaikaiset, valtavan volyymin luettelot sisältävät tietoa vain vähäisestä osasta Internetiä. DMOZ-verkon suurin hakemisto (kutsutaan myös Open Directory Projectiksi) sisältää tietoja noin 5 miljoonasta resurssista, kun taas Googlen hakukoneen tietokanta koostuu yli 8 miljardista asiakirjasta.

Ensimmäinen täysimittainen hakukone oli WebCrawler-projekti, joka julkaistiin vuonna 1994.

Vuonna 1995 ilmestyivät hakukoneet Lycos ja AltaVista. Jälkimmäinen on ollut Internetin tiedonhaun johtaja useiden vuosien ajan.

Vuonna 1997 Sergey Brin ja Larry Page loivat Google-hakukoneen osana tutkimusprojektia Stanfordin yliopistossa. Nykyisyydessä Googlen hetki- maailman suosituin hakukone!

Syyskuussa 1997 julkistettiin virallisesti Yandex-hakukone, joka on suosituin venäjänkielisessä Internetissä.

Tällä hetkellä on kolme kansainvälistä päähakukonetta - Google, Yahoo ja MSN, joilla on omat tietokannat ja hakualgoritmit. Useimmat muut hakukoneet (joita on paljon) käyttävät tavalla tai toisella kolmen luettelon tuloksia. Esimerkiksi AOL-haku (search.aol.com) käyttää Googlen tietokantaa, kun taas AltaVista, Lycos ja AllTheWeb käyttävät Yahoo-tietokantaa.

Hakujärjestelmän kokoonpano ja toimintaperiaatteet

Venäjällä päähakukone on Yandex, jota seuraavat Rambler.ru, Google.ru, Aport.ru, Mail.ru. Lisäksi tällä hetkellä Mail.ru käyttää Yandex-hakukonetta ja tietokantaa.

Lähes kaikilla suurimmilla hakukoneilla on oma rakenne, joka eroaa muista. On kuitenkin mahdollista tunnistaa kaikille yhteiset hakukoneet pääkomponentit. Rakenteelliset erot voivat olla vain näiden komponenttien vuorovaikutusmekanismien toteuttamisen muodossa.

Indeksointimoduuli

Indeksointimoduuli koostuu kolmesta apuohjelmasta (robotista):

Hämähäkki – Web-sivujen lataamiseen suunniteltu ohjelma. Hämähäkki lataa sivun ja hakee kaikki sisäiset linkit siltä sivulta. Jokaisen sivun html-koodi ladataan. Robotit käyttävät HTTP-protokollia sivujen lataamiseen. Hämähäkki toimii seuraavasti. Robotti lähettää palvelimelle pyynnön "get/path/document" ja joitain muita HTTP-pyyntökomentoja. Vastauksena robotti vastaanottaa tekstivirran, joka sisältää palvelutiedot ja itse asiakirjan.

Sivun URL-osoite

päivämäärä, jolloin sivu on ladattu

Palvelimen vastauksen http-otsikko

sivun teksti (html-koodi)

Crawler ("matkustava" hämähäkki) – ohjelma, joka seuraa automaattisesti kaikkia sivulta löytyviä linkkejä. Valitsee kaikki sivulla olevat linkit. Sen tehtävänä on määrittää, minne hämähäkin pitäisi mennä seuraavaksi linkkien tai ennalta määrätyn osoiteluettelon perusteella. Indeksoija etsii löydettyjä linkkejä seuraamalla uusia asiakirjoja, jotka ovat hakukoneelle vielä tuntemattomia.

Indeksoija (robotti-indeksoija) - ohjelma, joka analysoi hämähäkkien lataamia verkkosivuja. Indeksoija jäsentää sivun osiin ja analysoi ne omilla leksikaalisilla ja morfologisilla algoritmillaan. Analysoidaan erilaisia sivuelementtejä, kuten tekstiä, otsikoita, linkkejä, rakenne- ja tyyliominaisuuksia, erikoispalvelun HTML-tageja jne.

Näin ollen indeksointimoduulin avulla voit indeksoida tiettyjä resursseja linkkien avulla, ladata havaittuja sivuja, poimia linkkejä uusille sivuille vastaanotetuista asiakirjoista ja suorittaa näiden asiakirjojen täydellisen analyysin.

Tietokanta

Tietokanta eli hakukoneindeksi on tiedontallennusjärjestelmä, tietotaulukko, johon on tallennettu erityisesti muunnetut parametrit kaikista indeksointimoduulin lataamista ja käsittelemistä asiakirjoista.

Hakupalvelin

Hakupalvelin on tärkein elementti koko järjestelmää, koska haun laatu ja nopeus riippuvat suoraan sen toiminnan taustalla olevista algoritmeista.

Hakupalvelin toimii seuraavasti:

Käyttäjältä saadulle pyynnölle tehdään morfologinen analyysi. Luotu tietoympäristö jokainen tietokannan sisältämä asiakirja (joka näytetään myöhemmin katkelmana, eli hakutulossivulla olevaa pyyntöä vastaavana tekstitiedona).

Vastaanotettu data lähetetään muodossa syöttöparametreja erityinen sijoitusmoduuli. Kaikkien asiakirjojen tietoja käsitellään, minkä seurauksena jokaisella asiakirjalla on oma luokitus, joka kuvaa käyttäjän kirjoittaman kyselyn ja tämän asiakirjan hakukonehakemistoon tallennettujen eri komponenttien relevanssia.

Käyttäjän valinnasta riippuen tätä luokitusta voidaan säätää lisäehdoilla (esimerkiksi ns. "tarkennettu haku").

Seuraavaksi luodaan katkelma, eli jokaisesta löydetystä dokumentista poimitaan asiakirjataulukosta otsikko, kyselyä parhaiten vastaava lyhyt tiivistelmä ja linkki itse asiakirjaan, ja löydetyt sanat korostetaan.

Tuloksena olevat hakutulokset välitetään käyttäjälle SERP-muodossa (Search Engine Result Page) – hakutulossivu.

Kuten näet, kaikki nämä komponentit liittyvät läheisesti toisiinsa ja toimivat vuorovaikutuksessa muodostaen selkeän, melko monimutkaisen mekanismin hakujärjestelmän toimintaan, mikä vaatii valtavia resursseja.

Mikään hakukone ei kata kaikkia Internet-resursseja.

Jokainen hakukone kerää tietoa Internet-resursseista omilla ainutlaatuisilla menetelmillään ja muodostaa oman säännöllisesti päivitettävän tietokantansa. Pääsy tähän tietokantaan myönnetään käyttäjälle.

Hakukoneet toteuttavat kaksi tapaa etsiä resurssia:

Hae aiheen mukaan luettelot - tiedot esitetään muodossa hierarkinen rakenne. Ylimmällä tasolla on yleisluokat ("Internet", "Business", "Taide", "Koulutus" jne.), seuraavalla tasolla luokat on jaettu osioihin jne. Alin taso on linkit tietyille verkkosivuille tai muihin tietolähteisiin.

Avainsanahaku (indeksihaku tai yksityiskohtainen haku) - käyttäjä lähettää hakukoneeseen pyyntö, joka koostuu avainsanoista. Järjestelmä palaa käyttäjälle luettelon pyynnöstä löydetyistä resursseista.

Useimmat hakukoneet yhdistävät molemmat hakutavat.

Hakukoneet voivat olla paikallisia, globaaleja, alueellisia ja erikoistuneita.

Internetin venäläisessä osassa (Runet) suosituimmat yleiskäyttöiset hakukoneet ovat Rambler (www.rambler.ru), Yandex (www.yandex.ru), Aport (www.aport.ru), Google (www. google.ru).

Useimmat hakukoneettoteutetaan portaalien muodossa.

Portaali (englanniksi.portaali - Pääsisäänkäynti, portti) on verkkosivusto, joka yhdistää erilaisia Internet-palveluita: hakutyökalut, sähköpostit, uutiset, sanakirjat jne.

Portaalit voivat olla erikoistuneita (esim.www. museo. ru) ja yleisiä (esim.www. km. ru).

Hae avainsanoilla

Hakuun käytettyä avainsanajoukkoa kutsutaan myös hakukriteeriksi tai hakuaiheeksi.

Pyyntö voi koostua joko yhdestä sanasta tai sanayhdistelmästä, joka on yhdistetty operaattoreilla - symboleilla, joiden avulla järjestelmä määrittää, mitä toimintoa sen on suoritettava. Esimerkiksi: pyyntö "Moskova Pietari" sisältää AND-operaattorin (näin välilyönti havaitaan), mikä osoittaa, että tulee etsiä asiakirjoja, jotka sisältävät molemmat sanat - Moskova ja Pietari.

Jotta haku olisi merkityksellinen (englannin kielestä relevantti - relevant, relevant), tulee ottaa huomioon useita yleisiä sääntöjä:

Riippumatta siitä, missä muodossa sanaa kyselyssä käytetään, haku ottaa huomioon kaikki sen sanamuodot venäjän kielen sääntöjen mukaisesti. Esimerkiksi kysely "lippu" löytää myös sanat "lippu", "lippu" jne.

Isoja kirjaimia tulee käyttää vain erisnimissä tarpeettomien viittausten välttämiseksi. Esimerkiksi "seppien" pyynnöstä löydetään asiakirjoja, joissa puhutaan sekä sepistä että Kuznetsovista.

On suositeltavaa rajata hakua muutamalla avainsanalla.

Jos vaadittu osoite ei ole kahdenkymmenen ensimmäisen löydetyn osoitteen joukossa, sinun tulee muuttaa pyyntöä.

Jokainen hakukone käyttää omaa hakukieltään. Voit tutustua siihen käyttämällä hakukoneen sisäänrakennettua apua

Suurilla sivustoilla voi olla sisäänrakennettuja tiedonhakujärjestelmiä verkkosivuillaan.

Kyselyt tällaisissa hakujärjestelmissä rakennetaan pääsääntöisesti samojen sääntöjen mukaan kuin globaaleissa hakukoneissa, mutta tämän ohjeen tunteminen ei ole tarpeetonta.

Tarkennettu Haku

Hakukoneet voivat tarjota käyttäjälle mekanismin monimutkaisen kyselyn luomiseen. Linkin perässä Tarkennettu Haku mahdollistaa hakuparametrien muokkaamisen, lisäparametrien määrittämisen ja sopivimman muodon valitsemisen hakutulosten näyttämiseen. Seuraavassa kuvataan parametrit, jotka voidaan määrittää tarkennetun haun aikana Yanex- ja Rambler-järjestelmissä.

Parametrin kuvaus	Nimi Yandexissa	Nimi sisäänRambler
Mistä avainsanoja etsiä (asiakirjan otsikko, leipäteksti jne.)	Sanakirjan suodatin	Hae tekstillä...
Mitä sanoja asiakirjassa pitäisi olla tai ei pitäisi olla ja kuinka tarkka vastaavuuden tulee olla	Sanakirjan suodatin	Hae hakusanoja... Sulje pois asiakirjat, jotka sisältävät seuraavat sanat...
Kuinka kaukana toisistaan avainsanojen tulisi sijaita?	Sanakirjan suodatin	Kyselysanojen välinen etäisyys...
Asiakirjan päivämäärän rajoitus		Dokumentin päivämäärä...
Rajoita haku yhteen tai useampaan sivustoon	Sivusto/yläosa	Hae asiakirjoja vain seuraavilta sivustoilta...

Haun rajoittaminen asiakirjan kielen mukaan		Asiakirjan kieli...
Etsi asiakirjoja sisältää kuvan tietyllä nimellä tai kuvatekstillä	Kuva
Etsi sivuja sisältää esineitä	Erikoisesineitä
Hakutulosten esittelylomake	Ongelman muoto	Hakutulosten näyttäminen

Jotkut hakukoneet (esimerkiksi Yandex) antavat sinun kirjoittaa kyselyitä luonnollisella kielellä. Kirjoitat mitä tarvitset (esimerkiksi junalippujen tilaaminen Moskovasta Pietariin). Järjestelmä analysoi pyynnön ja tuottaa tuloksen. Jos et ole tyytyväinen, vaihda kyselykieleen.