2 tyyppisiä hakukoneita. Yleiset hakukoneiden toiminnan periaatteet. Hakukoneet: koostumus, toiminnot, toimintaperiaate

Tohtoriopiskelija löytää Internetistä tieteellisiä artikkeleita lääketieteen kandidaatin väitöskirjan kirjallisuuskatsauksen kirjoittamiseen, vieraan kielen artikkeleita vähimmäiskandidaatin kokeeseen valmistautumiseen, kuvauksia nykyaikaisista tutkimusmenetelmistä ja paljon muuta...

Tässä artikkelissa käsitellään tietojen etsimistä Internetistä hakukoneiden avulla.

Niille, jotka eivät vielä ole kovin perehtyneet sellaisiin käsitteisiin kuin verkkosivusto, palvelin, annan perustiedot Internetistä.

Internet on joukko sivustoja, joita isännöidään viestintäkanavien (puhelin-, valokuitu- ja satelliittilinjojen) kautta yhdistetyillä palvelimilla.

Web-sivusto on kokoelma html-muotoisia asiakirjoja (verkkosivustosivuja), jotka on yhdistetty toisiinsa hyperlinkeillä.

Suuri verkkosivusto (esimerkiksi "Medlink" - lääketieteen temaattinen luettelo http://www.medlinks.ru - koostuu 30 000 sivusta, ja sen viemä levytila ​​palvelimella on noin 400 Mt).
Pieni sivusto koostuu useista kymmenistä - sadaista sivuista ja vie 1 - 10 MB (esimerkiksi sivustoni "Postgraduate Doctor" 25. heinäkuuta 2004 koostui 280 .htm sivusta ja palvelimella oli 6 Mt).

Palvelin on tietokone, joka on yhteydessä Internetiin ja toimii kellon ympäri. Palvelin voi isännöidä useista sadaista useisiin tuhansiin sivustoihin samanaikaisesti.

Internetin käyttäjät voivat katsella ja kopioida palvelintietokoneella isännöityjä verkkosivustoja.

Keskeytymättömän pääsyn varmistamiseksi sivustoille virransyöttö palvelimelle tapahtuu keskeytymättömien virtalähteiden kautta ja palvelinten toimintatila (tietokeskus) on varustettu automaattisella sammutusjärjestelmällä ja ympärivuorokautisella teknisellä päivystyksellä. henkilöstö on järjestetty.

Yli 10 vuoden olemassaolonsa ajan Runet ( Venäjänkielinen Internet) on muodostunut järjestyväksi rakenteeksi ja tiedon etsimisestä verkosta on tullut ennakoitavampaa.

Pääasiallinen työkalu tiedonhakuun Internetistä on hakukoneet.

Hakukone koostuu hämähäkkiohjelmasta, joka indeksoi Internet-sivustoja, ja tietokannasta (hakemistosta), joka sisältää tietoja vierailluista sivustoista.

Verkkovastaavan pyynnöstä hämähäkkirobotti saapuu sivustolle ja katselee sivuston sivuja syöttäen tietoja sivuston sivuista hakukoneen hakemistoon. Hakukone voi löytää sivuston itse, vaikka sen verkkovastaava ei olisi hakenut rekisteröintiä. Jos linkki sivustoon tulee jossain hakukoneen polussa (esimerkiksi toisella sivustolla), se indeksoi sivuston välittömästi.

Hämähäkki ei kopioi sivuston sivuja hakukoneen hakemistoon, vaan tallentaa tietoja kunkin sivuston sivun rakenteesta - esimerkiksi mitkä sanat näkyvät asiakirjassa ja missä järjestyksessä, sivuston sivun hyperlinkkien osoitteet, asiakirjan koon kilotavuina, sen luomispäivä ja paljon muuta. Siksi hakukoneen indeksi on useita kertoja pienempi kuin indeksoidun tiedon määrä.

Mitä ja miten hakukone etsii Internetistä?

Ihmiset keksivät hakukoneen auttamaan heitä löytämään tietoa. Mitä on informaatio ihmisen ymmärryksessämme ja visuaalisessa esityksessämme? Nämä eivät ole hajuja tai ääniä, eivät aistimuksia tai kuvia. Nämä ovat vain sanoja, tekstiä. Kun etsimme jotain Internetistä, pyydämme sanoja - hakukyselyä, ja vastauksena toivomme saavamme tekstin, joka sisältää juuri nämä sanat. Koska tiedämme, että hakukone etsii tiedoista juuri niitä sanoja, joita pyysimme. Koska niin hänet oli suunniteltu etsimään sanoja.

Hakukone ei etsi sanoja Internetistä, vaan hakemistostaan. Hakukoneen hakemisto sisältää tietoja vain pienestä määrästä Internet-sivustoja. On hakukoneita, jotka indeksoivat vain englanninkieliset sivustot, ja on hakukoneita, jotka sisällyttävät hakemistoonsa vain venäjänkieliset sivustot.

(hakemisto sisältää sivustoja englanniksi, saksaksi ja muilla eurooppalaisilla kielillä)

Runet hakukoneet(hakemisto sisältää venäjänkielisiä sivustoja)

Joidenkin Runet-hakukoneiden ominaisuudet

Hakukone Google auto ei ota huomioon venäjän kielen morfologiaa. Esimerkiksi Google pitää sanoja "väitöskirja" ja "väitöskirja" erilaisina.

Hakukyselyn tuloksen ensimmäisen sivun lisäksi on tarkasteltava myös loput.

Koska usein sivustot, jotka sisältävät käyttäjän todella tarvitsemaa tietoa, sijaitsevat tuloksen sivuilla 4-10 hakulauseke.

Miksi tämä tapahtuu? Ensinnäkin monet verkkosivustojen luojat eivät optimoi verkkosivujaan hakukoneita varten, he eivät esimerkiksi sisällytä sisällönkuvauskenttiä verkkosivuillaan.

Sisällönkuvauskentät ovat verkkodokumentin palveluelementtejä, jotka eivät näy näytöllä, mutta ovat tärkeitä, kun hakukoneet löytävät sivustosi. Sisällönkuvauskentät helpottavat hakukoneiden löytämistä, joten heidän ei tarvitse mennä dokumenttiin syvälle ja analysoida koko sivuston tekstiä luodakseen siitä tietyn kuvan. Tärkein sisällönkuvauskenttä on meta NAME="avainsanat" - sivuston sivun avainsanat. Jos sanaa asiakirjan päätekstistä ei pidetä " etsi roskapostia" ja on "avainsanoissa" ensimmäisten 50 joukossa, silloin tämän sanan paino kyselyssä kasvaa, eli asiakirja saa suuremman merkityksen.

Toiseksi verkkosivustojen ylläpitäjien välillä on kova kilpailu ensimmäisistä sijoituksista hakukyselyn seurauksena.

Tilastojen mukaan 80 % verkkosivuston kävijöistä tulee hakukoneista. Ennemmin tai myöhemmin verkkovastaavat ymmärtävät tämän ja alkavat mukauttaa sivustojaan hakukoneiden lakien mukaan.

Valitettavasti jotkut sivuston luojista käyttävät epärehellistä tapaa mainostaa sivustoaan hakukoneiden kautta - niin sanottua "hakuroskapostia" luodakseen näennäisen vastaavuuden sisällönkuvauskenttien sisällön ja sivuston muun tekstin välille - he sijoittavat piilosanoja. sivuston sivuilla kirjoitettuna taustavärillä, jotta ne eivät häiritse sivuston vierailijoita. Hakukoneiden luojat kuitenkin seuraavat tällaisia ​​temppuja ja "hakuroskapostittajan" sivusto putoaa saavutetuista korkeuksistaan ​​aivan pohjaan.

Metaforista ja kuvaannollisista vertailuista on vähän hyötyä Internetissä. Ne vääristävät totuutta ja johdattavat Internetin käyttäjät pois tarkasta ja yksiselitteisestä tiedosta. Mitä vähemmän taiteellista ja tarkempaa sivuston tekijän tyyliä, sitä korkeammalle sijoitukselle sivusto on hakukyselyn tuloksissa.

Jos taas haluat hakukoneen löytävän sinulle artikkeleita Internetistä, ajattele kuin kone, ryhdy koneeksi. Ainakin hetkeksi. Etsinnän aikana.

Johdanto……………………………………………………………………………………….2

1 Hakukoneet: koostumus, toiminnot, toimintaperiaate

1.1 Hakukoneiden kokoonpano………………………………….…………………3

1.2 Hakukoneiden ominaisuudet………………………………………………..4

1.3 Hakukoneiden periaatteet………………………………………..4

2 Yleiskuvaus hakukoneiden toiminnasta

2.1 Ulkomaiset hakukoneet: koostumus ja toimintaperiaatteet…………12

2.2 Venäjänkieliset hakukoneet: koostumus ja toimintaperiaatteet………..14

Johtopäätös…………………………………………………………………

Lista lähdeluettelosta………………………………..………….17

Johdanto

Hakukoneista on jo pitkään tullut olennainen osa venäläistä Internetiä, koska ne tarjoavat, vaikkakin eri keinoin, itsenäisesti kaikki tiedonkäsittelyn vaiheet sen vastaanottamisesta ensisijaisesta lähdesolmusta siihen, että ne tarjoavat käyttäjälle mahdollisuuden etsiä. kutsutaan usein autonomiset hakukoneet järjestelmät .

Hakukoneet ovat nykyään valtavia ja monimutkaisia ​​mekanismeja, jotka edustavat paitsi tiedonhakutyökalua myös houkuttelevia alueita yrityksille. Nämä järjestelmät voivat poiketa toisistaan ​​tiedon valintaperiaatteessa, joka on jossain määrin läsnä automaattisen indeksin algoritmissa. skannausohjelmassa ja rekisteröinnistä vastaavien luettelotyöntekijöiden menettelysäännöissä. Yleensä verrataan kahta pääindikaattoria:

Avaruusmittakaava, jolla IPS toimii, on

Ja hänen erikoisuutensa.

Suurin osa hakukoneiden käyttäjistä ei ole koskaan ajatellut (tai ajatellut sitä, mutta ei löytänyt vastausta) hakukoneiden toimintaperiaatteesta, käyttäjien pyyntöjen käsittelyjärjestelmästä, siitä, mistä nämä järjestelmät koostuvat ja miten ne toimivat. Hakukoneita voidaan verrata help deskiin, jonka agentit kiertävät yrityksiä ja keräävät tietoa tietokantaan. Kun otat yhteyttä palveluun, tiedot haetaan tästä tietokannasta. Tietokannan tiedot vanhentuvat, joten agentit päivittävät ne säännöllisesti. Jotkut yritykset lähettävät itse tietoja itsestään, eikä agenttien tarvitse tulla heidän luokseen. Toisin sanoen, tukipalvelu on kaksi tehtävää: luominen ja jatkuva päivitys tietokannan tiedot ja tiedon etsiminen tietokannasta asiakkaan pyynnöstä.

1 Hakukoneet: koostumus, toiminnot, toimintaperiaate

1.1 Hakukoneiden kokoonpano

Hakujärjestelmä on ohjelmisto- ja laitteistokompleksi, joka on suunniteltu etsimään Internetistä ja vastaamaan käyttäjän pyyntöön, joka on määritelty tekstilausekkeen muodossa (hakukysely), tuottamalla luettelo linkeistä tietolähteisiin merkityksellisyyden järjestyksessä ( pyynnön mukaisesti). Suurimmat kansainväliset hakukoneet: Google, Yahoo, MSN. Venäjän Internetissä nämä ovat Yandex, Rambler, Aport.

Samoin hakukone koostuu kahdesta osasta: niin sanotusta robotista (tai hämähäkistä), joka indeksoi Web-palvelimia ja luo hakukonetietokannan.

Robotin perusta muodostuu pääosin itsestään (robotti itse löytää linkkejä uusiin resursseihin) ja paljon vähemmässä määrin resurssien omistajat, jotka rekisteröivät sivustonsa hakukoneeseen. Tietokannan muodostavan robotin (verkkoagentti, hämähäkki, mato) lisäksi löytyy ohjelma, joka määrittää löydettyjen linkkien luokituksen.

Hakukoneen toimintaperiaate on, että se kysyy sisäisestä luettelostaan ​​(tietokannasta) käyttäjän kyselykenttään määrittämiä avainsanoja ja tuottaa listan linkeistä, jotka on järjestetty osuvuuden mukaan.

On syytä huomata, että kun harjoittelet erityinen pyyntö Käyttäjä, hakukone toimii täsmälleen sisäisillä resursseilla (eikä lähde matkalle Webissä, kuten kokemattomat käyttäjät usein olettavat), ja sisäiset resurssit ovat luonnollisesti rajalliset. Huolimatta siitä, että hakukoneen tietokanta päivitetään jatkuvasti, hakukone ei voi indeksoida kaikkia Web-asiakirjoja: niiden määrä on liian suuri. Siksi on aina mahdollista, että etsimäsi resurssi on yksinkertaisesti tuntematon tietylle hakukoneelle.

1.2 Hakukoneiden ominaisuudet

Työssä hakuprosessi esitetään neljässä vaiheessa: muotoilu (tapahtuu ennen haun alkamista); toiminta (haun aloittaminen); yleiskatsaus tuloksista (tulos, jonka käyttäjä näkee haun jälkeen); ja tarkennus (tulosten tarkastelun jälkeen ja ennen kuin palaat hakuun saman tarpeen eri muotoilulla). Kätevämpi epälineaarinen tiedonhakujärjestelmä koostuu seuraavista vaiheista:

Tiedontarpeiden korjaaminen luonnollisella kielellä;

Valitaan tarvittava hakupalvelut verkot ja tietojen tallennustarpeiden tarkka formalisointi tietyillä tiedonhakukielillä (IRL);

Luotujen kyselyjen suorittaminen;

Vastaanotettujen asiakirjojen linkkiluetteloiden esikäsittely ja valinta;

Yhteydenotto valittuihin osoitteisiin tarvittavia asiakirjoja varten;

Esikatsele löydettyjen asiakirjojen sisältöä;

Tarvittavien asiakirjojen tallentaminen myöhempää tutkimusta varten;

Linkkien poimiminen asiaankuuluvista asiakirjoista kyselyn laajentamiseksi;

Koko tallennettujen asiakirjojen joukon tutkiminen;

Jos tiedon tarve ole täysin tyytyväinen, palaa sitten ensimmäiseen vaiheeseen.

1.3 Miten hakukoneet toimivat

Mikä tahansa tehtävä hakukone– toimittaa ihmisille heidän etsimäänsä tietoa. Opeta ihmisiä tekemään "oikeita" pyyntöjä, ts. hakukoneiden toimintaperiaatteiden mukaiset kyselyt ovat mahdottomia. Siksi kehittäjät luovat hakukoneille algoritmeja ja toimintaperiaatteita, joiden avulla käyttäjät löytävät juuri ne tiedot, joita he etsivät. Tämä tarkoittaa, että hakukoneen täytyy "ajatella" samalla tavalla kuin käyttäjä ajattelee etsiessään tietoa.

Useimmat hakukoneet toimivat esiindeksoinnin periaatteella. Useimpien hakukoneiden tietokanta toimii samalla periaatteella.

Rakentamisessa on toinenkin periaate. Suora haku. Se koostuu kirjan kääntämisestä sivu sivulta hakusanan etsimiseksi. Tietenkin tämä menetelmä on paljon vähemmän tehokas.

Käänteisellä indeksillä varustetussa versiossa hakukoneet kohtaavat tiedostokoon ongelman. Yleensä ne ovat huomattavan suuria. Tämä ongelma ratkaistaan ​​yleensä kahdella tavalla. Ensimmäinen on, että kaikki tarpeeton poistetaan tiedostoista ja vain se, mikä todella tarvitaan hakuun, jää jäljelle. Toinen tapa on, että jokaisesta sijainnista ei muisteta absoluuttista osoitetta, vaan suhteellista osoitetta, ts. osoiteero nykyisen ja edellisen sijainnin välillä.

Näin ollen kaksi hakukoneen suorittamaa pääprosessia ovat sivustojen, sivujen indeksointi ja haku. Yleensä indeksointiprosessi ei aiheuta ongelmia hakukoneille. Ongelmana on miljoonan pyynnön käsittely päivässä. Tämä johtuu suurista tietomääristä, joita suuret tietokonejärjestelmät käsittelevät. Päätekijä, joka määrittää hakuun osallistuvien palvelimien määrän, on haun kuormitus. Tämä selittää joitain omituisuuksia, joita syntyy, kun tietoa etsitään.

Hakukoneet koostuvat viidestä erillisestä ohjelmistokomponentista:

hämähäkki: selainmainen ohjelma, joka lataa verkkosivuja.

indeksointirobotti:"matkustava" hämähäkki, joka seuraa automaattisesti kaikkia sivulta löytyviä linkkejä.

indeksoija:"sokea" ohjelma, joka analysoi hämähäkkien lataamia verkkosivuja.

tietokanta: ladattujen ja käsiteltyjen sivujen tallennus.

hakukoneen tuloskone (tulosten toimitusjärjestelmä): hakee hakutulokset tietokannasta.

Hämähäkki: Hämähäkki on ohjelma, joka lataa verkkosivuja. Se toimii aivan kuten selaimesi, kun muodostat yhteyden verkkosivustoon ja lataat sivun. Hämähäkillä ei ole visuaalisia osia. Voit havaita saman toiminnon (latauksen), kun tarkastelet tiettyä sivua ja valitset selaimessasi "näytä HTML-koodi".

Indeksointirobotti: Aivan kuten hämähäkki lataa sivuja, se voi poistaa sivun ja löytää kaikki linkit. Sen tehtävänä on määrittää, minne hämähäkin pitäisi seuraavaksi mennä linkkien tai ennalta määrätyn osoiteluettelon perusteella.

Indeksoija: Indeksoija jäsentää sivun eri osiin ja analysoi ne. Elementit, kuten sivun otsikot, otsikot, linkit, teksti, rakenneelementit, LIVOITAT elementit, KURSIVOITTEET ja muut sivun tyyliosat eristetään ja analysoidaan.

Tietokanta: Tietokanta on kaikkien hakukoneen lataamien ja analysoimien tietojen arkisto. Tämä vaatii usein valtavia resursseja.

Hae Moottori Tulokset: Tulosjärjestelmä vastaa sivujen sijoituksesta. Se päättää, mitkä sivut täyttävät käyttäjän pyynnön ja missä järjestyksessä ne pitäisi lajitella. Tämä tapahtuu hakukoneen sijoitusalgoritmien mukaan. Nämä tiedot ovat meille arvokkaimmat ja mielenkiintoisimmat - optimoija on vuorovaikutuksessa tämän hakukoneen komponentin kanssa yrittäen parantaa sivuston asemaa hakutuloksissa, joten tulevaisuudessa harkitsemme yksityiskohtaisesti kaikkia tekijöitä, jotka vaikuttavat tulosten ranking.

Hakuhakemisto toimii kolmessa vaiheessa, joista kaksi ensimmäistä ovat valmistavia ja käyttäjälle näkymättömiä. Ensin hakuhakemisto kerää tietoja Maailman Leveä Web . Käytä tätä varten erityisiä ohjelmia, jotka ovat samanlaisia ​​​​kuin selaimet. He pystyvät kopioimaan tietyn Web-sivun hakuhakemistopalvelimelle, katsomaan sitä, löytämään kaikki hyperlinkit, joissa kyseiset resurssit löytyvät, etsimään uudelleen niiden sisältämiä hyperlinkkejä jne. Tällaisia ​​ohjelmia kutsutaan ns. madot, hämähäkit, toukat, telakoneet, hämähäkit ja muita vastaavia nimiä. Jokainen hakuhakemisto käyttää omaansa tähän tarkoitukseen. ainutlaatuinen ohjelma, jota hän usein kehittää itse. Monet nykyaikaiset hakukoneet syntyivät kokeellisista projekteista, jotka liittyivät verkkoa valvovien automaattisten ohjelmien kehittämiseen ja käyttöönottoon. Teoriassa onnistuneella osallistumisella hämähäkki pystyy kammatamaan koko verkkotilan yhdellä sukelluksella, mutta tämä vie paljon aikaa, ja hänen on silti palattava aika ajoin aiemmin vierailtuihin resursseihin seuratakseen siellä tapahtuvia muutoksia ja tunnistaakseen "kuollut" linkit, eli ne jotka ovat menettäneet merkityksensä.

Hakukoneet ( Hakukone)

Hakukoneiden avulla voit etsiä tiettyihin aiheisiin liittyviä tai avainsanoja tai niiden yhdistelmiä sisältäviä WWW-dokumentteja. Hakupalvelimissa käytetään kahta hakumenetelmää:

· Käsitehierarkian mukaan;

· Avainsanojen mukaan.

Hakupalvelimet täytetään automaattisesti tai manuaalisesti. Hakupalvelimella on yleensä linkit muihin hakupalvelimia ja lähettää heille hakupyynnön käyttäjän pyynnöstä.

Hakukoneita on kahdenlaisia.

1. Täystekstihakukoneet, jotka indeksoivat jokaisen verkkosivun sanan lopetussanoja lukuun ottamatta.

2. "Abstraktit" hakukoneet, jotka luovat tiivistelmän jokaisesta sivusta.

Verkkovastaaville kokotekstimoottorit ovat hyödyllisempiä, koska kaikki verkkosivulta löydetyt sanat analysoidaan sen merkityksen määrittämiseksi käyttäjien kyselyille. Abstraktit moottorit voivat kuitenkin indeksoida sivuja paremmin kuin kokotekstit. Tämä riippuu tiedon erotusalgoritmista, esimerkiksi käyttötiheyden mukaan identtiset sanat.

Hakukoneiden tärkeimmät ominaisuudet.

1.Hakukoneen koko määräytyy indeksoitujen sivujen lukumäärän mukaan. Kuitenkin milloin tahansa käyttäjien pyyntöihin annetut linkit voivat olla eri ikäisiä. Syitä miksi näin tapahtuu:

· Jotkut hakukoneet indeksoivat sivun välittömästi käyttäjän pyynnöstä ja jatkavat sitten indeksoimattomien sivujen indeksointia.

· toiset indeksoivat usein eniten suosittuja sivuja verkkoja.

2. Indeksointipäivämäärä. Jotkut hakukoneet näyttävät asiakirjan indeksointipäivämäärän. Tämä auttaa käyttäjää määrittämään, milloin asiakirja ilmestyi verkossa.

3. Indeksointisyvyys näyttää, kuinka monta sivua määritetyn sivun jälkeen hakukone indeksoi. Useimmissa koneissa ei ole rajoituksia indeksointisyvyydelle. Syitä, miksi kaikkia sivuja ei välttämättä indeksoida:

· Ei oikea käyttö runkorakenteita.

· Sivustokartan käyttö ilman tavallisten linkkien kopioimista

4. Työskentely kehysten kanssa. Jos hakurobotti ei tiedä miten työskennellä runkorakenteita, niin monet kehyksiset rakenteet jäävät huomaamatta indeksoinnin aikana.

5. Linkkien tiheys. Suuret hakukoneet voivat määrittää asiakirjan suosion sen perusteella, kuinka usein se linkitetään. Jotkut koneet tällaisten tietojen perusteella "päättelevät", kannattaako dokumentti indeksoida vai ei.

6.Palvelimen päivitystiheys. Jos palvelinta päivitetään usein, hakukone indeksoi sen uudelleen useammin.

7. Indeksoinnin hallinta. Näyttää, mitä työkaluja voit käyttää hakukoneen ohjaamiseen.

8. Uudelleenohjaus. Jotkut sivustot ohjaavat vierailijat palvelimelta toiselle, ja tämä vaihtoehto näyttää, miten tämä liittyy löydettyihin asiakirjoihin.

9. Lopeta sanat. Jotkut hakukoneet eivät sisällytä tiettyjä sanoja hakemistoihinsa tai eivät välttämättä sisällytä niitä käyttäjien kyselyihin. Näitä sanoja pidetään yleensä prepositioina tai usein käytettyinä sanoina.

10. Roskapostisakot. Mahdollisuus estää roskapostia.

11. Vanhojen tietojen poistaminen. Parametri, joka määrittää verkkovastaavan toimet, kun palvelin suljetaan tai siirretään toiseen osoitteeseen.

Esimerkkejä hakukoneista.

1. Altavista. Järjestelmä avattiin joulukuussa 1995. Omistaja DEC. Vuodesta 1996 hän on tehnyt yhteistyötä Yahoon kanssa. AltaVista on paras vaihtoehto mukautettua hakua varten . Tulokset kuitenkin lajitellaan luokkien mukaan Tätä ei tehdä, ja sinun on tarkistettava annetut tiedot manuaalisesti. AltaVista ei tarjoa mitään keinoja aktiivisten sivustojen luetteloiden, uutisten tai muiden sisällönhakutoimintojen hakemiseen.

2. Excite Search. Otettiin käyttöön vuoden 1995 lopussa. Syyskuussa 1996 - WebCrawler osti. Tässä laitteessa on tehokas hakuturkisalhainen, mahdollisuus automaattisiin yksittäisiin asetuksiintoimitetut tiedot sekä kootut pätevyydetpätevän henkilöstön kuvaukset useista solmuista. Kiihottaa eroaa muista hakusolmuista siinävoit etsiä uutispalveluita ja julkaista arvosteluja Verkkosivut. Hakukone käyttää työkalujatavallinen avainsanahaku ja heuristiikkasisällön hakumenetelmiä. Tämän yhdistelmän ansiostalöydät asiaankuuluvat sivut Web, jos ne eivät sisällä käyttäjän määrittelemä avain sanat Exciten haittapuoli on hieman kaoottinen käyttöliittymä.

3. HotBot. Otettiin käyttöön toukokuussa 1996. Wiredin omistuksessa. Perustuu Berkeley Inktomi -hakukoneteknologiaan. HotBot on tietokanta, joka sisältää indeksoimia asiakirjoja koko teksti, ja yksi kattavimmista hakukoneista verkossa. Sen keino etsiä loogisia ehtoja ja keinoja rajoittaa haun mihin tahansa alueeseen tai Verkkosivusto auttaa käyttäjää löytämään tarvittavat tiedot, karsimalla pois turhat. HotBot antaa sinulle mahdollisuuden valita vaaditut parametrit hae avattavista luetteloista.

4. InfoSeek. Ennen vuotta 1995 lanseerattu, helposti saavutettavissa. Tällä hetkellä sisältää noin 50 miljoonaa URL-osoitetta. Infoseekillä on hyvin suunniteltu käyttöliittymä ja erinomaiset hakumahdollisuudet. Useimpiin kyselyihin liittyviin vastauksiin liittyy "liittyvät aiheet" -linkit, ja jokaista vastausta seuraa "samankaltaiset sivut" -linkit. Hakukoneen tietokanta sivuista, jotka on indeksoitu koko tekstin mukaan. Vastaukset on järjestetty kahdella indikaattorilla: sanan tai lauseiden esiintymistiheys sivulla tsakh sekä sanojen tai lauseiden sijainti sivuilla. On Web-hakemisto, joka on jaettu 12 luokkaan ja satoja alaluokkia, joista voidaan etsiä. Jokaisella luettelosivulla on luettelo re suositellut solmut.

5. Lycos. Toiminut toukokuusta 1994 lähtien. Laajalti tunnettu ja käytetty. Se sisältää hakemiston, jossa on valtava määrä URL-osoitteita. ja Point-hakukone teknologialla Tilastollinen analyysi sivun sisältö, toisin kuin koko tekstin indeksointi. Lycos sisältää uutisia, sivustoarvosteluja, linkkejä suosituille sivustoille, kaupunkikarttoja ja työkaluja osoitteiden, kuvien etsimiseen ilmaisuja sekä ääni- ja videoleikkeitä. Lycos järjestää vastaukset korrelaatioasteen mukaanpyynnön tyydyttäminen useiden kriteerien, esimerkiksi lukumäärän, perusteellalu hakutermit löytyvät asiakirjan abstraktistavälilläsanoin tietyssä asiakirjan lauseessa, sijaintiehdot asiakirjassa.

6. WebCrawler. Avattiin 20. huhtikuuta 1994 Washingtonin yliopiston projektina. WebCrawler tarjoaa mahdollisuuksia syntaksi kyselyiden määrittämiseen sekä iso valinta solmumerkinnät yksinkertaisella käyttöliittymällä.


Jokaisen vastauksen jälkeen WebCrawler näyttää pienen kuvakkeen, jossa on likimääräinen arvio siitä, osuiko pyyntö. Comee näyttää myös sivun, jossa on lyhyt yhteenveto jokaisesta vastauksesta, sen täydellinen URL-osoite, tarkan vastaavuuden pisteet ja tämä vastaus mallipyynnössä sellaisenaan avainsanoja. Graafinen käyttöliittymä kyselyiden määrittämiseen Web-indeksointirobottia ei ole. N ei ole sallittuyleismaailmallisten symbolien käyttö on myös mahdotontaantaa avainsanoille painotuksia.Hakukenttää ei voi mitenkään rajoittaatiettyä aluetta.

7. Yahoo. Yahoon vanhin hakemisto julkaistiin vuoden 1994 alussa. Laajalti tunnettu, usein käytetty ja arvostetuin. Maaliskuussa 1996 lanseerattiin Yahooligans-luettelo lapsille. Yahoon alueelliset ja suosituimmat hakemistot tulevat näkyviin. Yahoo perustuu käyttäjien tilauksiin. Se voi toimia lähtökohtana kaikille Internet-hauille, koska sen luokitusjärjestelmä auttaa käyttäjää löytämään sivuston, jossa on hyvin järjestettyä tietoa. Verkkosisältö jakautuu 14 yleiseen luokkaan, jotka on lueteltu kotisivu Yahoo!. Käyttäjän pyynnön yksityiskohdista riippuen on mahdollista joko työskennellä näiden luokkien kanssa tutustuaksesi alakategorioihin ja solmuluetteloihin tai etsiä erityisiä sanoja ja termejä koko tietokannassa. Käyttäjä voi myös rajoittaa hakua missä tahansa Yahoo!:n osiossa tai alaosassa. Johtuen siitä, että solmujen luokittelun suorittavat ihmiset ja ei tietokoneella, linkkien laatu on yleensä erittäin korkea. Haun tarkentaminen epäonnistumisen varalta on kuitenkin vaikea tehtävä. Liity Yahoo-palveluun ! hakukone mukana AltaVista, joten jos etsit Yahoo! se tapahtuu automaattisesti toistoa hakukoneen avulla AltaVista . Tulokset lähetetään sitten osoitteeseen Yahoo!. Yahoo! tarjoaa mahdollisuuden lähettää hakukyselyitä Usenetille ja Fourl 1:lle osoitteiden selvittämiseksi Sähköposti.

Venäjän hakukoneita ovat mm.

1. Rambler Tämä on venäjänkielinen hakukone. Rambler-kotisivulla luetellut osiot kattavat venäjänkieliset verkkoresurssit. Tietojen luokittelu on olemassa. Kätevä ominaisuus on tarjota luettelo kunkin käytetyimmistä solmuista ehdotettu aihe.

2. Aport-haku. Aport on johtavien sertifioitujen hakukoneiden joukossa Microsoft kuten paikalliset hakukoneetjärjestelmät venäläiselle versiolle Microsoft Internet Explorer. Yksi Aportin eduista on englanti-venäläinen ja venäjä-englanti käännös online-tilassa kyselyt ja tuloshaut, joiden ansiosta voit etsiä venäläisistä Internet-resursseista , vaikka ei osaa venäjää. Lisäksi voit etsiä tietoa käyttää ilmaisuja, jopa lauseita varten.Aport-hakujärjestelmän tärkeimmistä ominaisuuksista voitjaa seuraavat:

Kyselyn ja hakutulosten käännös venäjästä englanniksiKiinan kieli ja päinvastoin;

Automaattinen tarkistus kirjoitusvirheet pyynnössä;

Löytyneiden sivustojen hakutulosten informatiivinen näyttö;

Kyky hakea missä tahansa kielioppimuodossa;


edistynyt kyselykieli ammattilaisille käteisen käyttäjiä.

Muita hakuominaisuuksia ovat:viiden pääkoodisivun tuki (eri toimintatavatjärjestelmät) venäjän kielelle, hakutekniikkaa käyttäenei ole rajoituksia URL-osoite ja asiakirjojen päivämäärä, haun toteutusotsikoilla, kommenteilla ja allekirjoituksillakuviin jne., tallentamalla hakuparametreja ja määrittämällä aiempien käyttäjien pyyntöjen määrä, yhdistäminen kopiot asiakirjasta, jotka sijaitsevat eri palvelimilla.

3.Lista. ru ( http://www.list.ru) Toteutuksessaan tällä palvelimella on moniayhteistä englanninkielisen järjestelmän kanssa Yahoo!. Päällä kotisivu palvelin sisältää linkkejä suosituimpiin hakukategorioihin.


Keskeisen osan muodostaa luettelo luettelon pääkategorioihin johtavista linkeistä. Haku luettelosta on toteutettu siten, että kyselyn tulos löytyy sekä yksittäisistä sivustoista että luokista. Jos haku onnistuu, URL-osoite, otsikko, kuvaus ja avainsanat näytetään. Hyväksyttävä käyttö Yandex-kyselyn kieli. KANSSAlinkki "Rakennehakemisto" avautuu sisään erillinen ikkuna täydellinen kata-rubrikaattoriHirsi. Mahdollisuus siirtyä rubrikaattorista mihin tahansa valittuun alaluokkaan on otettu käyttöön. Tarkempi teemajakonykyistä osaa edustaa linkkiluettelo. Luettelo on järjestetty näin siten, että kaikki sivustot sisältyivät rakenteiden alemmille tasoillekierrokset esitetään myös osioissa.Näytetty resurssiluettelo on lajiteltu aakkosjärjestykseen, mutta voit valita lajittelun ajankohdan mukaan lisää valikko, siirtymällä, by luetteloon lisäämisjärjestyksen mukaansuosio luettelon kävijöiden keskuudessa.

4. Yandex. Ohjelmistotuotteet Yandex-sarja edustaa työkaluja koko tekstin indeksointiin ja tekstitietojen etsimiseen ottaen huomioon venäjän kielen morfologia. Yandex sisältää morfologisen analyysin ja synteesin, indeksoinnin ja haun moduuleja sekä joukon lisämoduuleja, kuten asiakirjaanalysaattorin, merkintäkielet, muotomuuntimet ja hämähäkin.

Perussanakirjaan perustuvat morfologiset analyysi- ja synteesialgoritmit pystyvät normalisoimaan sanoja eli löytämään niiden alkumuodon sekä rakentamaan hypoteeseja sanoille, jotka eivät sisälly perussanakirjaan. Täystekstin indeksointijärjestelmän avulla voit luoda kompaktin hakemiston ja etsiä nopeasti sen perusteella loogisia operaattoreita.

Yandex on suunniteltu toimimaan tekstien kanssa paikallisesti ja sisällä maailmanlaajuinen verkosto, ja se voidaan myös liittää moduulina muihin järjestelmiin.

Suosittujen hakukoneiden luettelo ei tietenkään lopu tähän - niiden lukumäärä on satoja. Olen kuitenkin varma, että nämä ovat enemmän kuin tarpeeksi, jotta voit työskennellä englanninkielisten sivustojen kanssa.

On huomattava, että melkein kaikki yllä esitetyt hakukoneet voivat toimia kyrillisten aakkosten kanssa. Mutta etsiäksesi tietoa venäjäksi, suosittelen silti kotimaisia ​​hakukoneita:

On muitakin venäjänkielisiä hakukoneita, mutta nämä ovat suosituimpia, etenkin kaksi ensimmäistä.

Riisi. 4.1. Hakukone Googlen järjestelmä

Kirjasta Countering Black PR Internetissä kirjoittaja Kuzin Aleksanteri Vladimirovitš

Hakukoneet ja hakemistot työkaluina "taistelu"-sivustojen edistämiseen ja niiden täyttämiseen sisällöllä Tämä osio on kirjoitettu käyttämällä joitakin kirjan "Internet Intelligence: A Guide to Action" materiaaleja

Kirjasta Blogi. Luo ja mainosta kirjoittaja Juštšuk Jevgeni Vladimirovitš

Hakukoneet ja hakemistot työkaluina blogin edistämiseen ja sisällöllä täyttämiseen Puhumme blogisisällön automatisoinnista mielenkiintoista sisältöä, eli kuinka löytää materiaalia blogiin nopeammin kuin muut bloggaajat. On epätodennäköistä, että useimmat lukijat pystyvät siihen

Kirjasta Internet Intelligence [Guide to Action] kirjoittaja Juštšuk Evgeniy Leonidovich

Yrityksen nimeen liittyvien kyselyjen laatiminen hakukoneissa

Kirjasta Tietokoneen kokoaminen omin käsin kirjoittaja Vatamanyuk Aleksander Ivanovitš

5.2. Suosittuja käyttöjärjestelmiä Niitä on monia käyttöjärjestelmät, ja jokaisella on oma levinneisyysaste. Jotkut järjestelmät ovat parempia verkkokäyttöön, kun taas toiset ovat parempia akun kesto, koska voit yhdistää kaiken menettämättä suorituskykyä ja

Kirjasta Win2K FAQ (v. 6.0) kirjailija Shashkov Aleksei

(6.10) On sekoitettu verkko, netware ja NT, asiakkaat W2kPro ja W98. Koneet, joissa on W98, eivät voi kirjautua sisään koneisiin, joissa on W2k. Tämän ongelman ratkaisemiseksi sinun on sitouduttava protokollien avulla: IPX/SPX vain Novell-asiakkaaseen, TCP/IP vain Microsoft asiakas. Voit tehdä tämän kiinteistöissä verkkoyhteyksiä valikosta

Kirjasta Abstrakti, työselostus, tutkinto tietokoneella kirjoittaja

Hakukoneet Jos haluat saada valikoiman materiaaleja tarkemmasta ja erityisiä tietoja, parempaa käyttöä hakukoneet. Hakukone on monimutkainen erityisiä ohjelmia netistä etsimiseen. Ne ovat vapaita luontaisista haitoista

Kirjasta Internet. Uusia mahdollisuuksia. Temppuja ja tehosteita kirjoittaja Balovsyak Nadezhda Vasilievna

Miten hakukoneet toimivat ja miten kyselyt muodostetaan oikein Nykyaikaiset hakukoneet ovat joukko erityisiä ohjelmia, jotka on suunniteltu etsimään tietoa Internetistä. Niiden toimintaperiaate on seuraava: aika ajoin

Kirjasta Internet 100%. Yksityiskohtainen opetusohjelma: aloittelijasta ammattilaiseen kirjoittaja Iloinen Aleksei Anatolievitš

Suositut online-elokuvateatterit Yksi suosituista ilmaisista online-elokuvateattereista sijaitsee osoitteessa http://vsekino.tv (Kuva 7.5). Riisi.

Kirjasta Internet - helppoa ja yksinkertaista! kirjoittaja Aleksandrov Egor

Suositut hakemistot Maailman suosituin ja täydellisin hakemisto on epäilemättä englanninkielinen Yahoo! (http://dir.yahoo.com) (Kuva 4.4). Riisi. 4.4. Suosituin linkkihakemisto Yahoo On huomattava, että hakemistoja yhdistetään usein hakukoneiden kanssa, joten monet niistä ovat mukana

Kirjasta Yandex kaikille kirjailija Abramzon M. G.

1.11.3. Suositut viestit Listan päivitys Suositut postaukset tapahtuu kerran päivässä. Tällaisia ​​tietueita valitaan useita kymmeniä, mutta vain muutama suosituimmista lähetetään Etusivu Haku-osio. Loput näet linkistä Total Records.

Kirjasta Kuinka etsiä ja ladata tiedostoja Internetistä kirjailija Reitman M.A.

1.11.6. Suositut luokat Jos ennen tätä puhuimme bloggaajien sijoituksesta, palveluista ja suosituimmista postauksista, puhumme nyt luokista. Heidän viestinsä luokan määrittävät niiden kirjoittajat. Miten, miksi, miksi - riippuu aiheesta, muodista, mielialasta. kuitenkin

Kirjasta First Steps with Windows 7. A Beginner's Guide kirjoittaja Kolisnichenko Denis N.

1.11.7. Suosittuja uutisia Yandex-palvelun uutisluokitus on korostettu erillisenä lohkona muiden indikaattoreiden joukossa. Uutiset. Nämä ovat uutisia, joista keskustellaan eniten blogeissa. Suosittujen uutisten lista päivitetään 5-10 minuutin välein. Jos seuraat linkkiä osoitteesta

Kirjasta Meet the Laptop kirjailija Zhukov Ivan

Suositut seurantalaitteet Maailmassa on monia torrent-seurantalaitteita, joiden palveluita voit käyttää. Seuraavat ovat suosituimmat seurantalaitteet.? http://lostfilm.tv on tv-sarjoihin erikoistunut seurantaohjelma. Pääsääntöisesti julkaisuissa on ammattimainen jälkiäänitys ja laatu

Kirjasta IT-turvallisuus: kannattaako yritystä riskeerata? Kirjailija: Linda McCarthy

10.2.1. Internetin hakukoneet sisältävät suuri määrä tiedot. Loppujen lopuksi kuka tahansa voi luoda verkkosivuston Internetiin, joten uusien sivustojen määrä kasvaa joka päivä. Hakukoneita käytetään etsimään Internetistä Hakukone on erityinen

Kirjailijan kirjasta

Suositut Internet-sovellukset ICQ (ICQ) ICQ on keskitetty pikaviestipalvelu. Palvelun käyttäjä (eli sinä) työskentelee asiakasohjelman (ns. "messenger") kanssa. Viestit lähetetään välittömästi. Voit myös

Kirjailijan kirjasta

Suositut Bugtraq-postituslistat Tämä luettelo käsittelee haavoittuvuuksia UNIX, kuinka niitä voidaan käyttää ja kuinka ne suljetaan. Sen tarkoituksena ei ole opettaa järjestelmien hakkeroimista, vaan pikemminkin kuinka löytää haavoittuvuuksia, jakaa tietoa niistä, miten

Pääelementti moderni Internet- Tämä hakukoneet tai hakukoneet, Yandex, Rambler, Google ja muut. Internetissä on meri erilaisia ​​tietoja, ja juuri hakukoneet auttavat käyttäjää löytämään tarvittavat tiedot nopeasti.

Oppikirjoissa tai tieteellisissä kirjoissa on luettelo tärkeistä termeistä - aakkosjärjestyksessä aihehakemisto tai indeksi. Hakemistossa luetellaan tämän kirjan tärkeimmät termit (avainsanat) ja sivunumerot, joilla ne esiintyvät.

Hakukoneiden työ perustuu samanlainen periaate. Pohjimmiltaan, kun käyttäjä syöttää hakusanan (avainsanan), hän siirtyy Internetin aihehakemistoon eli luetteloon kaikista Internetin avainsanoista sekä sivuista, joilla ne esiintyvät.

Hakukone on ohjelma, joka kokoaa ja tallentaa Internet-aihehakemiston (indeksin) ja löytää siitä myös tietyt avainsanat.

Indeksin laatimisen ja sen etsimisen vaiheet:

Internet-sivujen osoitteiden kerääminen

Alkuperäinen luettelo verkkosivujen osoitteista ladataan hakukoneeseen. Sitten hakukone, tai pikemminkin sen komponenttihakurobotti, kerää kaiken hypertekstilinkkejä jokaisen kanssa annetut sivut muille sivuille ja lisää kaikki linkeistä löytyneet osoitteet alkuperäiseen osoiteluetteloonsa. Näin ollen alkuperäinen lista kasvaa nopeasti.

Sivujen pumppaus pois

Hakurobotti tai hämähäkki indeksoi sivuja, lataa niiltä tekstimateriaalia ja tallentaa sen tietokoneidensa levyille ja siirtää sen sitten hakemistorobotille indeksointia varten.

Indeksin kokoaminen

Aluksi indeksoidun sivun teksti poistetaan kaikista ei-tekstielementeistä (grafiikka, merkinnät HTML-kieli jne.). Seuraavaksi tekstistä valitut sanat pelkistetään niiden varsiksi tai nimikirjoiksi. Kerätyt sanarungot on järjestetty Aakkosjärjestys osoittaen sivunumerot, missä peruste on otettu, ja esiintymisnumerot, missä oli tämän sivun tukikohta.

Hae

Kun käyttäjä kirjoittaa sanan kyselymerkkijonoon, hakukone käyttää hakemistoa. Etsii kaikki aiheeseen liittyvät sivunumerot annettu sana ja näyttää käyttäjälle hakutuloksen (sivuluettelon).

Hakukoneen laatu

Hakulaadun synonyymi on se merkityksellisyys. Hakukoneiden suhteen sana asiaankuuluvaa(liittyy asiaan) on melkein päätermi. Hakukoneen hakutulosten relevanssi tarkoittaa, että kyseiset tulokset sisältävät sivuja, jotka liittyvät hakukyselyn merkitykseen. Osuvuus tai haun laatu on melko monimutkainen asia.

Yksi vielä tärkeä kriteeri hakukoneen laatu on tarkkuus.

Tarkkuus on tulosten laadun mitta, se lasketaan määränä asiaankuuluvat sivut hakutuloksissa palautettujen sivujen kokonaismäärässä. Tärkeää ei kuitenkaan ole vain haun tarkkuus, vaan myös vaihtelevat Hakutulokset.

Rangeissa– hakutulosten järjestys osuvuuden mukaan.

On mahdotonta sanoa, mikä hakukone on parempi. Käyttäjälle parempi hakukone, joka näyttää osuvimmat ja tarkkoja tuloksia. Sivuston omistajalle hyvä kone on sellainen, jossa sivusto on selvästi näkyvissä ja joka tuo suurin luku kohdevieraille.