Tehokas hakukone. Hakukoneen työ ja verkkovastaavien toimet. Miten hakukone toimii?

Aikamme suosituin verkkopalvelu on hakukone. Kaikki on ymmärrettävää täällä, koska ajat, jolloin ensimmäisten Internet-käyttäjien edustajat saattoivat tarkkailla uusia tuotteita Internetissä, ovat kauan menneet.

Tietoa ilmestyy ja kerääntyy niin paljon, että ihmisen on erittäin vaikea löytää juuri sitä, mitä hän tarvitsee. Kuvittele, miltä tuntuisi etsiä Internetistä, jos keskivertokäyttäjän täytyisi etsiä tietoa Jumala tietää mistä. En ymmärrä tarkalleen missä, koska manuaalinen haku Et löydä paljon tietoa.

Hakukone, mikä se on?

On hyvä, jos käyttäjä tietää jo sivustoja, joilla saattaa olla tarvittavaa tietoa, mutta mitä tehdä muuten? Ihmisen elämän helpottamiseksi tarvittavien tietojen löytämisessä Internetistä keksittiin hakukoneet tai yksinkertaisesti hakukoneet. Hakukone toimii hyvin tärkeä toiminto, jota ilman Internet ei olisi sama kuin olemme tottuneet näkemään sen - tämä on tiedon etsimistä Internetistä.

Hakujärjestelmä- Tämä erityinen verkko solmu tai muu sivusto, joka tarjoaa käyttäjille heidän pyyntönsä perusteella hyperlinkkejä sivustojen sivuille, jotka vastaavat tiettyyn hakukyselyyn.

Hieman tarkemmin sanottuna se on tiedonhaku Internetistä, joka suoritetaan ohjelmiston ja laitteiston toiminnallisen sarjan sekä käyttäjien kanssa vuorovaikutukseen tarkoitetun verkkoliittymän ansiosta.

Ihmisten vuorovaikutusta varten hakukoneen kanssa luotiin verkkokäyttöliittymä, eli näkyvä ja ymmärrettävä kuori. Tämä hakukonekehittäjien lähestymistapa tekee haun helpommaksi monille ihmisille. Pääsääntöisesti haut tehdään Internetissä hakukoneiden avulla, mutta on myös hakujärjestelmiä FTP-palvelimille, tietyntyyppisille tavaroille. maailman laajuinen verkko tai uutisia tai muita hakuohjeita.

Haku voidaan suorittaa paitsi sivustojen tekstisisällön perusteella myös muun tyyppisillä tiedoilla, joita henkilö voi hakea: kuvia, videoita, äänitiedostoja jne.

Miten hakukone etsii?

Itse Internetistä hakeminen, kuten verkkosivujen selaaminen, on mahdollista Internet-selaimella. Vasta kun käyttäjä on määrittänyt kyselynsä hakupalkissa, itse haku suoritetaan suoraan.

Mikä tahansa hakukone sisältää ohjelmisto osa, johon koko hakukone perustuu, sitä kutsutaan hakukone- Tämä ohjelmistopaketti ja tarjoaa mahdollisuuden etsiä tietoa. Kun olet ottanut yhteyttä hakukoneeseen, ihmisen muodostuminen hakulauseke ja syöttämällä sen hakupalkkiin, hakukone luo sivun, jossa on luettelo hakutuloksista, hakukoneen mukaan osuvimmat sijaitsevat ylempänä.

Haun relevanssi - etsitään käyttäjän pyyntöön sopivimmat materiaalit ja lisätään niihin hyperlinkkejä hakutulossivulle, jossa on enemmän tarkkoja tuloksia muita pitempi. Itse tulosten jakautumista kutsutaan sivuston sijoitukseksi.

Miten hakukone siis valmistelee materiaalinsa julkaisua varten ja miten hakukone itse hakee tietoa? Tietojen keräämistä verkossa helpottaa jokaiselle hakukoneelle ainutlaatuinen robotti tai botti, jolla on myös useita muita synonyymejä, kuten indeksoija tai hämähäkki, ja itse hakujärjestelmän työ voidaan jakaa kolmeen vaiheeseen:

Hakukoneen toiminnan ensimmäinen vaihe sisältää sivustojen skannauksen maailmanlaajuinen verkosto ja kerätä itse omia palvelimia kopiot web-sivuista. Tämä muodostaa suuri määrä tietoja, joita ei ole vielä käsitelty ja jotka eivät sovellu hakutuloksiin.

Hakukoneen työskentelyn toinen vaihe muodostuu aiemmin, ensimmäisessä vaiheessa, sivustoilta saatujen tietojen järjestämiseen. Lajittelu suoritetaan siten, että mahdollisimman lyhyessä ajassa saadaan aikaan erittäin laadukas haku, jota käyttäjät hakukoneelta todella odottavat. Vaihe on nimeltään indeksointi, mikä tarkoittaa, että sivut ovat jo valmiit julkaisua varten ja nykyinen tietokanta katsotaan hakemistoksi.

Juuri kolmas vaihe määrittää hakutulokset, saatuaan pyynnön asiakkaaltaan, pyynnössä määritettyjen avainsanojen tai lähellä olevien avainsanojen perusteella. Tämä helpottaa pyynnön kannalta tärkeimpien tietojen valintaa ja sen myöhempää toimittamista. Koska tietoa on paljon, hakukone suorittaa sijoituksen algoritmiensa mukaan.
Parhaaksi hakukoneeksi katsotaan se, joka pystyy tarjoamaan aineistoa, joka vastaa parhaiten käyttäjän pyyntöön. Mutta myös täällä voi olla tuloksia, joihin sivustonsa mainostamisesta kiinnostuneet ihmiset vaikuttivat, vaikkakaan eivät aina, mutta ne näkyvät usein hakutuloksissa, mutta eivät pitkään.

Vaikka maailman johtajat on jo tunnistettu monilla alueilla, hakukoneet jatkavat laadukkaan hakunsa kehittämistä. Miten parempi haku he pystyvät tarjoamaan enemmän ihmisiä tulee käyttämään sitä.

Miten hakukonetta käytetään?

Mikä on hakukone ja miten se toimii, on jo selvää, mutta kuinka sitä käytetään oikein? Useimmilla sivustoilla on aina hakupalkki, ja sen vieressä on Etsi- tai Hae-painike. Hakuriville syötetään kysely, jonka jälkeen sinun on napsautettava hakupainiketta tai, kuten useammin, napsauta Enter-näppäin näppäimistöllä ja sekunneissa saat kyselyn tuloksen luettelon muodossa.

Mutta aina ei ole mahdollista saada oikeaa vastausta hakukyselyyn ensimmäisellä kerralla. Varmistaaksesi, että haluamasi etsiminen ei tule kipeäksi, sinun on laadittava hakukyselysi oikein ja noudatettava alla kuvattuja suosituksia.

Laadimme hakukyselyn oikein

Seuraavassa on vinkkejä hakukoneen käyttöön. Noudattamalla joitain temppuja ja sääntöjä etsiessäsi tietoa hakukoneesta saat mahdollisuuden saada haluttu lopputulos paljon nopeampi. Noudata näitä ohjeita:

  1. Sanojen oikea kirjoitusasu varmistaa enimmäismäärä vastaa haettua tietoobjekti(Vaikka nykyaikaiset hakukoneet ovat jo oppineet korjaamaan kirjoitusvirheet, tätä neuvoa ei pidä laiminlyödä).
  2. Käyttämällä synonyymejä kyselyssäsi voit kattaa laajemman hakualueen.
  3. Joskus kyselyn sanan muuttaminen voi tuoda parempia tuloksia.
  4. Tarkenna pyyntöäsi, käytä tarkkoja ilmaisuja, joiden pitäisi määritellä pääkohta Hae.
  5. Kokeile avainsanoja. Käyttö avainsanoja ja lauseet voivat auttaa määrittämään pääkohdan, ja hakukone palauttaa osuvamman tuloksen.

Hakukone on siis vain mahdollisuus löytää kiinnostavaa tietoa ja käyttää sitä yleensä täysin ilmaiseksi, oppia jotain, ymmärtää jotain tai tehdä itse oikeat johtopäätökset. Monet ihmiset eivät voi enää kuvitella elämäänsä ilman äänihaku, johon sinun ei tarvitse kirjoittaa tekstiä, sinun tarvitsee vain sanoa pyyntösi, ja tiedonsyöttölaite tässä on mikrofoni. Kaikki tämä osoittaa jatkuvaa kehitystä hakuteknologiat Internetissä ja niiden tarve.

Katsotaanpa Venäjän ja maailman suosituimpia hakukoneita.

Suosituimmat hakukoneet Venäjällä

Yandex

Yandex on eniten suosittu järjestelmä etsii tietoa RuNetistä. Se on turvallisuuden ykkönen! Valittiin 27 000 000 ihmistä.

"Yandex" venäläinen hakupalvelu ilmestyi vuonna 1997. Internetin venäjänkielisen osan kiistaton johtaja. Sillä on yksi maailman parhaista alueellisista hakujärjestelmistä. Syödä kyky löytää ihmisiä sosiaalisista verkostoista. Tämä järjestelmä sisältää valtavan määrän hyödyllisiä lisäyksiä:

  • Yandex.Disk
  • Kortit
  • Lento-, juna- ja bussiaikataulut
  • Sää ja paljon muuta.

Sillä on hyvä kysyntä naapurimaiden keskuudessa, koska palvelunhallinnassa huomioidaan IVY-maiden käyttäjien vaatimukset.

Mail

Mail.ru on lupaava Postipalvelu, joka näkyy suuri määrä faneja.

Ei kauan sitten se alkoi asemoida itsensä hakukoneeksi. Se voidaan asettaa oletuksena ladattaessa erilaisia ​​sovelluksia.

Aport

Melko yleinen hakukone Internetin venäjänkielisessä osassa. Palvelu on suosion mukaan toisella sijalla Venäjällä.


Aport-hakujärjestelmän edut:

  1. Venäjän kielen morfologia otetaan huomioon.
  2. Voit korostaa näytettyjen sanojen kontekstia.
  3. Hae luokan mukaan.
  4. Siellä on toiminto hakutulosten tarkentamiseksi palvelimien ja saatavilla olevien luetteloosioiden mukaan.
  5. Mikä tahansa pyyntö voidaan kääntää kielelle Englannin kieli ja takaisin.

Rambler

Edustaa ensimmäinen tiedonhakujärjestelmä, joka tuli saataville Venäjällä. Aiemmin se oli Yandexin tärkein kilpailija, koska se käyttää Yandex-hakutekniikkaa. Venäjän kielen morfologia otetaan huomioon. Se sijoittui arvostuksessamme kunniakkaalle kolmannelle sijalle.


Maailman suosituimmat hakukoneet

Google

Google on maailmanlaajuinen jättiläinen. Siksi ei ole yllättävää, että tämä hakukone muodostaa suurimman osan maailman liikenteestä.


Googlen hakukone

Erittäin yksinkertainen ja laadukas live-lähtö ja valtava määrä hyödyllisiä työkaluja:

  • Dokumentointi;
  • Blogit;
  • YouTube;
  • Sosiaalinen media;
  • Google+ ja paljon mielenkiintoista.

Baidu

Baidu on kiinalainen hakukone. Kiina on maan asutuin paikka. Se on myös mainittava kokonaisuudessaan suljettu pääsy World Wide Webiin.


Miljoonat ihmiset suosivat tätä "hakukonetta". Oletamme, että heillä ei yksinkertaisesti ole vaihtoehtoa, mutta siitä huolimatta Arvostelujen perusteella tämä järjestelmä on mielestäni erittäin mielenkiintoinen ja hyödyllistä tietoa.

Bing

Bing on Microsoftin hakukone. Kysyntää Euroopassa ja Yhdysvalloissa.


Googleen verrattuna, on erilainen vähäistä liikennettä. Asennettu nimellä tavallinen haku V .

Yahoo!

Nykyään se on luettelo resursseista ja "hakukone", joka on yhdistetty yhdeksi, palvelu toimii kuten itsenäinen projekti. Suosioltaan se sijoittui rankingissamme neljänneksi.

Yahoo-hakukoneen edut:

  1. Pystyy hakemaan erityyppistä tietoa venäjäksi.
  2. Käytetty hakemisto hyödyllisiä linkkejä verkostoitumaan resursseja eri maissa.

AltaVista

Toinen hakukehitys, joka etsii tarvittavat tiedot internetissä. Suosiotason ansiosta se sijoittui viidenneksi.

AltaVista-hakukoneen edut:

  1. Venäjänkieliselle tilalle on tuettu.

Lycos

Yhteinen hakemisto verkon resursseja. Sivusto perustuu hakukoneeseen sekä verkkoportaalien rubrikaattoriin. Tarjoaa linkkejä luettelon useisiin lokalisoituihin painoksiin. käytetty englannin kieli. Suosioltaan se on kuudentena listassamme.


Ukrainalainen hakukone Meta

Ukrainan alkuperän yhtenäinen hakujärjestelmä. Kuuluisuuden tason ansiosta se nousi seitsemänneksi.

Meta-hakukoneen edut:

  1. Palvelu ottaa huomioon sekä venäjän että ukrainan kielten morfologiset ominaisuudet.
  2. Tarvittaessa voit korostaa erilaisia ​​löydettyjä sanoja kontekstissa.
  3. Hakutulokset ja hakukyselyt voidaan myös kääntää venäjäksi, ukrainaksi ja englanniksi.

FTP-haku

"Tiedostojen hakujärjestelmä". Se on yksi Venäjän federaation sadasta suurimmasta FTP-palvelimesta. Suosion taso vastaa kahdeksatta sijaa.


Hei, rakkaat blogisivuston lukijat. , silloin sen harvat käyttäjät saivat tarpeekseen omista kirjanmerkeistään. Kuitenkin, kuten muistat, se tapahtui geometrisessa etenemisessä, ja hyvin pian siitä tuli vaikeampi navigoida kaikessa monimuotoisuudessaan.

Sitten ilmestyi hakemistoja (Yahoo, Dmoz ja muut), joihin niiden kirjoittajat lisäsivät ja lajittelivat erilaisia ​​​​sivustoja luokkiin. Tämä helpotti välittömästi globaalin verkon silloisten, ei vielä kovin lukuisten käyttäjien elämää. Monet näistä luetteloista ovat edelleen elossa.

Mutta jonkin ajan kuluttua heidän tietokantojensa koosta tuli niin suuri, että kehittäjät ajattelivat ensin haun luomista niihin ja sitten automatisoitu järjestelmä indeksoi kaikki Internet-sisältö, jotta se on kaikkien saatavilla.

Internetin venäjänkielisen segmentin tärkeimmät hakukoneet

Kuten ymmärrät, tämä idea toteutettiin hämmästyttävällä menestyksellä, mutta kaikki meni kuitenkin hyvin vain muutamalle valitulle yritykselle, jotka onnistuivat olemaan kadonneet Internetiin. Lähes kaikki ensimmäisellä aallolla ilmestyneet hakukoneet ovat nyt joko kadonneet, laantuneet tai menestyneet kilpailijat ovat ostaneet ne.

Hakukone on erittäin monimutkainen ja mikä tärkeintä, erittäin resursseja vaativa mekanismi (tämä ei tarkoita vain aineellisia resursseja, mutta myös ihminen). Näennäisen yksinkertaisen tai sen askeettisen Googlen analogin takana on tuhansia työntekijöitä, satoja tuhansia palvelimia ja monia miljardeja investointeja, jotka ovat välttämättömiä, jotta tämä kolossi voi jatkaa toimintaansa ja säilyttää kilpailukykynsä.

Markkinoille tulo nyt ja tyhjästä aloittaminen on enemmän utopiaa kuin todellinen yritysprojekti. Esimerkiksi yksi maailman rikkaimmista yrityksistä, Microsoft, on yrittänyt saada jalansijaa hakumarkkinoilla vuosikymmeniä, ja vasta nyt heidän hakukoneensa Bing alkaa pikkuhiljaa täyttää heidän odotuksiaan. Ja sitä ennen oli koko joukko epäonnistumisia ja takaiskuja.

Mitä voimme sanoa näille markkinoille pääsystä ilman erityisiä taloudellisia vaikutteita. Esimerkiksi kotimaisella hakukoneellamme Nigmalla on arsenaalissaan paljon hyödyllistä ja innovatiivista asiaa, mutta niiden liikenne on tuhansia kertoja pienempi kuin Venäjän markkinoiden johtajilla. Katso esimerkiksi päivittäistä Yandex-yleisöä:

Tältä osin voimme olettaa, että luettelo Runetin ja koko Internetin tärkeimmistä (parhaista ja onnekkaimmista) hakukoneista on jo muodostettu ja koko juoni on vain siinä, kuka lopulta nielee kenet tai kuinka heidän prosenttiosuutensa tulee jaetaan, jos ne kaikki selviävät ja pysyvät pinnalla.

Venäjän hakukonemarkkinat on hyvin selvästi näkyvissä, ja tässä voimme todennäköisesti erottaa kaksi tai kolme pääpelaajaa ja pari pientä pelaajaa. Yleisesti ottaen RuNetissä on kehittynyt melko ainutlaatuinen tilanne, joka ymmärtääkseni on toistunut vain kahdessa muussa maassa maailmassa.

Puhun siitä, että Googlen hakukone, joka tuli Venäjälle vuonna 2004, ei ole vieläkään kyennyt ottamaan johtajuutta. Itse asiassa he yrittivät ostaa Yandexia tänä aikana, mutta siellä ei toiminut, ja nyt "meidän Venäjämme" yhdessä Tšekin tasavallan ja Kiinan kanssa ovat paikkoja, joissa kaikkivaltias Google, jos ei voitettu, niin joka tapauksessa kohtasi vakavaa vastustusta.

Itse asiassa katso nykyinen tilanne joukosta parhaat hakukoneet Runet Kuka tahansa voi. Riittää, kun liität tämän URL-osoitteen osoitekenttä selaimesi:

Http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Tosiasia on, että useimmat heistä käyttävät .

Annetun URL-osoitteen syöttämisen jälkeen näet kuvan, joka ei ole kovin houkutteleva ja edullinen, mutta heijastaa hyvin asian ydintä. Kiinnitä huomiota viiteen parhaaseen hakukoneeseen, joista venäläiset sivustot saavat liikennettä:

Kyllä, tietenkään, kaikki venäjänkielisen sisällön resurssit eivät sijaitse tällä vyöhykkeellä. On myös SU ja RF, ja yleiset alueet, kuten COM tai NET, ovat täynnä Runetiin keskittyviä Internet-projekteja, mutta silti näyte on melko edustava.

Tämä riippuvuus voidaan esittää värikkäämmin, kuten esimerkiksi joku teki verkossa esityksensä:

Tämä ei muuta olemusta. Hakukoneita on pari johtajaa ja useita erittäin, hyvin kaukana jäljessä. Muuten, olen jo kirjoittanut monista heistä. Joskus voi olla varsin mielenkiintoista sukeltaa menestyksen historiaan tai päinvastoin syventää kerran lupaavien hakukoneiden epäonnistumisia.

Joten, tärkeysjärjestyksessä Venäjälle ja koko Runetille, luettelen ne ja annan heille lyhyet ominaisuudet:

    Google-haku on jo muodostunut monille planeetan ihmisille tutuksi – voit lukea siitä linkistä. Pidin "tulosten käännös" -vaihtoehdosta tässä hakukoneessa, kun sait vastauksia kaikkialta maailmasta, mutta omassasi äidinkieli, mutta valitettavasti se ei ole saatavilla nyt (ainakaan google.ru).

    Myös sisällä Viime aikoina Olen myös hämmästynyt heidän tuotoksensa laadusta ( Hakukone Tulossivu). Henkilökohtaisesti käytän aina ensin RuNetin peilihakukonetta (sillä on sellainen, no, olen tottunut siihen) ja vain jos en löydä sieltä ymmärrettävää vastausta, käännyn Googleen.

    Yleensä niiden julkaiseminen ilahdutti minua, mutta viime aikoina se on vain hämmentynyt - joskus tulee sellaista hölynpölyä. On mahdollista, että heidän kamppailunsa tulojen lisäämiseksi kontekstuaalista mainontaa ja asioiden jatkuva sekoittaminen huonontumiseksi SEO edistäminen voi johtaa päinvastaiseen lopputulokseen. Joka tapauksessa tällä hakukoneella on kilpailija RuNetissä, ja mikä kilpailija.

    Mielestäni on epätodennäköistä, että kukaan käy nimenomaan Go.mail.ru-sivustolla etsimään RuNetissä. Tästä syystä liikenne viihdeprojekteihin tästä hakukoneesta voi olla huomattavasti enemmän kuin kymmenen prosenttia. Tällaisten hankkeiden omistajien tulee kiinnittää huomiota tähän järjestelmään.

Internetin venäjänkielisen segmentin hakukonemarkkinoiden selkeiden johtajien lisäksi on kuitenkin useita muita toimijoita, joiden osuus on melko alhainen, mutta heidän olemassaolostaan ​​​​on kuitenkin sanottava muutama sana heistä.

Runet-hakukoneet toisesta porrasta


Internetin kattavat hakukoneet

Tekijä: suurelta osin koko Internetin mittakaavassa on vain yksi vakava pelaaja - Google. Tämä on kiistaton johtaja, mutta sillä on silti kilpailua.

Ensinnäkin se on edelleen sama Bing, jolla on esimerkiksi erittäin hyvä asema Amerikan markkinoilla, varsinkin kun sen moottoria käytetään myös kaikissa Yahoo-palveluissa (lähes kolmannes koko Yhdysvaltain hakumarkkinoista).

No, toiseksi, koska Kiinan käyttäjät muodostavat valtavan osuuden Internetin käyttäjien kokonaismäärästä, heidän päähakukone oikeutettu Baidu kiilautuu maailman Olympuksen paikkojen jakautumiseen. Hän syntyi vuonna 2000 ja nyt hänen osuutensa on noin 80 % koko Kiinan kansallisesta yleisöstä.

On vaikea sanoa mitään ymmärrettävämpää Baidusta, mutta Internetissä on mielipiteitä, että sen Top-paikat eivät ole vain pyynnön kannalta oleellisimmilla sivustoilla, vaan myös niistä, jotka maksoivat siitä (suoraan hakukoneeseen , eikä SEO-toimistoon). Tämä koskee tietysti ensisijaisesti kaupallisia listauksia.

Yleisesti ottaen tilastoja tarkasteltaessa käy selväksi, miksi Google suostuu helposti huonontamaan hakutuloksiaan vastineeksi lisäämään kontekstuaalisen mainonnan tuottoa. Itse asiassa he eivät pelkää käyttäjien vaihtuvuutta, koska useimmissa tapauksissa heillä ei ole minne mennä. Tilanne on hieman surullinen, mutta katsotaan mitä tapahtuu seuraavaksi.

Muuten, tehdäkseen optimoijien elämästä entistä vaikeampaa ja kenties säilyttääkseen tämän hakukoneen käyttäjien mielenrauhan, Google on viime aikoina käyttänyt salausta lähettäessään kyselyitä käyttäjien selaimista hakupalkkiin. Pian kävijälaskurien tilastoista ei enää voi nähdä, mitä kyselyitä Googlen käyttäjät ovat tulleet luoksesi.

Tietenkin tässä julkaisussa mainittujen hakukoneiden lisäksi on tuhansia muita - alueellisia, erikoistuneita, eksoottisia jne. Niiden kaikkien luetteloiminen ja kuvaileminen yhdessä artikkelissa olisi mahdotonta, eikä luultavasti välttämätöntä. On parempi sanoa muutama sana kuinka helppoa hakukoneen luominen on ja kuinka helppoa ja edullista on pitää se ajan tasalla.

Suurin osa järjestelmistä toimii samanlaisilla periaatteilla (lue tästä ja tuosta) ja pyrkii samaan päämäärään - antaa käyttäjille vastaus heidän kysymykseensä. Lisäksi tämän vastauksen on oltava olennainen (vastaa kysymystä), kattava ja, mikä ei ole vähäistä, olennainen (ensimmäisen tuoreuden mukaan).

Tämän ongelman ratkaiseminen ei ole niin helppoa, varsinkin kun otetaan huomioon, että hakukoneen on analysoitava miljardien Internet-sivujen sisältö lennossa, karsittava tarpeettomat pois ja muodostettava jäljelle jääneistä lista (ongelma), jossa eniten sopivat vastaukset käyttäjän kysymykseen tulevat näkyviin ensin.

Tämä erittäin monimutkainen tehtävä ratkaistaan ​​keräämällä alustavasti tietoa näiltä sivuilta erilaisilla indeksointirobotit. He keräävät linkkejä jo vierailluilta sivuilta ja lataavat niistä tietoa hakukoneen tietokantaan. On botteja, jotka indeksoivat tekstiä (tavallinen ja nopea robotti, joka elää uutisista ja usein päivitetyistä resursseista, jotta uusimmat tiedot näkyvät aina tuloksissa).

Lisäksi on robotteja, jotka indeksoivat kuvia (niiden myöhempää tulostamista varten), faviconeja, sivustopeilejä (niiden myöhempää vertailua ja mahdollista liimaamista varten), botteja, jotka tarkistavat Internet-sivujen toimivuuden, joita käyttäjät tai verkkovastaaville tarkoitettujen työkalujen kautta voi lukea aiheesta ja) .

Itse indeksointiprosessi ja sitä seuraava indeksitietokantojen päivitysprosessi ovat melko aikaa vieviä. Vaikka Google tekee tämän paljon nopeammin kuin kilpailijansa, ainakin Yandex, joka kestää viikon tai kaksi (lue siitä).

Yleensä hakukone jakaa Internet-sivun tekstisisällön yksittäisiä sanoja, joka johtaa perusperiaatteet, jotta voit sitten antaa oikeita vastauksia erilaisissa morfologisissa muodoissa esitettyihin kysymyksiin. Kaikki ylimääräinen vartalosarja mukana HTML-lomake tunnisteet, välilyönnit jne. asiat poistetaan ja loput sanat lajitellaan aakkosjärjestykseen ja niiden sijainti tässä asiakirjassa näkyy niiden vieressä.

Tällaista asiaa kutsutaan käänteiseksi hakemistoksi, ja sen avulla voit etsiä ei verkkosivujen, vaan hakukonepalvelimien strukturoidun tiedon perusteella.

Tällaisten palvelimien määrä Yandexille (joka etsii pääasiassa vain venäjänkielisiä sivustoja ja vähän ukrainan ja turkin kieliä) on kymmeniä tai jopa satoja tuhansia, ja Googlelle (joka tekee hakuja sadoilla kielillä) - miljoonia. .

Monilla palvelimilla on kopioita, jotka lisäävät sekä asiakirjojen turvallisuutta että nopeuttavat pyyntöjen käsittelyä (jakamalla kuormaa). Arvioi koko tämän talouden ylläpitokustannukset.

Kuormantasaaja lähettää käyttäjän pyynnön sille palvelinsegmentille, joka on tällä hetkellä vähiten ladattu. Sitten tehdään analyysi alueesta, josta hakukoneen käyttäjä lähetti pyyntönsä, ja siitä tehdään morfologinen analyysi. Jos samanlainen kysely on äskettäin syötetty hakupalkkiin, käyttäjälle annetaan tietoja välimuistista, jotta palvelimia ei ylikuormiteta uudelleen.

Jos pyyntöä ei ole vielä tallennettu välimuistiin, se siirretään alueelle, jossa hakukoneen hakemistotietokanta sijaitsee. Vastauksena saat luettelon kaikista Internet-sivuista, jotka liittyvät pyyntöön ainakin jossain määrin. Ei vain välittömiä esiintymiä, vaan myös muita morfologisia muotoja, samoin kuin jne. asioita.

Heidän on asetettava paremmuusjärjestykseen ja tässä vaiheessa algoritmi tulee peliin ( tekoäly). Itse asiassa käyttäjän pyyntö moninkertaistuu kaikkien kustannuksella mahdollisia vaihtoehtoja sen tulkintaa ja vastauksia moniin kyselyihin etsitään samanaikaisesti (käyttämällä kyselykielioperaattoreita, joista osa on tavallisten käyttäjien saatavilla).

Hakutuloksissa on pääsääntöisesti yksi sivu jokaiselta sivustolta (joskus enemmän). ovat nyt hyvin monimutkaisia ​​ja niissä otetaan huomioon monia tekijöitä. Lisäksi korjataan niitä ja käytetään, jotka manuaalisesti arvioivat viitesivustoja, jonka avulla voit säätää algoritmin toimintaa kokonaisuutena.

Yleisesti ottaen on selvää, että asia on pimeä. Voimme puhua tästä pitkään, mutta on jo selvää, että käyttäjien tyytyväisyys hakujärjestelmään saavutetaan, oi kuinka vaikeaa se on. Ja aina tulee olemaan niitä, jotka eivät pidä jostakin, kuten sinä ja minä, rakkaat lukijat.

Onnea sinulle! Nähdään pian blogisivuston sivuilla

Voit katsoa lisää videoita siirtymällä osoitteeseen
");">

Saatat olla kiinnostunut

Yandex People - kuinka etsiä ihmisiä sosiaalisista verkostoista Apometer - ilmainen palvelu seurata muutoksia hakutuloksissa ja hakukoneiden päivityksiä DuckDuckGo – hakukone, joka ei seuraa sinua
Kuinka tarkistaa Internetin nopeus - online testi liitännät tietokoneeseen ja puhelimeen, SpeedTest, Yandex ja muut mittarit
Yandex- ja Google-kuvat sekä haku kuvatiedoston mukaan Tineyessa (tinai) ja Googlessa

Hakukoneet(PS) ovat olleet pakollinen osa Internetiä jo jonkin aikaa. Nykyään ne ovat valtavia ja monimutkaisia ​​mekanismeja, jotka eivät ole vain työkalu minkä tahansa löytämiseen tarvittavat tiedot, mutta myös varsin jännittäviä liiketoiminta-alueita.


Monet haun käyttäjät eivät ole koskaan miettineet toimintaperiaatteitaan, käyttäjien pyyntöjen käsittelyä tai järjestelmien rakennetta ja toimintaa. Tämä materiaali auttaa optimointiin osallistuvia ihmisiä ymmärtämään hakukoneiden rakennetta ja päätoimintoja.

PS:n toiminnot ja käsite

Hakujärjestelmä on laitteisto- ja ohjelmistokompleksi, joka on suunniteltu suorittamaan hakutoiminto Internetissä ja joka vastaa käyttäjän pyyntöön, joka yleensä määritellään jonkin tekstilauseen (tai tarkemmin sanottuna hakukyselyn) muodossa ja antaa linkin listalle tietolähteet, toteutetaan asiaankuuluvuuden mukaan. Yleisimmät ja suuria järjestelmiä haku: Google, Bing, Yahoo, Baidu. Runetissa - Yandex, Mail.Ru, Rambler.

Tarkastellaan lähemmin hakukyselyn merkitystä ottamalla esimerkkinä Yandex-järjestelmä.

Käyttäjän on muotoiltava pyyntö täysin haun kohteen mukaan, mahdollisimman yksinkertaisesti ja lyhyesti. Haluamme esimerkiksi löytää tietoa tästä hakukoneesta: "Kuinka valita auto itsellesi". Voit tehdä tämän avaamalla kotisivu ja kirjoita hakukysely "miten valitaan auto". Sitten toimintomme rajoittuvat seuraamaan annettuja linkkejä verkon tietolähteisiin.




Mutta vaikka toimimme tällä tavalla, emme välttämättä saa tarvitsemaamme tietoa. Jos saimme tällaisen negatiivisen tuloksen, meidän on vain muotoiltava kyselymme uudelleen tai hakutietokannassa ei todellakaan ole hyödyllistä tietoa tätä lajia pyyntö (tämä on täysin mahdollista "kapealla" pyyntöparametrilla, kuten esimerkiksi "miten valita auto Anadyrissa").

Jokaisen hakukoneen perustehtävä on toimittaa ihmisille juuri sitä tietoa, jota he tarvitsevat. Ja on käytännössä mahdotonta opettaa käyttäjiä luomaan hakukoneille "oikean" tyyppisiä kyselyjä, eli lauseita, jotka vastaavat heidän toimintaperiaatteitaan.

Siksi erikoistuneet hakukonekehittäjät luovat työhönsä periaatteita ja algoritmeja, joiden avulla käyttäjät löytävät heitä kiinnostavan tiedon. Tämä tarkoittaa, että järjestelmän täytyy "ajatella" samalla tavalla kuin ihminen ajattelee etsiessään tarvittavaa tietoa Internetistä.

Kun hän kirjoittaa kyselynsä hakukoneeseen, hän haluaa löytää tarvitsemansa mahdollisimman helposti ja nopeasti. Saatuaan tuloksen käyttäjä tekee arvionsa järjestelmän toimivuudesta useiden kriteerien ohjaamana. Löysikö hän tarvitsemansa tiedot? Jos ei, kuinka monta kertaa hänen täytyi muotoilla kyselyn teksti uudelleen löytääkseen sen? Kuinka paljon todellista tietoa vastaanotettiinko hänet? Kuinka nopeasti hakukone käsitteli hänen pyyntönsä? Kuinka kätevät olivat Hakutulokset? Oliko haluttu tulos ensimmäinen vai oliko se 30. sija? kuinka paljon "roskaa" ( tarpeetonta tietoa) löytyi hyödyllisen tiedon kera? Löytyykö hänelle oleellista tietoa PS:n käytön aikana viikossa vai kuukaudessa?




Saadakseen oikeat vastaukset tällaisiin kysymyksiin hakukehittäjät parantavat jatkuvasti sijoituksen periaatteita ja sen algoritmeja, lisäävät niihin uusia ominaisuuksia ja toimintoja ja yrittävät kaikin keinoin nopeampaa työtä järjestelmät.

Hakukoneiden tärkeimmät ominaisuudet

Osoittakaamme haun tärkeimmät ominaisuudet:

Täydellisyys.

Täydellisyys on yksi tärkeimmistä haun ominaisuuksista, se on kyselylle löydettyjen lukujen suhde tietoasiakirjat niiden kokonaismäärään Internetissä liittyen tämä pyyntö. Esimerkiksi Internetissä on 100 sivua lauseella "miten valita auto", ja samaan pyyntöön valittiin vain 60 sivua, sitten tässä tapauksessa haun täydellisyys on 0,6. On selvää, että mitä täydellisempi itse haku, sitä suurempi on todennäköisyys, että käyttäjä löytää juuri tarvitsemansa asiakirjan, tietenkin, jos se on olemassa.

Tarkkuus.

Toinen hakukoneen päätehtävä on tarkkuus. Se määrittää, missä määrin Internetistä löydetyt sivut vastaavat käyttäjän pyyntöä. Esimerkiksi, jos avainlauseella "miten valita auto" on sata asiakirjaa, puolet niistä sisältää tämän lauseen ja loput vain seuraavat sanat (miten valitaan autoradio oikein ja asennetaan se autoon ), hakutarkkuus on 50/100 = 0,5.

Mitä tarkempi haku, sitä pikemminkin käyttäjä löytää tarvitsemansa tiedot, sitä vähemmän erilaista "roskaa" löytyy tulosten joukosta, mitä vähemmän löydettyjä asiakirjoja ei vastaa pyynnön tarkoitusta.

Merkityksellisyys.

Tämä on merkittävä osa hakua, jolle on ominaista aika, joka kuluu siitä hetkestä, kun tiedot julkaistaan ​​Internetissä, kunnes ne saapuvat hakukoneen hakemistotietokantaan.

Esimerkiksi päivä sen jälkeen, kun tiedot poistumisesta tulevat näkyviin uusi iPad, monet käyttäjät kääntyivät hakuun asianmukaisilla kyselyillä. Useimmissa tapauksissa tiedot tästä uutisesta ovat jo saatavilla haussa, vaikka sen ilmestymisestä on kulunut hyvin vähän aikaa. Tämä johtuu siitä, että suurilla hakukoneilla on "nopea tietokanta", joka päivitetään useita kertoja päivässä.

Hakunopeus.

Tällainen toiminto, kuten hakunopeus, liittyy läheisesti niin sanottuun "kuormituskestävyyteen". Valtava määrä ihmisiä käyttää hakua joka sekunti. Tässä sekä hakukoneen että käyttäjän intressit ovat täysin samat: vierailija haluaa saada tuloksia mahdollisimman nopeasti, ja hakukoneen on käsiteltävä hänen pyyntönsä mahdollisimman nopeasti, jotta se ei hidasta myöhempien pyyntöjen käsittelyä.

Näkyvyys.

Tulosten visuaalinen esittäminen on haun mukavuuden tärkein elementti. Monissa kyselyissä hakukone löytää tuhansia ja joissakin tapauksissa miljoonia erilaisia ​​asiakirjoja. Epäselvän muotoilun vuoksi avainsanoja haun tai sen epätarkkuuden vuoksi edes ensimmäisillä kyselytuloksilla ei aina ole vain tarvittavat tiedot.

Tämä tarkoittaa, että henkilön on usein suoritettava oma haku annettujen tulosten joukossa. Hakutulossivujen erilaiset osat auttavat sinua navigoimaan hakutuloksissa.

Hakukoneiden kehityksen historia

Kun Internet alkoi kehittyä, sen säännöllisten käyttäjien määrä oli pieni ja käytettävissä olevan tiedon määrä suhteellisen pieni. Periaatteessa vain tutkimusalojen asiantuntijoilla oli pääsy tähän verkkoon. Tuolloin tiedonhakutehtävä ei ollut niin kiireellinen kuin nyt.

Yksi ensimmäisistä tavoista järjestää laajat tietoresurssit oli sivustohakemistojen luominen, ja niihin johtavia linkkejä alettiin ryhmitellä aiheittain. Ensimmäinen projekti oli Yahoo.com-resurssi, joka avattiin keväällä 1994. Myöhemmin, kun Yahoo-hakemiston sivustojen määrä kasvoi merkittävästi, hakuvaihtoehto lisättiin tarvittavat tiedot katalogin mukaan. Se ei ollut vielä täydellinen hakukone, koska tällaisen haun laajuus rajoittui vain siihen sisältyviin sivustoihin tämä luettelo, eikä aivan kaikkia Internetin resursseja. Linkkihakemistoja käytettiin aiemmin laajalti, mutta nykyään ne ovat lähes kokonaan menettäneet suosionsa.

Loppujen lopuksi jopa nykyiset luettelot, jotka ovat kooltaan valtavat, sisältävät tietoa vain pienestä osasta Internetin sivustoja. Maailman tunnetuimmassa ja suurimmassa hakemistossa on tietoa viideltä miljoonalta sivustolta, kun taas Googlen tietokanta sisältää tietoja yli 25 miljardilta sivulta.




Ensimmäinen todellinen hakukone oli WebCrawler, joka ilmestyi vuonna 1994.

Seuraavana vuonna AltaVista ja Lycos ilmestyivät. Lisäksi ensimmäinen oli tiedonhaun johtaja erittäin pitkään.




Vuonna 1997 Sergey Brin loi yhdessä Larry Pagen kanssa auton Google haku tutkimusprojektina Stanfordin yliopistossa. Nykyään se on Google, maailman suosituin ja suosituin hakukone.




Syyskuussa 1997 julkistettiin (virallisesti) Yandex PS, joka tällä hetkellä on RuNetin suosituin hakukone.




Mukaan Syyskuu 2015, hakukoneiden osuudet maailmassa jakautuvat seuraavasti:
  • Google - 69,24 %;
  • Bing - 12,26 %;
  • Yahoo! - 9,19 %;
  • Baidu - 6,48 %;
  • AOL - 1,11 %;
  • Kysy - 0,23 %;
  • Kiihottaa - 0,00 %


Mukaan joulukuuta 2016, osuudet hakukoneista Runetissa:

  • Yandex - 48,40 %
  • Google - 45,10 %
  • Search.Mail.ru - 5,70%
  • Rambler - 0,40 %
  • Bing - 0,30 %
  • Yahoo - 0,10 %

Miten hakukone toimii

Venäjällä pääjärjestelmä haku on Yandex, sitten Google ja sitten [email protected]. Kaikki suuria järjestelmiä hauilla on oma rakenne, joka on hyvin erilainen kuin muut. Mutta silti on mahdollista tunnistaa kaikille hakukoneille yhteiset peruselementit.

Indeksointimoduuli.

Tämä komponentti koostuu kolmesta robottiohjelmasta:

Hämähäkki(englanniksi spider) on ohjelma, joka on suunniteltu lataamaan web-sivuja. "Spider" latautuu tietty sivu, poimimalla samalla kaikki linkit siitä. Ladataan html-koodi melkein joka sivulta. Tätä varten robotit käyttävät HTTP-protokollia.




"Spider" toimii seuraavasti. Robotti lähettää palvelimelle pyynnön "get/path/document" ja muita komentoja HTTP-pyyntö. Vastauksena robottiohjelma vastaanottaa tekstivirran, joka sisältää palvelutyyppistä tietoa ja tietysti itse asiakirjan.
  • ladatun sivun URL-osoite;
  • päivämäärä, jolloin sivu on ladattu;
  • palvelimen http-vastausotsikko;
  • html-koodi, sivun "runko".
Indeksoija("matkustava" hämähäkki). Tämä ohjelma vierailee automaattisesti kaikissa sivulla olevissa linkeissä ja myös korostaa ne. Sen tehtävänä on päättää minne hämähäkin pitäisi seuraavaksi mennä näiden linkkien tai tietyn osoiteluettelon perusteella.

Indeksoija(robotin indeksointiohjelma) on ohjelma, joka analysoi hämähäkkien lataamia sivuja.



Indeksoija jäsentää sivun kokonaan sen komponenttielementeiksi ja analysoi ne käyttämällä omia morfologisia ja leksikaalisia algoritmejaan.

Analyysi tehdään sivun eri osissa, kuten otsikoissa, tekstissä, linkeissä, tyylissä ja rakenteellisissa ominaisuuksissa, html-tunnisteet jne.

Näin ollen indeksointimoduuli mahdollistaa linkkien seuraamisen annettu määrä resurssit, lataussivut, ote vertailumassa uusille sivuille vastaanotetuista asiakirjoista ja analysoida niitä yksityiskohtaisesti.

Tietokanta

Tietokanta(tai hakukonehakemisto) on tiedontallennuskompleksi, tietojoukko, johon kunkin indeksointimoduulin käsittelemän ja ladatun asiakirjan muunnetut parametrit tallennetaan tietyllä tavalla.

Hakupalvelin

Tämä on eniten tärkeä elementti koko järjestelmää, koska haun nopeus ja tietysti laatu riippuvat suoraan sen toiminnallisuuden taustalla olevista algoritmeista.

Hakupalvelin toimii näin:

  • Käyttäjältä tuleva pyyntö on morfologisen analyysin kohteena. Tietoympäristö mikä tahansa tietokannassa saatavilla oleva dokumentti luodaan (se näytetään myöhemmin katkelmana, eli tätä pyyntöä vastaavana tekstikenttänä).
  • Vastaanotettu data lähetetään muodossa syöttöparametreja erikoistunut ranking-moduuli. Ne käsitellään kaikille asiakirjoille, ja tämän seurauksena jokaiselle tällaiselle asiakirjalle lasketaan oma luokitus, joka kuvaa tällaisen asiakirjan merkitystä käyttäjän pyynnöstä ja muita komponentteja.
  • Käyttäjän määrittämien olosuhteiden mukaan tätä luokitusta voidaan hyvin muuttaa muilla.
  • Sitten muodostetaan itse katkelma, ts. Jokaisen löydetyn asiakirjan otsikko, kyselyä parhaiten vastaava tiivistelmä ja linkki tähän asiakirjaan poimitaan vastaavasta taulukosta ja löydetyt sanamuodot ja sanat korostetaan.
  • Tuloksena saadun haun tulokset välitetään sen suorittaneelle sivun muodossa, jolla hakutulokset (SERP) näytetään.
Kaikki nämä elementit liittyvät läheisesti toisiinsa ja toimivat keskenään, vuorovaikutuksessa muodostaen erillisen, mutta melko monimutkaisen mekanismin PS:n toiminnalle, mikä vaatii valtavia resursseja.

Internet on monille käyttäjille välttämätön, jotta he voivat saada vastauksia kysymyksiinsä.

Jos hakukoneita ei olisi, käyttäjien olisi etsittävä itsenäisesti tarvitsemiaan sivustoja, muistettava ne ja kirjoitettava ne muistiin. Monissa tapauksissa sopivan löytäminen "manuaalisesti" olisi erittäin vaikeaa ja usein yksinkertaisesti mahdotonta.

Hakukoneet tekevät kaiken tämän rutiinityön verkkosivuilla olevien tietojen etsimiseksi, tallentamiseksi ja lajitteluksi puolestamme.

Aloitetaan kuuluisista Runet-hakukoneista.

Internet-hakukoneet venäjäksi

1) Aloitetaan kotimaisesta hakukoneesta. Yandex ei toimi vain Venäjällä, vaan myös Valko-Venäjällä ja Kazakstanissa, Ukrainassa ja Turkissa. Yandex on myös englanniksi.

2) Hakukone Google on saapunut meille Amerikasta, on venäjänkielinen lokalisointi:

3) Kotimainen hakukone Mail ru, joka edustaa samanaikaisesti sosiaalinen verkosto VKontakte, Odnoklassniki, myös My World, kuuluisa Answers Mail.ru ja muut projektit.

4) Älykäs hakukone

Nigma (Nigma) http://www.nigma.ru/

Syyskuun 19. päivästä 2017 lähtien nigma "älyllinen" ei ole toiminut. Se ei enää kiinnostanut sen tekijöitä, ja he siirtyivät käyttämään CocCoc-nimistä hakukonetta.

5) Kuuluisa yritys Rostelecom on luonut Sputnik-hakukoneen.

On Sputnik-niminen hakukone, joka on suunniteltu erityisesti lapsille ja josta kirjoitin.

6) Rambler oli yksi ensimmäisistä kotimaisista hakukoneista:

Maailmassa on muitakin kuuluisia hakukoneita:

  • Bing,
  • Yahoo!,
  • DuckDuckGo,
  • Baidu,
  • Ecosia,

Yritetään selvittää, miten hakukone toimii, eli miten sivustot indeksoidaan, analysoidaan indeksointituloksia ja luodaan hakutuloksia. Hakukoneiden toimintaperiaatteet ovat suunnilleen samat: tiedon etsiminen Internetistä, sen tallentaminen ja lajittelu toimitettaviksi vastauksena käyttäjien pyyntöihin. Mutta hakukoneiden käyttämät algoritmit voivat vaihdella suuresti. Nämä algoritmit pidetään salassa ja niiden paljastaminen on kielletty.

Syöttämällä sama kysely sisään hakumerkkijonoja eri hakukoneilla, saatat saada erilaisia ​​vastauksia. Syynä on se, että kaikki hakukoneet käyttävät omia algoritmejaan.

Hakukoneiden tarkoitus

Ensinnäkin sinun on tiedettävä, että hakukoneet ovat kaupalliset järjestöt. Heidän tavoitteenaan on tuottaa voittoa. Voit saada voittoa kontekstuaalisesta mainonnasta, muun tyyppisestä mainonnasta ja nostamalla tarvittavia sivustoja hakutulosten kärkeen. Yleisesti ottaen tapoja on monia.

Se riippuu yleisön koosta, eli kuinka monta ihmistä käyttää tätä hakukonetta. Mitä suurempi yleisö, sitä lisää mainoksia näytetään ihmisille. Näin ollen tämä mainonta maksaa enemmän. Hakukoneet voivat kasvattaa yleisöään omaa mainontaa, sekä houkutella käyttäjiä parantamalla heidän palveluidensa laatua, algoritmeja ja hakumukavuutta.

Tärkein ja vaikein asia tässä on täysin toimivan hakualgoritmin kehittäminen, joka tarjoaisi asiaankuuluvia tuloksia useimpiin käyttäjien pyyntöihin.

Hakukoneen työ ja verkkovastaavien toimet

Jokaisella hakukoneella on oma algoritminsa, jonka on otettava huomioon valtava määrä erilaisia ​​tekijöitä kun analysoit tietoja ja kokoat tuloksia käyttäjän pyynnöstä:

  • tietyn sivuston ikä,
  • verkkosivuston verkkotunnuksen ominaisuudet,
  • sivuston sisällön laatu ja sen tyypit,
  • navigoinnin ja sivustorakenteen ominaisuudet,
  • käytettävyys (mukavuus käyttäjille),
  • käyttäytymistekijät (hakukone voi määrittää, löysikö käyttäjä etsimäänsä sivustolta vai palasiko käyttäjä uudelleen hakukoneeseen ja etsii sieltä uudelleen vastausta samaan kyselyyn)
  • jne.

Kaikki tämä on välttämätöntä juuri siksi, että tulokset käyttäjän pyynnöstä ovat mahdollisimman relevantteja ja täyttävät käyttäjän pyynnöt. Samaan aikaan hakukoneiden algoritmit muuttuvat ja jalostuvat jatkuvasti. Kuten he sanovat, täydellisyydellä ei ole rajaa.

Toisaalta verkkovastaavat ja optimoijat keksivät jatkuvasti uusia tapoja mainostaa sivustojaan, jotka eivät aina ole rehellisiä. Hakukonealgoritmin kehittäjien tehtävänä on tehdä siihen muutoksia, jotka eivät salli epärehellisten optimoijien "huonojen" sivustojen ilmestymistä TOP:iin.

Miten hakukone toimii?

Puhutaan nyt siitä, kuinka hakukone todella toimii. Se koostuu vähintään kolmesta vaiheesta:

  • skannaus,
  • indeksointi,
  • vaihtelevat.

Internetin sivustojen määrä on yksinkertaisesti tähtitieteellistä. Ja jokainen sivusto on tietoa, tiedon sisältö, joka on luotu lukijoille (eläville ihmisille).

Skannaus

Tämä on hakukone, joka vaeltelee Internetissä keräämään uutta tietoa, analysoimaan linkkejä ja etsimään uutta sisältöä, jota voidaan käyttää palaamaan käyttäjälle vastauksena hänen pyyntöihinsä. Skannausta varten hakukoneilla on erityisiä robotteja nimeltä hakurobotteja tai hämähäkkejä.

Hakurobotit ovat ohjelmia, jotka automaattinen tila vierailla verkkosivuilla ja kerätä niistä tietoja. Indeksointi voi olla ensisijainen (robotti vierailee uudella sivustolla ensimmäistä kertaa). Kun tiedot on kerätty alustavasti sivustolta ja syötetty hakukoneen tietokantaan, robotti alkaa vierailla sivuillaan säännöllisin väliajoin. Jos muutoksia on tapahtunut (lisätty uutta sisältöä, vanha poistettiin), hakukone tallentaa kaikki nämä muutokset.

päätehtävä etsi hämähäkki– etsi uutta tietoa ja lähetä se hakukoneeseen käsittelyn seuraavaa vaihetta eli indeksointia varten.

Indeksointi

Hakukone voi etsiä tietoa vain niiden sivustojen joukosta, jotka jo sisältyvät sen tietokantaan (indeksoi se). Jos indeksointi on prosessi, jossa etsitään ja kerätään tietoja, jotka ovat saatavilla tietyllä sivustolla, indeksointi on prosessi, jossa nämä tiedot syötetään hakukoneen tietokantaan. Tässä vaiheessa hakukone päättää automaattisesti, syöttääkö se tietokantaansa tämän tai toisen tiedon ja minne ne syötetään, mihin tietokannan osioon. Esimerkiksi Google indeksoi melkein kaikki robottiensa Internetistä löytämät tiedot, kun taas Yandex on nirsompi eikä indeksoi kaikkea.

Uusien sivustojen kohdalla indeksointivaihe voi olla pitkä, joten hakukoneiden vierailijat voivat odottaa uusia sivustoja pitkään. A uusi tieto, joka näkyy vanhoilla, hyvin mainostetuilla sivustoilla, voidaan indeksoida melkein välittömästi ja päästä melkein välittömästi "hakemistoon", eli hakukoneen tietokantaan.

Rangeissa

Ranking on aiemmin indeksoitujen ja tietyn hakukoneen tietokantaan syötettyjen tietojen järjestys sijoituksen mukaan, eli mitä tietoa hakukone näyttää käyttäjilleen ensiksi ja mitä tietoja sijoitetaan " sijoitus” alemmaksi. Sijoitus voidaan katsoa sen asiakkaan, käyttäjän, hakukonepalvelun vaiheen ansioksi.

Hakukonepalvelimilla käsitellään vastaanotettua tietoa ja tuotetaan tuloksia valtavalle valikoimalle kaikenlaisia ​​kyselyitä. Tässä hakukonealgoritmit tulevat peliin. Kaikki tietokantaan sisältyvät sivustot on luokiteltu aiheittain ja aiheet on jaettu kyselyryhmiin. Jokaiselle pyyntöryhmälle voidaan laatia alustava numero, jota muokataan myöhemmin.