Etsi tietoa venäjäksi. Omat tulokset ja suodatinkuplat

Hakukonearkkitehtuuri sisältää yleensä:

Tietosanakirja YouTube

    1 / 5

    ✪ Oppitunti 3: Miten hakukone toimii. SEO:n esittely

    ✪ Hakukone sisältä

    ✪ Shodan - musta Google

    ✪ CHEBURASHKA-hakukone korvaa Googlen ja Yandexin Venäjällä

    ✪ Oppitunti 1 – Miten hakukone toimii

    Tekstitykset

Tarina

Kronologia
vuosi Järjestelmä Tapahtuma
1993 W3Catalogi?! Tuoda markkinoille
Aliweb Tuoda markkinoille
JumpStation Tuoda markkinoille
1994 WebCrawler Tuoda markkinoille
Infohaku Tuoda markkinoille
Lycos Tuoda markkinoille
1995 AltaVista Tuoda markkinoille
Daum Pohja
Avaa teksti Verkkohakemisto Tuoda markkinoille
Magellan Tuoda markkinoille
Kiihottaa Tuoda markkinoille
SAPO Tuoda markkinoille
Yahoo! Tuoda markkinoille
1996 Dogpile Tuoda markkinoille
Inktomi Pohja
Rambler Pohja
HotBot Pohja
Kysy Jeevesiltä Pohja
1997 Pohjanvalo Tuoda markkinoille
Yandex Tuoda markkinoille
1998 Google Tuoda markkinoille
1999 AlltheWeb Tuoda markkinoille
GenieKnows Pohja
Naver Tuoda markkinoille
Teoma Pohja
Vivisimo Pohja
2000 Baidu Pohja
Exalead Pohja
2003 Info.com Tuoda markkinoille
2004 Yahoo! Hae Lopullinen lanseeraus
A9.com Tuoda markkinoille
Sogou Tuoda markkinoille
2005 MSN Haku Lopullinen lanseeraus
Ask.com Tuoda markkinoille
Nygma Tuoda markkinoille
Hyvä haku Tuoda markkinoille
Etsi minut Pohja
2006 wikiseek Pohja
Quaero Pohja
Live haku Tuoda markkinoille
ChaCha Käynnistä (beta)
Guruji.com Käynnistä (beta)
2007 wikiseek Tuoda markkinoille
Sproose Tuoda markkinoille
Wikia Haku Tuoda markkinoille
Blackle.com Tuoda markkinoille
2008 DuckDuckGo Tuoda markkinoille
Tooby Tuoda markkinoille
Picollator Tuoda markkinoille
Viewzi Tuoda markkinoille
Cuil Tuoda markkinoille
Boogami Tuoda markkinoille
LeapFish Käynnistä (beta)
Metsä Tuoda markkinoille
VADLO Tuoda markkinoille
Powerset Tuoda markkinoille
2009 Bing Tuoda markkinoille
KAZ.KZ Tuoda markkinoille
Yebol Käynnistä (beta)
Mugurdy Sulkeminen
Partiolainen Tuoda markkinoille
2010 Cuil Sulkeminen
Blekko Käynnistä (beta)
Viewzi Sulkeminen
2012 WAZZUB Tuoda markkinoille
2014 Satelliitti Käynnistä (beta)

Internetin kehityksen alkuvaiheessa Tim Berners-Lee piti yllä luetteloa CERNin verkkosivustolla olevista web-palvelimista. Sivustoja oli enemmän ja enemmän, ja tällaisen luettelon manuaalinen ylläpitäminen muuttui yhä vaikeammaksi. NCSA:n verkkosivuilla oli erityinen osio "Mitä uutta!" (englanniksi: What's New!), jossa he julkaisivat linkkejä uusille sivustoille.

Ensimmäinen tietokoneohjelma Internetistä etsimiseen oli ohjelma Archie(Englanninkielinen archie - arkisto ilman "c"-kirjainta). Sen loivat vuonna 1990 Montrealin McGill Universityn tietojenkäsittelytieteen opiskelijat Alan Emtage, Bill Heelan ja J. Peter Deutsch. Ohjelma latasi luettelot kaikista tiedostoista kaikista saatavilla olevista anonyymeistä FTP-palvelimista ja rakensi tietokannan, josta voitiin etsiä tiedostonimiä. Archien ohjelma ei kuitenkaan indeksoinut näiden tiedostojen sisältöä, koska datamäärä oli niin pieni, että kaikki löytyi helposti käsin.

Kehitys ja jakelu verkkoprotokolla Gopher, jonka vuonna 1991 keksi Mark McCahill Minnesotan yliopistosta, johti kahden uuden hakuohjelmia, Veronica ja Jughead. Archien tavoin he etsivät Gopherin hakemistojärjestelmiin tallennettuja tiedostonimiä ja otsikoita. Veronica (englanti) Erittäin helppo jyrsijöille suunnattu verkon laajuinen hakemisto tietokoneistettuihin arkistoihin) salli avainsanahaun useimmille Gopher-valikon otsikoille kaikissa Gopher-listauksissa. Jughead-ohjelma Jonzyn universaali Gopher-hierarkia louhinta ja näyttö) haki valikkotiedot tietyistä Gopher-palvelimista. Vaikka Archie-hakukoneen nimi ei liittynyt sarjakuvasarjaan "Archie" Veronica ja Jughead ovat kuitenkin hahmoja näissä sarjakuvissa.

Kesään 1993 mennessä ei ollut vielä olemassa yhtä järjestelmää Internetin hakuun, vaikka lukuisia erikoistuneita hakemistoja ylläpidettiin manuaalisesti. Oscar Nierstrasz Geneven yliopistosta kirjoitti joukon Perl-käsikirjoituksia, jotka ajoittain kopioivat näitä sivuja ja kirjoittivat ne uudelleen vakiomuoto. Tästä tuli perusta W3Catalogi?!, verkon ensimmäinen primitiivinen hakukone, joka julkaistiin 2. syyskuuta 1993.

Luultavasti ensimmäinen hakukone, joka on kirjoitettu Perl kieli, oli "World Wide Web Wanderer" - Matthew Grayn botti kesäkuusta 1993. Tämä robotti loi hakuindeksi"Wandex". Wanderer-robotin tarkoitus oli mitata koko maailman laajuinen verkko ja etsi kaikki verkkosivut, jotka sisältävät kyselyn sanat. Vuonna 1993 ilmestyi toinen hakukone "Aliweb". Aliweb ei käyttänyt indeksointirobottia, vaan odotti sen sijaan verkkosivustojen ylläpitäjiltä ilmoituksia tietyssä muodossa olevan hakemistotiedoston olemassaolosta heidän sivustoillaan.

JumpStation, jonka Jonathan Fletcher loi joulukuussa 1993, haki verkkosivuja ja rakensi niiden hakemistoja indeksointirobotin avulla ja käytti verkkolomaketta käyttöliittymänä muotoiluun. hakukyselyt. Se oli ensimmäinen Internet-hakutyökalu, joka yhdisti kolmea olennaiset toiminnot hakukone (vahvistus, indeksointi ja itse haku). Ajan rajallisten tietokoneresurssien vuoksi indeksointi ja siten haku rajoittui vain indeksointirobotin löytämiin verkkosivujen otsikoihin.

Hakukoneet osallistui "Dotcom Bubble" -tapahtumaan 1990-luvun lopulla. Useat yritykset osuivat markkinoille näyttävästi tuottaen ennätysvoittoja listautumisannissaan. Jotkut ovat luopuneet julkisista hakukonemarkkinoista ja alkaneet työskennellä vain yrityssektorin kanssa, mm. Pohjanvalo.

Google otti idean myydä avainsanoja vuonna 1998, silloin se oli pieni yritys, joka tarjosi hakukoneen osoitteessa goto.com. Muutos merkitsi hakukoneille siirtymistä keskenään kilpailemisesta yhdeksi Internetin kannattavimmista yrityshankkeista. Hakukoneet alkoivat myydä hakutulosten ensimmäisiä paikkoja yksittäisille yrityksille.

Googlen hakukone on ollut näkyvästi esillä 2000-luvun alusta lähtien. Yhtiö on saavuttanut korkean aseman hyvien hakutulosten ansiosta PageRank-algoritmin avulla. Algoritmi esiteltiin yleisölle artikkelissa "The Anatomy of Search Engine", jonka kirjoittavat Sergey Brin ja Larry Page, Googlen perustajat. Tämä iteratiivinen algoritmi luokittelee verkkosivut verkkosivulle johtavien hyperlinkkien arvion perusteella olettaen, että "hyvillä" ja "tärkeillä" sivuilla on enemmän linkkejä kuin muilla. Googlen käyttöliittymä suunniteltu spartalaiseen tyyliin, jossa ei ole mitään tarpeetonta, toisin kuin monet sen kilpailijat, jotka rakensivat hakukoneen verkkoportaaliin. Google-hakukoneesta on tullut niin suosittu, että jäljitteleviä järjestelmiä on ilmestynyt mm. Mysteerien etsijä(salainen hakukone).

Tietojen haku venäjäksi

Vuonna 1996 Altavista-hakukoneessa toteutettiin venäläinen morfologia huomioon ottava haku ja alkuperäiset venäläiset käynnistettiin. hakukoneet Rambler ja Aport. 23. syyskuuta 1997 Yandex-hakukone avattiin. Rostelecom avasi 22. toukokuuta 2014 valtakunnallisen hakukoneen Sputnik, joka on vuonna 2015 betatestauksessa. Avattu 22.4.2015 uusi palvelu Satelliitti. Lapset erityisesti lapsille, joiden turvallisuus on lisääntynyt.

Klusterianalyysimenetelmistä ja metatietohausta on tullut erittäin suosittuja. Tämän tyyppisistä kansainvälisistä autoista tunnetuin on "Clusty" yritykset Vivisimo. Vuonna 2005 Venäjällä lanseerattiin Moskovan valtionyliopiston tuella automaattista klusterointia tukeva Nigma-hakukone. Vuonna 2006 avattiin venäläinen metakone Quintura, joka tarjoaa visuaalista klusterointia tunnistepilven muodossa. Nygma kokeili myös visuaalista klusterointia.

Miten hakukone toimii?

Hakujärjestelmän pääkomponentit: hakurobotti, indeksoija, hakukone.

Yleensä järjestelmät toimivat vaiheittain. Ensin indeksointirobotti hakee sisällön, sitten indeksoija luo haettavan indeksin ja lopuksi hakukone tarjoaa toiminnot indeksoidun tiedon hakemiseen. Hakukoneen päivittämiseksi tämä indeksointijakso toistetaan.

Hakukoneet toimivat tallentamalla tietoa monista verkkosivuista, jotka ne hakevat HTML-sivuilta. Hakurobotti tai "indeksoija" (eng. Crawler) on ohjelma, joka käy automaattisesti läpi kaikki sivulta löytyvät linkit ja korostaa ne. Indeksointirobotti etsii linkkien tai ennalta määritellyn osoiteluettelon perusteella uusia asiakirjoja, joita hakukone ei vielä tunne. Sivuston omistaja voi sulkea pois tietyt sivut käyttämällä robots.txt-tiedostoa, jonka avulla voit estää sivuston tiedostojen, sivujen tai hakemistojen indeksoinnin.

Hakukone analysoi jokaisen sivun sisällön lisäindeksointia varten. Sanat voidaan poimia otsikoista, sivun tekstistä tai erikoiskentistä - sisällönkuvauskentistä. Indeksoija on moduuli, joka analysoi sivun jakamalla sen osiin käyttämällä omia leksikaalisia ja morfologisia algoritmejaan. Kaikki verkkosivun elementit eristetään ja analysoidaan erikseen. Web-sivun tiedot tallennetaan hakemistotietokantaan myöhemmissä kyselyissä käytettäväksi. Hakemiston avulla löydät nopeasti tietoa käyttäjän pyynnöstä. Useita hakukoneita, kuten Google Store kotisivu koko tai osa siitä, niin sanottu välimuisti, sekä erilaisia ​​tietoja nettisivusta. Muut järjestelmät samanlainen kuin järjestelmä AltaVista tallentaa jokaisen löydetyn sivun jokaisen sanan. Välimuistin käyttö nopeuttaa tiedon hakemista jo vierailluilta sivuilta. Välimuistissa olevat sivut sisältävät aina tekstin, jonka käyttäjä on määrittänyt hakukyselyssä. Tästä voi olla hyötyä, jos verkkosivua on päivitetty, eli se ei enää sisällä käyttäjän pyynnön tekstiä ja välimuistissa oleva sivu on edelleen vanha. Tämä tilanne liittyy linkkien katoamiseen. linkrot) ja Googlen käyttäjäystävällinen (käytettävyys) lähestymistapa. Tämä edellyttää lyhyiden tekstiosien palauttamista välimuistista, joka sisältää pyyntötekstin. Vähimmän yllätyksen periaate pätee yleensä käyttäjä odottaa näkevänsä haetut sanat vastaanotettujen sivujen teksteistä (; Käyttäjien odotukset). Sen lisäksi, että välimuistissa olevien sivujen käyttö nopeuttaa hakuja, välimuistissa olevat sivut voivat sisältää tietoja, joita ei enää ole saatavilla mistään muualta.

Hakukone toimii indeksoijalta saatujen tulostetiedostojen kanssa. Hakukone hyväksyy käyttäjien kyselyt, käsittelee ne indeksin avulla ja palauttaa hakutulokset.

Kun käyttäjä kirjoittaa kyselyn hakukoneeseen (yleensä avainsanoja käyttäen), järjestelmä tarkistaa sen hakemiston ja palauttaa luettelon tärkeimmistä verkkosivuista (joidenkin kriteerien mukaan lajiteltuina), yleensä lyhyen yhteenvedon kanssa, joka sisältää asiakirjan otsikon ja joskus tekstin osia. Hakuhakemisto on rakennettu erityisellä tekniikalla, joka perustuu verkkosivuilta poimittuihin tietoihin. Vuodesta 2007 lähtien Googlen hakukone voit tehdä haun ajan huomioon ottaen, luoda etsimäsi asiakirjat (hakutyökalut-valikon avaaminen ja aikavälin määrittäminen). Useimmat hakukoneet tukevat Boolen operaattorien AND, OR, NOT käyttöä kyselyissä, jolloin voit tarkentaa tai laajentaa haettujen avainsanojen luetteloa. Tässä tapauksessa järjestelmä etsii sanoja tai lauseita täsmälleen syötetyllä tavalla. Joillakin hakukoneilla on mahdollisuus likimääräinen haku, tässä tapauksessa käyttäjät laajentavat hakualuetta määrittämällä etäisyyden avainsanoihin. Siellä on myös käsitteellinen haku, jossa sitä käytetään Tilastollinen analyysi etsittyjen sanojen ja lauseiden käyttö web-sivujen teksteissä. Nämä järjestelmät mahdollistavat kyselyjen kirjoittamisen luonnollisella kielellä. Esimerkki tällaisesta hakukoneesta on sivusto ask com.

Hakukoneen hyödyllisyys riippuu sen löytämien sivujen osuvuudesta. Vaikka miljoonilla verkkosivuilla voi olla tietty sana tai lause, jotkut voivat olla osuvampia, suositumpia tai arvovaltaisempia kuin toiset. Useimmat hakukoneet käyttävät sijoitusmenetelmiä tuodakseen "parhaat" tulokset luettelon kärkeen. Hakukoneet päättävät, mitkä sivut ovat osuvampia ja missä järjestyksessä tulokset tulee näyttää eri tavoin. Hakutavat, kuten itse Internet, muuttuvat ajan myötä. Näin syntyi kaksi päätyyppiä hakukoneita: ennalta määritettyjen ja hierarkkisten avainsanojen järjestelmät ja järjestelmät, joissa käänteinen indeksi luodaan tekstianalyysin perusteella.

Useimmat hakukoneet ovat kaupallisia yrityksiä, jotka tekevät voittoa mainonnasta joissakin hakukoneissa voit ostaa hakutuloksista maksua vastaan. Ne hakukoneet, jotka eivät veloita rahaa tulosten palautusjärjestyksessä, ansaitsevat rahaa kontekstuaalista mainontaa, kun taas mainosviestit vastaavat käyttäjän pyyntöä. Tällainen mainonta näytetään sivulla, jolla on hakutulosluettelo, ja hakukoneet ansaitsevat rahaa aina, kun käyttäjä napsauttaa mainosviestejä.

Hakukoneiden tyypit

Hakukoneita on neljää tyyppiä: robotti, ihmisvoimalla toimiva, hybridi ja meta.

Ne koostuvat kolmesta osasta: indeksointirobotista ("botti", "robotti" tai "hämähäkki"), hakemisto ja hakukoneohjelmisto. Indeksointirobotti tarvitaan verkon indeksoimiseen ja verkkosivuluetteloiden luomiseen. Indeksi - suuri arkisto kopiot web-sivuista. Kohde ohjelmisto- arvioida hakutuloksia. Koska tämän mekanismin hakurobotti tutkii jatkuvasti verkkoa, tiedot ovat merkityksellisempiä. Useimmat nykyaikaiset hakukoneet ovat tämän tyyppistä.
  • ihmisen hallinnoimat järjestelmät (resurssihakemistot)
Nämä hakukoneet hakevat luetteloita verkkosivuista. Hakemisto sisältää osoitteen, otsikon ja Lyhyt kuvaus sivusto. Resurssihakemisto etsii tuloksia vain verkkovastaavien sille lähettämistä sivukuvauksista. Luetteloiden etuna on, että kaikki resurssit tarkistetaan manuaalisesti, joten sisällön laatu on parempi verrattuna ensimmäisen tyyppisen järjestelmän automaattisesti saamiin tuloksiin. Mutta on myös haittapuoli - luettelotietojen päivittäminen tapahtuu manuaalisesti ja se voi jäädä huomattavasti todellisesta tilanteesta. Sivujen sijoitus ei voi muuttua hetkessä. Esimerkkejä tällaisista järjestelmistä ovat mm Yahoo-hakemisto, dmoz ja Galaxy. Hakukoneet, kuten Yahoo, Google, MSN, yhdistävät järjestelmien toiminnot käyttämällä hakurobotteja ja ihmisten käyttämiä järjestelmiä.
  • metajärjestelmät
Metahakukoneet yhdistävät ja luokittelevat useiden hakukoneiden tulokset kerralla. Nämä hakukoneet olivat hyödyllisiä, kun jokaisella hakukoneella oli ainutlaatuinen hakemisto ja hakukoneet olivat vähemmän "älykkäitä". Koska haku on nyt parantunut niin paljon, niiden tarve on vähentynyt. Esimerkkejä: MetaCrawler ja MSN-haku.

Hakukonemarkkinat

Google on maailman suosituin hakukone 68,69 prosentin markkinaosuudellaan. Bing on toisella sijalla 12,26 prosentin osuudella.

Maailman suosituimmat hakukoneet:

Hakujärjestelmä Markkinaosuus heinäkuussa 2014 Markkinaosuus lokakuussa 2014 Markkinaosuus syyskuussa 2015
Google 68,69 % 58.01 % 69.24%
Baidu 17,17 % 29.06 % 6,48%
Bing 6.22 % 8.01 % 12,26%
Yahoo! 6.74 % 4.01 % 9,19%
AOL 0,13 % 0.21 % 1,11%
Kiihottaa 0.22 % 0,00 % 0.00%
Kysyä 0,13 % 0,10 % 0,24%

Aasia

Itä-Aasian maissa ja Venäjä Google- ei suosituin hakukone. Esimerkiksi Kiinassa se on suositumpi Soso hakukone.

SISÄÄN Etelä-Korea hakuportaali Naverin omaa kehitystä käyttää noin 70 % Yahoo! Japani ja Yahoo! Taiwan - eniten suosittuja järjestelmiä etsiä Japanista ja Taiwanista.

Venäjä ja venäjänkieliset hakukoneet

LiveInternetin kesäkuun 2015 tietojen mukaan venäjänkielisten hakukyselyiden kattavuudesta:

  • Kaikki kielet:
    • Yahoo! (0,1 %) ja tämän yrityksen omistamat hakukoneet: Inktomi,AltaVista, Alltheweb
  • Englantia puhuvia ja kansainvälisiä:
    • AskJeeves(Teoman moottori)
  • Venäjänkieliset - useimmat "venäjänkieliset" hakukoneet indeksoivat ja etsivät tekstejä monilla kielillä - ukraina, valkovenäläinen, englanti, tatari ja muut. Ne eroavat "kaikkikielisistä" järjestelmistä, jotka indeksoivat kaikki asiakirjat peräkkäin, sillä ne indeksoivat pääasiassa resursseja, jotka sijaitsevat venäjän kielen hallitsemilla verkkoaluealueilla, tai muuten rajoittavat robottinsa venäjänkielisiin sivustoihin.

Jotkut hakukoneet käyttävät ulkoisia hakualgoritmeja.

Googlen hakukoneen määrälliset tiedot

Internetin käyttäjien ja hakukoneiden määrä ja käyttäjien vaatimukset näille järjestelmille kasvavat jatkuvasti. Lisää hakunopeutta tarvittavat tiedot, suuret hakukoneet sisältävät suuri määrä palvelimia. Palvelimet on yleensä ryhmitelty palvelinkeskuksiin (tietokeskuksiin). Suosituilla hakukoneilla on palvelinkeskuksia hajallaan ympäri maailmaa.

Lokakuussa 2012 Google käynnisti "Where the Internet Lives" -projektin, jossa käyttäjille annetaan mahdollisuus tutustua yrityksen palvelinkeskuksiin.

Tietoja hakukoneiden datakeskusten työstä Googlen järjestelmä tiedetään seuraavaa:

  • Kaikkien Googlen palvelinkeskusten kokonaistehoksi vuonna 2011 arvioitiin 220 MW.
  • Kun vuonna 2008 vuoden Google Suunnitteli avaavansa Oregoniin uuden, kolmesta rakennuksesta koostuvan kompleksin, joiden kokonaispinta-ala on 6,5 miljoonaa m², Harper's Magazine laski, että tällainen suuri kompleksi kuluttaa yli 100 MW sähköä, mikä on verrattavissa kaupungin energiankulutukseen. 300 000 ihmisen asukasluku.
  • Likimääräinen määrä Googlen palvelimet vuonna 2012 - 1 000 000.
  • Googlen kulut datakeskuksista olivat 1,9 miljardia dollaria vuonna 2006 ja 2,4 miljardia dollaria vuonna 2007.

Googlen indeksoima World Wide Webin koko joulukuussa 2014 on noin 4,36 miljardia sivua.

Hakukoneet, jotka ottavat huomioon uskonnolliset kiellot

Internetin maailmanlaajuinen leviäminen ja suosion kasvu elektroniset laitteet arabi- ja muslimimaailmassa, erityisesti Lähi-idän ja Intian niemimaan maissa, auttoi kehittämään paikallisia hakukoneita, jotka ottavat huomioon islamilaiset perinteet. Tällaiset hakukoneet sisältävät erityisiä suodattimia, jotka auttavat käyttäjiä välttämään kielletyillä sivustoilla, kuten pornografiaa sisältävillä sivustoilla, käymisen ja sallivat heidän käyttää vain sellaisia ​​sivustoja, joiden sisältö ei ole ristiriidassa islamilaisen uskon kanssa. Juuri ennen muslimien ramadania, heinäkuussa 2013, maailma esiteltiin Halalgooglaa- järjestelmä, joka tarjoaa käyttäjille vain halal "oikeita" linkkejä ja suodattaa muista hakukoneista, kuten Googlesta ja Bingistä, saadut hakutulokset. Kaksi vuotta aiemmin, syyskuussa 2011, se lanseerattiin hakukone I'mHalal, suunniteltu palvelemaan käyttäjiä Lähi-idässä. Kuitenkin tämä hakupalvelu piti sulkea pian, omistajan mukaan rahoituksen puutteen vuoksi.

Investointien puute ja hidas teknologian leviäminen muslimimaailmassa ovat haitanneet edistystä ja vakavan islamilaisen hakukoneen menestystä. Muslimien elämäntapaverkkoprojekteihin tehtyjen valtavien investointien epäonnistuminen, joista yksi oli Muxlim. Hän on kerännyt miljoonia dollareita sijoittajilta, kuten Rite Internet Ventures, ja nyt, mukaan viimeinen viesti I'mHalalista ennen sen sulkemista - keksii kyseenalaisen ajatuksen, että "seuraava Facebook tai Google voi ilmestyä Lähi-idässä vain, jos tuet loistavaa nuorisoamme." Islamilaiset Internet-asiantuntijat ovat kuitenkin olleet alalla useiden vuosien ajan määrittäessään, mikä on tai ei ole sharia-lain mukaista, ja luokittelemassa verkkosivustoja "halal" tai "haram". Kaikki entiset ja nykyiset islamilaiset hakukoneet ovat yksinkertaisesti erityisesti indeksoituja tietoja tai ne ovat suuria hakukoneita, kuten Google, Yahoo ja Bing, joiden suodatusjärjestelmä estää käyttäjiä pääsemästä haram-sivustoille, kuten alastomuutta, LGBT:tä, uhkapelit ja muut aiheet, joita pidetään islamin vastaisina.

Muiden uskonnollisesti suuntautuneiden hakukoneiden joukossa Jewogle - juutalainen Google-versio ja SeekFind.org, kristillinen sivusto, joka sisältää suodattimia, jotka suojaavat käyttäjiä sisällöltä, joka voi heikentää tai heikentää heidän uskoaan.

Omat tulokset ja suodatinkuplat

Monet hakukoneet, kuten Google ja Bing, käyttävät algoritmeja arvatakseen valikoivasti, mitä tietoja käyttäjä haluaisi nähdä aiemman selaustoimintansa perusteella. Tämän seurauksena verkkosivustot näyttävät vain tietoja, jotka vastaavat käyttäjän aiempia kiinnostuksen kohteita. Tätä vaikutusta kutsutaan "suodatinkuplaksi".

Kaikki tämä johtaa siihen, että käyttäjät saavat paljon vähemmän tietoa, joka on ristiriidassa heidän näkemyksensä kanssa ja joutuvat älyllisesti eristyksiin omaan "tietokuplaansa". Näin ollen "kuplavaikutus" voi olla Negatiiviset seuraukset muodostaa kansalaismielipidettä.

Hakukoneen harha

Vaikka hakukoneet on ohjelmoitu sijoittamaan verkkosivustot niiden suosion ja merkityksen yhdistelmän perusteella, todellisuus on kokeelliset tutkimukset osoittavat, että useat poliittiset, taloudelliset ja sosiaaliset tekijät vaikuttavat Hakutulokset.

Tällainen harha voi olla suora seuraus taloudellisista ja kaupallisista prosesseista: hakukoneissa mainostavista yrityksistä voi tulla suositumpia tuloksissa säännöllinen haku sen sisällä. Hakutulosten poistaminen, jotka eivät ole paikallisten lakien mukaisia, on esimerkki vaikuttamisesta poliittisia prosesseja. Google ei esimerkiksi näytä joitakin uusnatsisivustoja Ranskassa ja Saksassa, joissa holokaustin kieltäminen on laitonta.

Harha voi olla myös seurausta sosiaalisista prosesseista, sillä hakukonealgoritmit on usein suunniteltu sulkemaan pois muotoilemattomat näkökulmat "suositumpien" tulosten hyväksi. Suurten hakukoneiden indeksointialgoritmit antavat etusijalle amerikkalaiset sivustot.

Hakupommitukset ovat yksi esimerkki yrityksistä manipuloida hakutuloksia poliittisista, sosiaalisista tai kaupallisista syistä.

Katso myös

  • Qwika
  • Elektroninen kirjasto#Kirjasto-ja hakukoneluettelo
  • Web Developer Toolbar

Huomautuksia

Kirjallisuus

  • Ashmanov I. S., Ivanov A. A. Verkkosivuston mainostaminen hakukoneissa. - M.: Williams, 2007. - 304 s. - ISBN 978-5-8459-1155-1.
  • Baykov V.D. Internet. Etsi tietoa. Verkkosivuston edistäminen. - Pietari. : BHV-Petersburg, 2000. - 288 s. - ISBN 5-8206-0095-9.
  • Kolisnichenko D.N. Hakukoneet ja verkkosivustojen mainostaminen Internetissä. - M.: Dialektiikka, 2007. - 272 s. - ISBN 978-5-8459-1269-5.
  • Lande D.V. Tietojen etsiminen Internetistä. - M.: Dialektiikka, 2005. - 272 s. - ISBN 5-8459-0764-0.
  • Lande D. V., Snarsky A. A., Bezsudnov I. V. Internet: Navigointi monimutkaisissa verkoissa: mallit ja algoritmit. - M.: Librocom (Toimitus URSS), 2009. - 264 s. - ISBN 978-5-397-00497-8.
  • Chu H., Rosenthal M. Hakukoneet maailmanlaajuiseen verkkoon: Vertaileva tutkimus ja arviointimenetelmä (englanniksi) // PROCEEDINGS OF THE ANNUAL MEETING-AMERICAN SOCIETY FOR INFORMATION SOCIETY. - 1996. - Voi. 33. - s. 127-135.
  • Gandal, Neil. Internetin kilpailun dynamiikka hakukone markkinoida. - 2001. - Voi. 19. - s. 1103–1117. -

Ala Hae näkyy jokaisella Wikipedian sivulla. Hae tehdäksesi kirjoittamalla kyselyn ja painamalla ↵ Enter-näppäintä tai napsauttamalla suurennuslasikuvaketta.

Jos merkkijono vastaa artikkelin otsikkoa (mahdollisesti ), siirtyy tähän artikkeliin, muuten näytetään artikkelien merkkijonon hakutulokset.

Jos haluat etsiä artikkelin otsikkoa vastaavaa merkkijonoa, valitse avattavasta luettelosta viimeinen kohde "sisältää..." tai mene ensin hakusivulle Palvelu:Hae napsauttamalla suurennuslasikuvaketta, kun syöttökenttä on tyhjä.

hakutuloksia

Tilde lopussa sanat sisältävät samankaltaisia ​​kirjoitettuja sanoja hakutuloksissa: molaco~ . Voit sitten määrittää numeron väliltä 0 ja 1 erotettuna pisteellä, mikä osoittaa, kuinka samanlainen tuloksen tulisi olla. Lainausmerkeissä olevien lauseiden jälkeen se tarkoittaa, että fragmentteja etsitään sieltä, missä nämä sanat ovat riittävän lähellä; Tilden jälkeen on oletuksena kokonaisluku - etäisyys sanoissa yhtä suuri kuin yksi. Esimerkki: "panssariisku"~5 .

Laajennettu syntaksi

Laajennettujen syntaksiavainten jälkeen on kaksoispiste, jota ei voi erottaa välilyönnillä viereisistä merkeistä. Jos avaimeen liittyvä kysely koostuu useista sanoista, ne laitetaan lainausmerkkeihin, esim. luokka: "Adygean joet" Kuban .

intitle: Hae sanaa vain sivujen otsikoista (jos sanoja on useita, laita ne lainausmerkkeihin): otsikko: kreikka . Voit ennen symbolia -merkinnän sulkea pois tällaiset tulokset. etuliite: Hae vain sivuilta, joiden nimet alkavat määritetyillä sanoilla. Tämä näppäin on kätevä esimerkiksi keskusteluarkistojen etsimiseen: polkupyörän etuliite:Wikipedia:foorumi/arkisto . Tämä avain koskee kaikkea seuraavaa tekstiä pyynnön loppuun asti, joten sen pitäisi aina tulla lopussa. incategory: Hae vain sivuilta, jotka sisältävät määritetty luokka, Esimerkiksi, aikuiset luokassa:"jänikset" löytää esiintymiä sanalle "aikuiset" Jänikset-kategorian artikkeleista. Useat incategory-avaimet tarjoavat haun luokkien leikkauspisteen perusteella (artikkelit, jotka sisältyvät kaikkiin näihin luokkiin kerralla). Sivuja, jotka sisältyvät vain tämän luokan alaluokkiin, ei haeta. Voit sulkea tämän luokan pois symbolin eteen merkinnän -. linkto: Hae vain sivuilta, joille on linkki tämä sivu, Esimerkiksi, aikuiset linkit: "kissa" löytää artikkeleita, joissa on sana "aikuiset", jossa on wikilinkki artikkeliin Cat. Voit ennen symbolia -merkinnän sulkea pois tällaiset tulokset.

Erikoisavaimet

morelike: Etsi samankaltaisia ​​artikkeleita kuin annettu. Esimerkiksi, enemmän kuin: Lunevo löytää sisällöltään samankaltaisia ​​artikkeleita kuin Lunevo. prefer-recent: Käytetään seuraamaan aikaa edellisestä muokkauksesta. Valinnainen parametri on muotoa lasit,ajanjaksoa . lasit- numero 0-1 erotinpisteellä, oletusarvo 0,6, osoittaa, kuinka paljon uusia tuloksia tarvitaan. ajanjaksoa- päivinä määritetty numero (oletusarvoisesti 160, voit asettaa esimerkiksi 0,0001), jolla puolet tuloksen arvosta eliminoidaan. Muilla ajanjaksoilla sijoitus laskee eksponentiaalisesti. hastemplate: Etsi sivuja, jotka sisältävät tietty malli. Yhdistetään yhdysviivalla ei-sisältäville. Esimerkki: hastemplate:Profiili hastemplate:rq -hastemplate:"Poistetaan" . boost-templates: Parantaa sivun sijoitusta hakutuloksissa, jos se sisältää määritetyt mallit. Kuviot on lueteltu lainausmerkeissä välilyönnillä erotettuina, joita seuraa prosenttimääräinen arvo (vain kokonaisluku) erotettuna pystypalkilla. Esimerkki: . insource: Hae wikitekstistä (näkyy muokkausikkunassa), ei tekstistä korvatuilla malleilla. Haku käyttämällä säännöllisiä lausekkeita Liitä hakumerkkijono // . Säännöllisiä lausekkeita käytettäessä on erittäin suositeltavaa lisätä toinen avain (tai sama syöte: mutta ilman säännöllisiä lausekkeita), muuten haku kestää liian kauan ja mahdollisesti aikakatkaisun 20 sekunnin suorituksen jälkeen, samalla kun vastuulliset käyttäjät estetään. (