Asiakirjojen ja tietojen hakuohjelmien tarkistus. Asiakirjojen ja tietojen hakuohjelmien tarkastelu Kuinka ammattimainen haku suoritetaan

Johdanto

Tällä hetkellä Internet yhdistää satoja miljoonia palvelimia, jotka isännöivät miljardeja erilaisia ​​sivustoja ja yksittäisiä tiedostoja, jotka sisältävät erityyppistä tietoa. Tämä on valtava tietovarasto. On olemassa erilaisia ​​tapoja etsiä tietoa Internetistä.

Hae tunnetulla osoitteella. Tarvittavat osoitteet otetaan hakemistoista. Kun tiedät osoitteen, kirjoita se selaimen osoiteriville.

Esimerkki 1. www.gov.ru on Venäjän viranomaisten palvelin.

Osoitteen luominen käyttäjän toimesta. Kun tiedät Internet-osoitteiden muodostusjärjestelmän, voit muodostaa osoitteita etsiessäsi Web-sivustoja.

Avainsanaan (yrityksen, yrityksen, organisaation nimi tai yksinkertainen englanninkielinen substantiivi) sinun on lisättävä temaattinen tai maantieteellinen verkkotunnus ja yhdistettävä intuitiosi.

Esimerkki 2. Kaupallisten Web-sivujen osoitteet:

www.samsung.com (SAMSUNG-yhtiö),

www.mtv.com (MTV-musiikkiuutiset).

Esimerkki 3. Oppilaitosten osoitteet:

www.ntu.edu (Yhdysvaltojen kansallinen yliopisto).

Internetin hakukoneet

Tiedonhakuun Internetistä on kehitetty erityisiä tiedonhakujärjestelmiä. Hakukoneilla on tavallinen osoite ja ne näytetään Web-sivuna, joka sisältää erikoistyökaluja hakujen järjestämiseen (hakumerkkijono, aihehakemisto, linkit). Soita hakukoneeseen kirjoittamalla sen osoite selaimen osoiteriville.

Tilastopalvelun LiveInternet.ru mukaan hakukoneiden jakautuminen Venäjällä on suunnilleen seuraava:

2) Google – 35,0 %

3) Hae Mail.ru - 8,3 %

4) Rambler – 0,9 %

Tiedon organisointitavan mukaan tiedonhakujärjestelmät jaetaan kahteen tyyppiin: luokitus (rubrikaattorit) ja sanakirja.

Luokat (luokittelut)- hakukoneet, jotka käyttävät tiedon hierarkkista (puu)järjestelyä. Tietoa etsiessään käyttäjä selaa temaattisia otsikoita ja kaventaa vähitellen hakukenttää (jos esimerkiksi haluat löytää sanan merkityksen, sinun on ensin löydettävä sanakirja luokittimesta ja löydettävä sitten haluamasi sana se).



Sanakirjan hakukoneet- Nämä ovat tehokkaita automaattisia ohjelmisto- ja laitteistojärjestelmiä. Niiden avulla tietoja tarkastellaan (skannataan) Internetissä. Tiedot tämän tai toisen tiedon sijainnista syötetään erityisiin hakemistohakemistoihin. Vastauksena pyyntöön suoritetaan haku kyselymerkkijonon mukaan. Tämän seurauksena käyttäjälle tarjotaan ne osoitteet (URL-osoitteet), joista etsitty sana tai sanaryhmä löytyi skannaushetkellä. Valitsemalla minkä tahansa ehdotetuista linkkien osoitteista voit siirtyä löydettyyn asiakirjaan. Useimmat nykyaikaiset hakukoneet ovat sekoitettuja.

Tunnetuimmat ja suosituimmat hakukoneet:

On olemassa järjestelmiä, jotka ovat erikoistuneet tietoresurssien etsimiseen eri alueilla.

https://my.mail.ru

https://ru-ru.facebook.com

https://twitter.com

https://www.tumblr.com

https://www.instagram.com jne.

Aihehakukoneet:

Hakuohjelmisto:

Luettelot (teemaattiset linkkien kokoelmat huomautuksilla):

http://www.atrus.ru

Pyyntöjen toteuttamista koskevat säännöt

Jokaisen hakukoneen Ohje-osiossa saat tietoa haun tekemisestä ja kyselymerkkijonon muodostamisesta. Alla on tietoja tyypillisestä, "keskimääräisestä" kyselykielestä.

Yksinkertainen pyyntö

Kirjoita yksi sana, joka määrittelee hakuaiheen. Esimerkiksi Rambler.ru-hakukoneeseen riittää syöttäminen: automaatio.

Löytyy asiakirjoja, jotka sisältävät pyynnössä mainitut sanat. Kaikki venäjän sanat tunnistetaan, kirjainkoko jätetään huomiotta.

Voit käyttää kyselyssä merkkiä "*" tai "?". Merkki "?" avainsanassa korvataan yksi merkki, jonka tilalle voidaan korvata mikä tahansa kirjain, ja *-merkki on merkkijono.

Esimerkiksi kyselyn automaattinen* avulla voit etsiä asiakirjoja, jotka sisältävät sanat automaattinen, automatisointi jne.

Monimutkainen pyyntö

Usein avainsanoja on yhdistettävä tarkempien tietojen saamiseksi. Tässä tapauksessa käytetään ylimääräisiä hakasulkeilla erotettuja linkityssanoja, funktioita, operaattoreita, symboleja, operaattoreiden yhdistelmiä.

Esimerkiksi kysely musiikki & (beatles beatles) tarkoittaa, että käyttäjä etsii asiakirjoja, jotka sisältävät sanat musiikki ja beatles tai musiikki ja beatles.

Luettelo hakupalvelimista ja hakemistoista

Osoite Kuvaus
www.excite.com Hakukone sivustojen arvosteluilla ja oppailla
www.alta-vista.com Hakupalvelin, lisähakuominaisuudet saatavilla
www.hotbot.com Hakupalvelin
www.ifoseek.com Hakupalvelin (helppokäyttöinen)
www.ipl.org Internet Publik -kirjasto, Maailmankylä -hankkeen puitteissa toimiva julkinen kirjasto
www.wisewire.com WiseWire - hakuorganisaatio tekoälyn avulla
www.webcrawler.com WebCrawler - hakupalvelin, helppokäyttöinen
www.yahoo.com CatalogWeb ja käyttöliittymä koko tekstihaun käyttämiseen AltaVista-palvelimella
www.aport.ru Aport - venäjänkielinen hakupalvelin
www.yandex.ru Yandex - venäjänkielinen hakupalvelin
www.rambler.ru Rambler - venäjänkielinen hakupalvelin
Internet-apuresurssit
www.yellow.com Keltaiset sivut Internet
monk.newmail.ru Eri profiilien hakukoneet
www.top200.ru 200 suosituinta verkkosivustoa
www.allru.net
www.ru Venäjän Internet-resurssien luettelo
www.allru.net/z09.htm Koulutusresurssit
www.students.ru Venäjän opiskelijapalvelin
www.cdo.ru/index_new.asp Etäopetuskeskus
www.open.ac.uk Iso-Britannian avoin yliopisto
www.ntu.edu Yhdysvaltain kansallinen yliopisto
www.translate.ru Sähköinen tekstin kääntäjä
www.pomorsu.ru/guide.library.html Luettelo linkeistä verkkokirjastoihin
www.elibrary.ru Tieteellinen elektroninen kirjasto
www.citforum.ru Digitaalinen kirjasto
www.infamed.com/psy Psykologiset testit
www.pokoleniye.ru Internet Education Federationin verkkosivusto
www.metod.narod.ru Koulutusresurssit
www.spb.osi.ru/ic/distant Etäopiskelu Internetissä
www.examen.ru Tentit ja kokeet
www.kbsu.ru/~book/ Tietojenkäsittelytieteen oppikirja
Mega.km.ru Tietosanakirjat ja sanakirjat

Ammattimainen tiedonhaku Internetistä

Tiedon etsiminen on yksi yleisimmistä ja samalla vaikeimmista tehtävistä, joita jokaisen käyttäjän on kohdattava Internetissä. Kuitenkin, jos tavalliselle verkkoyhteisön jäsenelle tehokkaan tiedonhaun menetelmien tuntemus on toivottavaa, mutta kaukana pakollisesta laadusta, niin tietoalan ammattilaisille kyky nopeasti navigoida Internetin resursseissa ja löytää tarvittavat lähteet on yksi peruspätevyydestä. taidot.

Internetistä tiedonhakuvaiheessa ilmenevien vaikeuksien syyn määrää kaksi päätekijää. Ensinnäkin Internetin lähteiden määrä on erittäin suuri. Vuoden 2001 lopussa karkeimmat arviot osoittivat arviolta 7,5 miljardia dokumenttia palvelimilla ympäri maailmaa. Toiseksi Internetin tietovalikoima ei ole vain valtavan määrän, vaan myös erittäin dynaamista. Puolen minuutin aikana, jonka käytit tämän osion ensimmäisten rivien lukemiseen, noin sata uutta tai muuttunutta dokumenttia ilmestyi virtuaaliseen universumiin, kymmeniä siirrettiin uusiin osoitteisiin ja muutama lakkasi olemasta ikuisesti. Internet ei koskaan "nuku", kuten planeettamme ei koskaan "nuku", jota pitkin ihmisen liiketoiminnan aalto pyörii jatkuvasti täsmälleen aikavyöhykkeiden muutoksen mukaisesti.

Toisin kuin kirjastossa oleva vakaa ja kontrolloitu dokumenttikokoelma, Internetissä on tekemisissä jättimäinen ja jatkuvasti muuttuva tietojoukko, jonka tietojen etsiminen on hyvin, hyvin monimutkainen prosessi. Tilanne muistuttaa usein hyvin tunnettua ongelmaa, joka koskee neulan löytämistä heinäsuovasta, ja joskus arvokkaat tiedot jäävät hakematta pelkästään sen löytämisen vaikeuden vuoksi.

Suurimmalla osalla globaalien tietokoneverkkojen käyttäjistä on tietotutkimuksen taitoja jossain määrin. Sekä amatöörit että ammattilaiset käyttävät usein samoja työkaluja. Hakujen tulokset ja niihin käytetty aika vaihtelevat kuitenkin suuresti.

Tämän osion tarkoituksena on perehtyä yksityiskohtaisesti tiedonhaun työkaluihin ja menetelmiin sekä kehittää vakaita taitoja ammattimaiseen Internet-hakuun kaikentyyppisille tiedoille: minkä tahansa muotoisista teksteistä videoon ja animaatioon.


Sanoa, että tietotekniikan ja sekä yksilön että yhteiskunnan saatavilla olevan datan määrän loputtoman kasvun aikana tiedon käsittelyssä ja etsimisessä on monia ongelmia, on jo jumalanpilkkaa. Kukapa ei ota tätä aihetta esille? Ja jotta en rasittaisi sinua subjektiivisilla ja osittain objektiivisilla arvioilla, jotka on vedetty eri tietolähteistä ongelmasta, siirryn suoraan sen ratkaisuun. Tänään puhumme hausta. Eli ohjelmista ja vakavista tietojärjestelmistä, jotka etsivät tarvitsemiamme asiakirjoja ja tietoja.

Päivitä "suora haku"

Ei niin kauan sitten, kun puut olivat suuria ja tietoa ei ollut paljoa edes yrityksen paikallisverkossa, kaikki haut suoritettiin yksinkertaisesti etsimällä kourallinen saatavilla olevia tiedostoja ja tarkistamalla peräkkäin niiden nimet ja sisältö. Tällaista hakua kutsutaan suoraksi, ja suorahakutekniikkaa käyttävät ohjelmat (apuohjelmat) ovat perinteisesti läsnä kaikissa käyttöjärjestelmissä ja työkalupaketeissa. Mutta edes nykyaikaisten tietokoneiden teho ei riitä nopeaan ja riittävään etsintään jättimäisistä tietomääristä suoran haun aikana. Parin sadan asiakirjan etsiminen levyltä ja valtavasta kirjastosta ja useista kymmenistä postilaatikoista etsiminen ovat kaksi eri asiaa. Siksi suorahakuohjelmat ovat nykyään selvästi häipymässä taustalle - mitä tulee universaaleihin työkaluihin.

Tietenkin tämäntyyppiselle haulle ei ole ollut kysyntää pitkään aikaan yrityssektorilla. Volyymit eivät ole samat. Ja siksi jo useiden vuosien ajan ja viime aikoina selvästi tekniikat, jotka pystyvät etsimään nopeasti ja tarkasti eri muotoisia asiakirjoja ja eri lähteistä, ovat enemmän kuin merkityksellisiä. Ei niin kauan sitten Microsoftin "isä" Bill Gates, joka ilmeisesti oli kateellinen Internet-hakukoneen Googlen ilmiömäisestä menestyksestä, ilmoitti yhdessä lehdistötilaisuudessa ohjelmistoteollisuuden (eikä vain) halusta osallistua kaikin mahdollisin tavoin, kehittää ja syventää hakukoneiden ja tekniikoiden luomista. Mutta on liian aikaista luoda mitään ilmiömäisesti toimivaa ohjelmaa Microsoftilta tai kilpailukykyiseltä Internet-palvelimelta (MSN ei vieläkään tavoita Googlea). Siksi käännytään nykyiseen kehitykseen. Hakemisto, kysely, osuvuus

Moderni teknologia perustuu kahteen perusprosessiin. Ensinnäkin se indeksoi saatavilla olevat tiedot ja käsittelee pyynnön tulosten myöhemmin. Mitä tulee ensimmäiseen, mikä tahansa ohjelma (olipa se sitten työpöytähakukone, yrityksen tietojärjestelmä tai Internet-hakukone) luo oman hakualueensa. Toisin sanoen se käsittelee asiakirjoja ja luo näistä asiakirjoista indeksin (järjestetty rakenne, joka sisältää tietoja käsitellyistä tiedoista). Jatkossa työhön käytetään luotua hakemistoa - saadakseen nopeasti luettelon tarvittavista asiakirjoista pyynnön mukaan. Seuraava, vaikka se ei suinkaan ole teknisesti yksinkertaista, on keskivertokäyttäjälle varsin ymmärrettävää. Ohjelma käsittelee pyynnön (käyttäen avainsanailmausta) ja näyttää luettelon asiakirjoista, jotka sisältävät tämän avainsanailmauksen. Koska tiedot sisältyvät strukturoituun hakemistoon, kyselyn käsittely on paljon nopeampaa (kymmeniä ja satoja kertoja!) kuin suorahaussa (asiakirjoja ei valita tiedostoista etsimällä, vaan analysoimalla hakemiston tekstitietoja).

Ohjelma näyttää löydetyt dokumentit tuloksena olevassa luettelossa relevanssin mukaan - asiakirjan yhteensopivuuden kyselytekstin kanssa. Eri tekniikoissa on tietysti erilaisia ​​menetelmiä asiakirjan etsimiseen ja merkityksen määrittämiseen (sanan "esiintymistiheys" ja sen mainintatiheys asiakirjassa, näiden parametrien suhde sanojen kokonaismäärään asiakirjassa, kyselylauseen sanojen välinen etäisyys etsityissä tiedostoissa ja niin edelleen). Näiden parametrien perusteella määritetään asiakirjan "paino" ja siitä riippuen tietty tiedosto näkyy tulosluettelossa tietyssä paikassa. Internet-haun tapauksessa tilanne on vielä monimutkaisempi. Tässä tapauksessa on todellakin otettava huomioon monet muut tekijät (Googlen PageRank on esimerkki tästä). Mutta tämä on erillisen artikkelin aihe, joten emme koske Internetiin

Tässä materiaalissa tarkastellaan useiden suosittujen hakuohjelmien ominaisuuksia, jotka tarjoavat sekä kohtuullisen nopeuden että hyvän toimivuuden. Mutta esitteiden esittely on yksi asia, mutta asiantuntijan katseen alla seisominen on aivan eri asia. Eikä ollut enää asiantuntijoita, ei vähempää toimistoa täynnä ihmisiä, jotka halusivat puuhata ohjelmistoa sen käytettävyyden vuoksi. Kokeelliseen tietokoneeseen asennettiin joukko ohjelmia (Athlon 2,2 MHz, RAM 1 Gt, 160 Gt IDE-kiintolevy Seagate 7200 rpm ja Windows XP): dtSearch Desktop, Ishcheika Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS-työpöytä. Testejä varten koottiin tekstitietokanta asiakirjoista doc-, txt- ja html-muodoissa, joiden yhteenlaskettu koko ei ollut suurempi eikä pienempi, vaan 20 gigatavua. Ryhmä tovereita vaatimattoman palvelijasi johdolla testasi, vertasi ja jakoi subjektiivisia vaikutelmiaan jokaisesta ohjelmistosta. Lue alta yhteenveto havainnoista. dtSearch Desktop

Ohjelma, joka kehittäjien mukaan väittää olevansa nopein, kätevin ja paras hakukone. Kuten yleensä kaikki muut tästä arvostelusta. dtSearch-käyttöliittymä on melko yksinkertainen, mutta jotkin ikkunat tai välilehdet ovat hieman ylikuormitettuja elementeillä, mikä vaikeuttaa sen käyttöä. Mutta todellisuudessa ei ole erityisiä vaikeuksia. Ainoa todella epämiellyttävä kohta on ohjelmiston tuen puute venäjän kielelle (huolimatta siitä, että ohjelma voi etsiä asiakirjoja useilla kielillä, sen käyttöliittymä on yksinomaan englanti).

Mutta dtSearch on yksi harvoista ohjelmista, jotka voivat indeksoida verkkosivut käyttäjän määrittelemään "syvyyteen" (tosin ottaen huomioon dtSearch Spider -lisäpaketin "lisäostoksen"). Tämä on sen lisäksi, että tuetaan erilaisten tekstimuotojen levytiedostoja ja sähköpostiviestejä Outlook-postilaatikosta. Samaan aikaan ohjelma ei voi toimia tietokantojen kanssa, jotka ovat hakukoneille niin maukkaita herkkuja niiden sisältämien suurten tietomäärien ja laajan leviämisen vuoksi yrityksissä ja siten yritysverkoissa. DtSearch-asiakirjojen indeksoinnin nopeus osoittautui sopivaksi. Tulevaisuudessa sanon, että tämä ohjelma selviytyi tietyn tietomäärän indeksoinnista toisen kilpailijan - iSYS:n - tasolla ja jakoi sen kanssa toisen sijan nopeimpien järjestelmien luettelossa. dtSearch indeksoi testin 20 gigatavua tietoa 6 tunnissa ja 13 minuutissa ja loi 7,9 Gt:n indeksin myöhempiä hakutarpeita varten.

Mitä tulee hakuominaisuuksiin, tässä ne ovat oikealla tasolla. Ensinnäkin dtSearchilla on morfologinen haku (sanan etsiminen kaikissa morfologisissa muodoissaan). Tätä tilaisuutta käyttämällä vapautat itsesi esimerkiksi sellaisista ajatuksista kuin "missä tapauksessa jotain sanaa käytettiin tarvitsemassani asiakirjassa?" Morfologisen haun käyttö on lähes aina perusteltua, joten sen tulisi olla läsnä kaikissa ammattihakukoneissa.

Äänihaku on epätyypillinen ominaisuus jopa ammattihakukoneille. Sen ydin on, että ohjelma etsii sanoja, jotka kuulostavat samalta kuin kirjoittamasi sana. Ja mikä parasta, tämä toiminto toimii myös venäjän kielellä! Kun esimerkiksi kirjoitat sanan "korva" hakukyselyyn, näet tuloksena sanojen "korva" lisäksi myös "korva".

Haku virheenkorjauksella on erittäin tärkeä toiminto. Sitä käytetään syntaktisia virheitä sisältävien sanojen etsimiseen - ne voivat olla joko kirjoitusvirheitä tai virheitä esimerkiksi merkintunnistusjärjestelmillä saaduista asiakirjoista. Yksinkertainen esimerkki - etsit sanaa näppäimistö. Joissakin dokumenteissa on sana "näppäimistö", on selvää, että tämä on itse asiassa sana "näppäimistö", henkilö on vain tehnyt kirjoitusvirheen kirjoittaessaan. Joten virheenkorjaushaku havaitsee ja sisällyttää tulokseen asiakirjan, jossa on sana "näppäimistö". dtSearchissa on myös asetus, jonka avulla voit määrittää mahdollisten virheellisten merkkien asteen.

Hae synonyymeillä. Tämä ominaisuus käyttää eri sanojen synonyymien luetteloa. Joten esimerkiksi syöttämällä sana "nopea", ohjelma löytää myös sanat "high-speed" ja muut, jotka ovat sanan "nopea" synonyymejä, jos ne tietysti ovat synonyymiluettelossa . Valmiita synonyymiluetteloita ei toimiteta dtSearch-ohjelman mukana, mutta luetteloita on mahdollista käyttää Internetissä (vastaavasti tarvitaan yhteys, mikä ei aina ole kätevää), tai voit luoda oman luettelon synonyymeistä .

Lueteltujen ominaisuuksien lisäksi dtSearch voi etsiä lauseita, jotka koostuvat loogisilla operaatioilla yhdistetyistä sanoista. Jokaiselle kyselyn sanalle voidaan määrittää oma "painonsa" eli merkitys. Hyödyllinen vaihtoehto on käyttää sanakirjaa, joka koostuu merkityksettömistä sanoista, jotta niitä ei oteta huomioon haussa, mutta tämä sanakirja on myös tyhjä ja sinun on täytettävä se itse.

Seuraavaksi tarkastellaan ohjelman ominaisuuksia, kun työskentelet verkossa. Itse asiassa dtSearch ei tarjoa mitään erityisiä ominaisuuksia verkon kanssa työskentelemiseen. On kuitenkin täysin mahdollista käyttää sitä verkossa. Vaihtoehtoisesti voit luoda jonkinlaisen indeksin ja laittaa sen julkiseen (jaettuun) kansioon. Itse ohjelma voidaan asentaa jokaisen käyttäjän tietokoneelle tai se voidaan sijoittaa myös julkisesti avoimeen kansioon ja luoda pikakuvakkeita erityisellä tavalla jokaiselle käyttäjälle erikseen komentoriviparametreilla, joiden tarkoitus on kuvattu. ohjelman mukana toimitetussa ohjetiedostossa. On myös mahdollista asentaa ohjelma automaattisesti verkkoon MSI-tiedoston avulla. Tämä ottaa huomioon kunkin yhdistetyn käyttäjän asetukset.

Yleensä se on hyvä ohjelma ammattimaisten hakukoneiden luokasta. Se voi saada hyvän arvosanan, mutta dtSearchin luottamuksen ja kunnioituksen saaminen ei välttämättä ole helppoa tietyistä tekijöistä johtuen (kaikki ei ole sujuvaa käyttöliittymän kanssa, venäläiset käyttäjät ovat vailla, verkon kanssa työskentelyyn ei ole kirkkaita ominaisuuksia) . Mitä tulee asiakirjojen suoraan etsimiseen, ohjelmalla ei ollut ongelmia venäjänkielisen tekstin kanssa. Kuten niitä ei ollut ilmoitetulla morfologialla tai sumealla haulla. Järjestelmä löysi varsin riittävästi tarvittavat asiakirjat sekä yksinkertaisella yksisanaisella kyselyllä että käyttämällä paria kappaletta tai dokumenttia avaimena.

Virallinen sivusto:
Jakelun koko: 23 MbIschika Prof Deluxe

Nimen perusteella voit arvata, että tässä ohjelmassa on tuki venäjän kielelle. Tämä on jo mukavaa. Mitä tulee käyttöliittymään, se on yleensä hieman epätavallinen, mutta ulkonäöltään se on erittäin houkutteleva. Toinen asia on mukavuus. Erittäin kiistanalainen kriteeri, mutta silti luultavasti moniikkunaratkaisu ei ole menestynein vaihtoehto (pyyntö syötetään yhteen ikkunaan, tulos näytetään toisessa ja vastaavat).

Snoop käyttää samoja indeksejä pikahakujen suorittamiseen, mutta indeksointi on paljon hitaampaa kuin muut ohjelmat. Tämä on hyvin outoa, varsinkin kun otetaan huomioon, että sen hakukyselyiden käsittelymahdollisuudet ovat erittäin heikot, ja siksi hakemistorakenne ei ole monimutkainen. Todennäköisesti tämä johtuu optimoimattomista algoritmeista. Tämä ohjelma osoittautui selkeäksi ulkopuoliseksi indeksoinnissa ja hakunopeuksissa: indeksin luomiseen käytetty aika on kuusi kertaa pidempi kuin dtSearchilla ja iSYS:llä. Verikoiralle 20 gigatavun tekstien indeksointi johti 38 tunnin ja 46 minuutin työaikaan. Ja luotu "hakualue" otti kiintolevyllä saman koon kuin alkuperäiset tiedot pienellä miinuksella - 19 gigatavua.

Bloodhound voidaan esittää vaihtoehtona tavalliselle haulle Windowsissa, se ei todennäköisesti pysty enempään. Se tosiasia, että Snooperin ensisijainen tehtävä on yksinkertaisin tiedostojen haku, ei osoiteta vain hakukyselyiden tekstin analysointitoimintojen vähäisyydestä ja tarkennetusta hausta tiedostoattribuuttien perusteella, vaan jopa tulosikkunasta, joka tarjoaa suorat linkit tiedostoon. löydettyjä tiedostoja sekä näitä tiedostoja sisältäviin kansioihin. Tulosikkuna ei ole kovin informatiivinen siinä mielessä, että voit lukea koko löydetyn tiedoston vain suorittamalla sen, eli siinä ei ole sisäänrakennettua tiedostojen katseluohjelmaa. Mutta ote tiedostosta, josta etsitty sana löydettiin, näytetään yleensä, tämä näyttöjärjestelmä muistuttaa hyvin Internet-hakukoneita.

Kun puhutaan hakukyselyiden käsittelyn erityisominaisuuksista, on syytä huomata, että "hakutekstiä" ei ole olemassa, maksimi haettava on lause, jos vain siksi, että siinä ei ole monirivistä tekstinsyöttökenttää. Voit kuitenkin analysoida syötetyn lauseen, ja Snoop tarjoaa meille vakiohakusarjan täällä: loogiset operaatiot, maskihaku ja lainaushaku... ei paljon. Ohjelma sisältää joitain morfologisen haun alkeita, mutta se on luultavasti niin karkea, että se todennäköisesti häiritsee oikeaa toimintaa (testien aikana havaittiin monia virheitä morfologian väärinkäytöstä).

Mutta ohjelman avulla voit määrittää haettaessa tiedostoattribuutteja (asiakirjan päivämäärä, tiedostonimi, kansion nimi), ja näissä kyselyissä voit myös käyttää samaa hakujoukkoa. Voit myös etsiä kirjaimia määrittämällä parametrit (From, Subject... jne.).

Joten selvitimme itse haun, mitä muuta mielenkiintoista on ohjelmassa, josta se sai niin monia palkintoja virallisen verkkosivuston tietojen mukaan? On vaikea sanoa, mikä siinä on niin erikoista, että Bloodhoundin käyttöliittymä on houkutteleva (täsmälleen ulkonäöltään, käytettävyydestä puhumattakaan).

Toiminnot indeksien kanssa ovat hyvin tavallisia. Mukava ominaisuus on kyky päivittää indeksejä aikataulun mukaan. Lisäksi indeksejä voidaan käyttää myös verkossa. Tästä eteenpäin tarvitsemme lisätietoja.

Hakukyselyiden primitiivisyydestä huolimatta ohjelmaa voidaan käyttää tiedostojen etsimiseen, joten sen käyttö voi olla perusteltua verkoissa. Vaikka tämä on venyttely, koska suuressa verkossa ensisijaisena on etsiä nopeasti tietoja monimutkaisilla hakukyselyillä valtavan tietomäärän vuoksi - ja haun ja ohjelman nopeudessa on selvästi ongelmia. Minun on sanottava, että työ Izhishkan verkon kanssa on harkittu niin kuin sen pitäisi olla. Erillinen sovellus on suunniteltu erityisesti tätä varten - Bloodhound Server. Se toimii samalla tavalla kuin pelkkä Snooper (heillä on yksi hakukone), vain asiakirjoille, jotka sijaitsevat keskuspalvelimella tai jaetuilla resursseilla yritysverkossa. Snooper Server luo uusia indeksejä jaetuille resursseille tai käyttää aiemmin luotuja. Kuka tahansa yritysverkon käyttäjä voi muodostaa yhteyden hakupalvelimeen ja käyttää sitä mihin tahansa asiakirjaan (joka sijaitsee nykyisessä hakemistossa) Internet-selaimella. Hyväksy, tämä järjestelmä on erittäin kätevä: käy ilmi, että omassa verkossasi olevia tiedostoja voidaan etsiä samalla tavalla kuin tietoa Internetistä esimerkiksi Googlen kautta.

Arvioimalla tämän ohjelman kaikkia etuja ja haittoja, johtopäätös viittaa siihen, että sen ominaisuudet eivät todennäköisesti riitä yritysverkkoihin (huolimatta hyvästä verkon kanssa työskentelyn organisoinnista), mutta kotitietokoneelle tai jopa kotiverkkoon se on , periaatteessa, se saattaa toimia. Vaikka työn nopeus tai hakumahdollisuudet eivät herätä optimismia...

Virallinen verkkosivusto venäjäksi:
Jakelun koko: 6 Mt Google Desktop Search + GDS Enterprise

Emme tietenkään voineet sivuuttaa niin kuuluisaa kehittäjää. Nimi Google kertoo jo paljon. Ihmiset, jotka ovat käyttäneet tehokkainta Internet-hakukonetta vuosia, päättävät luultavasti epäilemättä asentaa tämän hakukoneen tietokoneelleen. Ajattele vain: Google kotitietokoneellasi! Antamatta kuitenkaan periksi provokaatioille laajasti mainostetun brändin kanssa, yritetään harkita raittiisti ja mikä tärkeintä objektiivisesti Googlen "työpöytähakukoneen" ominaisuuksia.

Ensimmäinen asia, joka pistää silmään, on oman kuoren puute ohjelmalle. Google Desktop Search sijaitsee edelleen selainikkunassa, vastaavasti, koko työpöytäversion käyttöliittymä on peritty ohjelmistolta sen vanhemmalta Internet-veljeltä. Se, onko tämä hyvä vai huono asia, on kiistanalainen: jotkut ihmiset pitävät tämän hakukoneen suunnittelun minimalismista, kun taas toiset haluavat nähdä täysimittaisen sovelluksen, joka on täynnä kaikenlaisia ​​painikkeita ja niin edelleen.

Mikä pistää silmään heti suunnittelun jälkeen? Ja se tosiasia, että tämä sama Google Desktop Search alkaa indeksoida kaikkea tietokoneella ilman mitään tarvetta! Ja mikä mielenkiintoisinta, on se, että on mahdotonta valita indeksointipolkuja Google Desktop Searchin avulla. Sinun on ladattava erillinen ohjelma (TweakGDS), jonka avulla voit laajentaa jonkin verran Google Desktopin asetuksia, mukaan lukien indeksointiin tarvittavien paikkojen määrittäminen. Vaikka kun ymmärrät kaiken tämän, se indeksoi jo tavallisen kiintolevyn, joten tätä asetusta tarvitaan todennäköisemmin käytettäessä suuria tietomääriä, mikä on erittäin tärkeää, kun sitä käytetään yritysverkoissa (yritysversiot). . Ei kuitenkaan ole tosiasia, että TweakGDS:n lataamisen jälkeen ongelmasi ratkaistaan. Loppujen lopuksi se vaatii Microsoft .NET Frameworkin ja Microsoft Scripting Runtime -ohjelman toimiakseen. Joo... asennuksen, kuten myös asetusten pääsyn, olisi voitu tehdä yksinkertaisempaa, vaikka kehittäjät varmaan ymmärtävät: miksi kirjoittaa jotain uutta, kun on valmis hakukone, portti paikalliselle tietokoneelle ja antaa käyttäjä "nauti" , ja kuuluisa nimi tekee "tästä" toisen mestariteoksen. No, lopetetaan tämä lyyrinen poikkeama ja siirrytään etsimään.

Mitä tulee hakukyselyjen analysointiin ja tulosten toimittamiseen, kaikki täällä on täysin identtistä Googlen kanssa Internetissä: sama tulosten näyttöjärjestelmä, samat standardit loogiset toiminnot hakukyselyille. Yleensä Google Desktop Search, kuten edellinen ohjelma, on tarkoitettu yksinomaan tiedostojen etsimiseen - sillä ei tietenkään ole sisäistä katseluohjelmaa näille tiedostoille. Google Desktop Searchin tukemien tiedostomuotojen määrä on varsin riittävä, ja on myös mukavaa, että se hakee vierailtuja Internet-sivuja ottamalla tietoja välimuistista. Haku- ja indeksointinopeudet ovat melko hyväksyttäviä. Totta, kotikäyttöön. Google Desktop Search selvitti vaikuttavat 20 gigatavua tekstiä 8 tunnissa ja 17 minuutissa. Useiden päivien käyttäminen suuren yrityksen yritysverkosta tulevien tietojen käsittelyyn ei ole asia, jota kukaan järjestelmänvalvoja haluaisi tehdä. Hyvä puoli: luodun hakemiston koko oli samalla tasolla (4,5 Gt) kuin toinen tässä katsauksessa testattu hakukone - SearchInform.

Google Desktop Searchin suuri etu (tai haitta - sinä päätät) on, että se tukee laajennuksia, jotka voivat muuttua paljon parempaan suuntaan. Toinen asia on, että laajennusten yhdistäminen ja niiden määrittäminen vaikeuttaa hakukoneen asennusta niin paljon, että alat miettiä, onko tämä kaikki välttämätöntä, kun voit asentaa normaalin, täysimittaisen ohjelman, jossa kaikki on jo olemassa. Loppujen lopuksi jokaisen ominaisuuden käyttämiseksi sinun on asennettava uusi laajennus. Jopa jotta ohjelma toimisi täysin arkistojen kanssa, tarvitaan erillinen gadget. On kiehtovaa ja viettelevää, että kaikki nämä lisämoduulit ovat ilmaisia. Jos et kuitenkaan ota huomioon hakukoneen työpöytäversiota, GDS Enterprisen pätevä konfigurointi ei välttämättä ole sinun voimasi - eihän se ole turhaan, että Googlen asiantuntijat tarjoavat palveluitaan oman omien määrittämiseensä. ohjelmisto verkkoosi vain 10 000 dollarilla.

Jos käyt läpi asennus- ja asennusprosessin (tai maksat 10 000 dollaria Googlen pikavastaustiimille), ymmärrät, että asennuksen monimutkaisuus on enemmän kuin kompensoitu erittäin joustavilla asetuksilla, kun niitä käytetään yritysverkoissa. Tärkeä osa Google Desktopin käyttöä yritysverkossa on ryhmäkäytäntöjen käyttö, mikä mahdollistaa asetusten määrittämisen jokaiselle käyttäjälle.

Yhteenvetona voidaan todeta, että tämän ohjelman järkevin käyttö on koti- tai työtietokone. Loppujen lopuksi tavalliselle tietokoneelle riittää vain ohjelman asentaminen - se tekee loput itse (se ei edes kysy sinulta mitään).

Google Desktop Search Enterprise hyväksytään kuitenkin tapauksissa, joissa on kiireellisesti tarpeen määrittää joustava verkkokäytäntö hakukoneen käyttöä varten, kun taas kyky käsitellä hakukyselyitä on toisella sijalla tärkeyden ja ajan (tai rahan) suhteen. ), joka on käytetty ohjelman perustamiseen, on ensimmäisellä sijalla.

Virallinen sivusto:
Jakelukoko mukaan lukien TweakGDS: 1,2 MbCopernic Desktop Search

Klikkaa kuvaa suurentaaksesi

Ohjelman käyttöliittymä herättää erittäin positiivisia tunteita - kaikki tehdään yleisesti hyväksyttyjen standardien mukaisesti, ei mitään tarpeetonta, sanalla sanoen miellyttävä muotoilu. Aloittelijalle Copernic Desktop Search -käyttöliittymän ymmärtäminen on erittäin helppoa. On kuitenkin hieman hämmentävää, että suunnittelijat loivat ohjelman käyttöliittymän selkeästi ottaen huomioon sen, että ohjelma toimii Windows XP:n vakioteemassa. Klassista teemaa käytettäessä ohjelma ei näytä niin hyvältä. Mutta tämä on enemmän makuasia.

Ensimmäisellä käynnistyksellä ohjelma kehottaa luomaan hakemistoja hakua varten. Tuntui hieman epätavalliselta, että indeksoitavien kansioiden valinnan jälkeen ohjelma ei tarjonnut painaa mitään painiketta, kuten "Aloita indeksointi", eikä indeksointi käynnistynyt automaattisesti, vasta sitten havaittiin, että Copernic yritti aloittaa indeksoinnin tietokoneen ollessa käynnissä. oli käyttämättömänä. Sinun on kaivettava hieman syvemmälle ohjelman asetuksia, jotta voit määrittää kaiken oikein. On huomattava, että automaattisen indeksin luomisen asettamiseen on melko laajat mahdollisuudet: sisäänrakennettu ajastin, mahdollisuus indeksoida tietokoneen ollessa lepotilassa, taustalla, alhaisella prioriteetilla. Indeksointi ei ollut liian nopeaa - 10 tuntia 51 minuuttia - tämä on hitaampaa kuin muissa hakukoneissa (paitsi Isle of Bloodhound, mutta Copernic on silti suuruusluokkaa nopeampi kuin iSleuthHound Technologiesin kehitys).

Nyt indeksin rakenteesta. Yleisesti ottaen siinä ei ole mitään erikoista. On mahdollista valita tiedostotyyppejä sekä yleisessä että yksityiskohtaisessa muodossa. Eli aluksi voit valita, mitä haluat indeksoida - asiakirjat, kuvat, videot, musiikki. Asetusikkunan toisessa välilehdessä voit valita tiettyjä tiedostotyyppejä laajennuksen mukaan. Lisäksi voit määrittää indeksin siten, että esimerkiksi alle 16x16 kokoisia kuvia ei indeksoida tai alle 10 sekuntia pitkiä äänitiedostoja ei indeksoida. Kansioiden tiedostojen indeksoinnin lisäksi Copernic voi työskennellä sähköpostien ja yhteystietojen kanssa Microsoft Outlookin ja Microsoft Outlook Expressin osoitekirjasta, ja on mahdollista indeksoida suosikkeja ja historiaa Internet Explorerista.

Mitä tulee hakuominaisuuksiin, ne ovat täällä erittäin heikkoja. Testien aikana jopa paljastettiin, että ohjelma ei etsi asiakirjoja txt- ja html-muodoissa venäjäksi, joten voit löytää ne vain otsikoiden, ei sisällön perusteella. Ainoa asia, jonka ohjelma tarjoaa haun tehokkuuden parantamiseksi, on standardien loogisten operaatioiden käyttö, ja silloinkin tämä ominaisuus löydettiin kokeellisesti, koska sitä ei dokumentoitu. Muuten, ohjelman apu ei myöskään ole kunnossa - se on saatavilla vain Internetin kautta, mikä, näet, on erittäin hankalaa, eikä Internetissä ole liikaa apua. Ilmeisesti kehittäjät päättivät, että ohjelman yksinkertainen käyttöliittymä ei tarkoita normaalin avun läsnäoloa. Jatkamalla keskustelua hakuominaisuuksista, on huomattava, että kyselyiden heikosta analyysistä huolimatta ohjelma tarjoaa mielenkiintoisen hakujärjestelmän - käyttäjä voi valita tiedostotyypin (kuvat, videot, musiikki jne.), kirjoittaa haun kysely ja valitse valitulle tiedostotyypille ominaiset attribuutit. Esimerkiksi äänitiedostoille nämä voivat olla arvoja mp3-tunnisteista (esittäjä, albumi, päivämäärä jne.), kuville esimerkiksi voit valita niiden koon (resoluutiolla), yleensä jokaisella tyypillä on omat arvonsa. omat asetukset. Kun olet etsinyt tietyn tiedostotyypin, ohjelma näyttää tulosikkunassa erittäin informatiivisen luettelon, ja jos pyyntösi sisältää muun tyyppisiä tiedostoja, voit avata ne napsauttamalla tiettyä linkkiä.

Erikseen kannattaa mainita tulosten näyttöikkuna. Löydettyjen tiedostojen luettelon alla näkyy näiden tiedostojen sisältö (samalaista järjestelmää käytetään usein sähköpostiohjelmissa). Totta, tekstin katselu voidaan tehdä vain alkuperäisessä muodossa, eikä pelkkää tekstin näyttötilaa ole, mikä ei ole aina kätevää, koska asiakirjan avaaminen vie tässä tapauksessa enemmän aikaa. Mutta koska Copernic voi etsiä kuvia ja musiikkia, on mahdollista tarkastella näitä multimediatiedostoja.

Tämän ohjelman perusperiaatteet on kuvattu, katsotaan nyt mitä Copernic Desktop Search voi tarjota meille verkon kanssa työskentelyyn... Periaatteessa voit katsoa hyvin pitkään, mutta tuskin näet mitään . Toisin sanoen tätä ohjelmaa ei ollut tarkoitettu verkko-ohjelmaksi. Copernic Desktop Search on yksinomaan kotihakukone.

Ilmeisesti tämän ohjelman ainoa (loogisin) sovellus on kotitietokone. Täällä se selviytyy täysin kaikista yksinkertaisista yhdestä tai kahdesta sanasta koostuvista käyttäjien hakukyselyistä, löytää tarvittavat tiedot ja haun jakamisen tiedostotyypin mukaan ja tukee multimediatiedostoja sekä taustan indeksointia alhaisen prioriteetin tilassa yhdistettynä miellyttävään käyttöliittymä, anna ohjelmalle vain voimaa saavuttaa luottamus kokemattomien käyttäjien keskuudessa.

Virallinen sivusto
Jakelukoko: 2,6 MbISYS Desktop

Klikkaa kuvaa suurentaaksesi

Erittäin tehokas ohjelma. Varustetasoltaan kaikenlaisilla toiminnoilla se on jossain lähellä listan seuraavaa SearchInform-hakujärjestelmää. Lisäksi asennustiedoston koko on yli 40 Mt! Vaikea sanoa, mitä tällaisiin mittoihin voisi puristaa, koska sama SearchInform samanlaisilla toiminnoilla vie 15 Mt.

Myöskään asennusprosessi ei ole kovin miellyttävä, tai pikemminkin ei edes asennusprosessi. Jo ennen ohjelman lataamista sinua pyydetään rekisteröitymään, muuten ei ole mahdollista. Seuraavaksi käyttöliittymä. Se on tehty erittäin kauniisti, mikään turha ei jää silmään, mutta nämä ovat vaikutelmia ihmisestä, joka on jo jonkin verran tottunut siihen. Aloittelijan ei ole helppoa selvittää, missä ja mikä sijaitsee, mistä napsauttaa ja mistä lopulta etsiä. On erittäin suositeltavaa lukea ohje ennen työn aloittamista - säästät paljon hermoja ja aikaa. Kaikkeen muuhun on lisätty venäjän kielen tuen täydellinen puute ohjelmassa. Ei hyvä. Lisäksi täällä olevat ikkunat eivät ole ylikuormitettuja säätimillä, mutta jouduimme maksamaan tästä monimoduuleilla ja lisäikkunoiden käytöllä. Esimerkiksi hakukyselyt syötetään käynnistämällä yksi ohjelma ja indeksinhallinta suoritetaan toisella ohjelmalla. Hakukyselyt syötetään myös tähän erillisiin ponnahdusikkunoihin. On vaikea sanoa, kumpi on parempi - ylikuormitettu käyttöliittymä vai kaikkialla esiintyvät useat ikkunat, se on pikemminkin makuasia.

Mitä tulee indeksien luomiseen, ohjelma tarjoaa ominaisuuksia, jotka yksinkertaistavat uuden indeksin asetusten määrittämistä. Näihin ominaisuuksiin kuuluu useita valmiita malleja hakemistojen luomiseen kansioihin "Omat asiakirjat", "Mail", "Mail and Documents", "Specific Folder", "Kansio, jossa on valikoima tiedostotyyppejä" jne. Tällaiset mallit yksinkertaistavat indeksien luominen ensimmäisessä vaiheessa. Indeksien kanssa työskentelyn apuohjelmalla ei ole kovin hyvää käyttöliittymää, mikä pelottaa monimutkaisuudella (tämä on erittäin subjektiivinen arvio, ollakseni rehellinen), mutta jos katsot sitä, se tarjoaa monia hyödyllisiä vaihtoehtoja ja yleensä , sen käyttö ei aiheuta suuria vaikeuksia. ISYS Desktop voi indeksoida tietoja useista tietolähteistä ja tarjoaa myös monia joustavia asetuksia indeksointiin. Muita indeksointiominaisuuksia ovat: tuki SQL:lle, FTP:lle, TRIM Contextille, WORLDOX 2002:lle ja skripteille. Jos valitsit hakemistoa luodessasi kohdan "Kansio tiedostotyyppien valinnalla", sinulla on mahdollisuus valita tiedostotyypit indeksoitaviksi manuaalisesti (laajennuksella). On sanottava, että tuettuja tiedostotyyppejä on yksinkertaisesti valtava määrä, mutta et voi lisätä omaa tyyppiäsi (laajennusta) olemassa olevaan luetteloon. Voit myös huomata indeksoinnin ajastimen olemassaolon. Indeksin luominen ja 20 gigatavun tiedon käsittely vei ISYS Desktopilta 6 tuntia ja 13 minuuttia, mikä lopulta osoitti hyvää aikaa ja luodun tiedoston kokoa - 7,9 Gt.

Tämän ohjelman hakuominaisuudet ovat melko hyvät. Se, mitä ISYS:ssä käytetään, on paljon tehokkaampi kuin perinteinen loogisten toimintojen tuki. Tarkennetuista hakuominaisuuksista ohjelma tarjoaa synonyymien käytön ja lajittelusuodattimen (polun, nimen ja tiedoston luontipäivämäärän mukaan). Loogisten operaattorien joukko on jonkin verran laajempi kuin standardijoukko. Loogisten operaatioiden lisäksi ohjelman avulla voit työskennellä monien muiden operaattoreiden kanssa, jotka periaatteessa voivat korvata tietyn tyyppisiä hakuja, esimerkiksi haun jäsennys voidaan korvata kokonaan käyttämällä erityisiä operaattoreita. Olin hyvin yllättynyt, että ohjelmassa ei ole morfologiaa käyttävää hakua. Tämä on vakava puute, koska haun tehokkuus paranee huomattavasti morfologista analyysiä käytettäessä. Lisäksi ei ole luetteloa merkittävistä sanoista, mutta on laaja luettelo merkityksettömistä sanoista. Myös hakutoiminnot, kuten "likimääräinen haku" ja "heuristinen analyysi", julkistetaan.

ISYS tarjoaa useita erilaisia ​​hakukyselytyyppejä, nimittäin visuaalisia. Tämä tehdään käyttämällä erityyppisiä ikkunoita hakukyselyiden syöttämiseen, mutta itse asiassa mikään ikkuna ei salli muiden kuin yllä lueteltujen teknologioiden käyttöä.

Hakutulokset ovat erittäin informatiivisia, ja ne näytetään asiakirjojen luettelona, ​​joka on lajiteltu osuvuuden mukaan. Valitun asiakirjan esikatselu näkyy alla. Toisin kuin Copernic Desktop Search, esikatselu on käytettävissä vain pelkkänä tekstinä, ei ole mahdollista näyttää asiakirjoja alkuperäisessä muodossaan, oli se sitten Word, HTML tai PDF, vaikka tämä ei periaatteessa ole liian kriittinen. Ohjelman avulla voit jakaa löydetyt asiakirjat ryhmiin tiettyjen kriteerien mukaan (oletusarvoisesti ne on jaettu merkityksen mukaan). Voit myös tarkastella jo löydettyjä asiakirjoja valitsemalla yksittäisiä kansioita (tämä on kätevää, kun tulos tuottaa erittäin suuren määrän asiakirjoja).

Ohjelman käyttäminen yritysverkossa on myös erittäin perusteltua, koska se tarjoaa hyvät mahdollisuudet verkkohaun järjestämiseen. Hakujärjestelmä perustuu julkisen indeksin luomiseen, joka sisältää indeksoituja tietoja julkisista verkkoresursseista.

Itse asiassa ISYS:n ohjelma on huomion arvoinen, ainakin siihen tutustuminen. Tämä ohjelma on kypsä projekti, jossa on valtava määrä toimintoja (ei aina eivätkä kaikki tietenkään tarvitse niitä, mutta silti). Todennäköisyyttä, että ohjelma näkee joitain parannuksia hakukyselyjen käsittelyssä, ei ole tiedossa, mutta tällä hetkellä sitä voidaan suositella melkein yleiseen käyttöön. Ja koska se on edelleen liian raskas kotijärjestelmiin, sen tärkeimmät asennuspaikat ovat yritysverkot.

Virallinen sivusto:
Jakelun koko: 40 MbSearchInform

Klikkaa kuvaa suurentaaksesi

Ei luultavasti kannata aloittaa heti SearchInform-käyttöliittymän kuvauksella. Meidän pitäisi ensin kuvata asennusprosessi, tai pikemminkin yksi sen yksityiskohdista: et voi asentaa ohjelmaa ilman Internet-yhteyttä. Tosiasia on, että ennen ensimmäistä käynnistystä ohjelma vaatii käyttäjän rekisteröinnin (ilmainen) ja lähettää kaikki syötetyt tiedot palvelimelle. Ilmeisesti kehittäjien oli ryhdyttävä tällaisiin toimenpiteisiin piratismin torjunnassa, mutta tällä ei ollut positiivista vaikutusta asennuksen helppouteen.

Ohjelman käyttöliittymä on suunniteltu noudattaen kaikkia yleisesti hyväksyttyjä sääntöjä, mutta ensi silmäyksellä se on hieman hankala. Ohjelmaa ensimmäistä kertaa käytettäessä se näyttää liian monimutkaiselta, joskus ei ole helppo muistaa, missä valikossa tai välilehdellä haluttu vaihtoehto sijaitsee, mutta pidemmällä käytöllä käyttöliittymä ei enää vaikuta niin hirveän monimutkaiselta . Tärkeintä on lukea todistus ensin.

Kun olet ymmärtänyt käyttöliittymän hieman, voit aloittaa indeksin luomisen. Itse prosessi on hyvin yksinkertainen ja indeksointinopeus, jopa silmällä, on huomattavasti suurempi kuin kaikilla muilla tarkastelun hakukoneilla. Selkeät testiluvut osoittavat, että SearchInform on indeksointinopeudessa kaksi kertaa nopeampi kuin dtSearch ja iSYS! Ohjelma indeksoi toimitetut tiedot 20 gigatavua ennätysajassa 3 tuntia 17 minuuttia. Ja luodun indeksin koko osoittautui pienimmäksi 4,4 Gt - 100 megatavua vähemmän kuin Google Desktop Search.

Ohjelma tukee tavallisten tiedostojen ja kansioiden lisäksi myös sähköpostien indeksointia, tietokantojen yhdistämistä ja indeksointia (!) ja muita ulkoisia lähteitä (DMS, CRM), heti indeksoinnin aikana voit määrittää sanakirjan morfologisen haun suorittamista varten ja kaikki attribuutit voidaan indeksoida tiedostoja. Kun hakemiston luomisen jälkeen yrität tehdä ensimmäistä testihakua asiakirjoille, saatat hämmentyä: "tässä on kahdenlaisia ​​hakuja, mutta kumman tarvitsen?" Kuten aiemmin mainittiin, tärkeintä on lukea todistus, niin kaikki tulee selväksi. Ohjelma voi itse asiassa suorittaa kahdenlaisia ​​hakuja - lausehaun ja etsiä asiakirjoja, jotka ovat sisällöltään samanlaisia ​​kuin kyselyn teksti.

Yllä annettiin kuvaus kaikista tärkeimmistä hakukyselyn analysoinnin toiminnoista, joten nyt luetellaan vain tämän ohjelman tarjoamat hakuominaisuudet. Aloitetaan lausehakulla: tietysti morfologinen haku, lainaushaku, loogiset operaatiot, haku sanan jäsentämisellä (haku sanan alusta, lopusta, keskiosasta tai täydellinen haku), sekaviittaushaku ( kun kaikki kyselyn sanat on oltava dokumentissa, mutta eivät välttämättä syötetyssä järjestyksessä), haku virheenkorjauksella, synonyymien käyttö, "melkein lainaushaku" (hae syötetty lause sitaattina, mutta muut sanat voivat olla läsnä syötettyjen sanojen välissä) jne. Joillakin luetelluista vaihtoehdoista on omat erityisasetukset. Lisäksi on mahdollista käyttää merkityksettömien sanojen sanakirjaa, ja ohjelmalla on jo valmis luettelo näistä sanoista, voit myös käyttää hakua varten ensisijaisten sanojen sanakirjaa (tietenkin sinun on täytettävä se). sinä itse).

Tässä periaatteessa tarkastelimme lyhyesti kaikki lausehaun pääominaisuudet.

Jatketaan tämän ohjelman ominaisuuksien tarkastelua - vastaavien asiakirjojen etsimistä. Kehittäjät väittävät, että tämä ei suinkaan ole yksinkertainen tekstihaku, se on nimenomaan "samankaltaisten haku" - juuri näin sitä kuvataan kaikkialla, mutta no, voit kutsua sitä miksi haluat - pääasia on . Pikahaku Internetissä paljastaa nopeasti, että niin sanottu "samanlainen haku" on uusi kehitysaskel tekstianalyysin alalla. Tämän järjestelmän avulla voit löytää semanttisesti sisällöltään samankaltaisia ​​tekstejä. Kaikkein miellyttävintä oli, että koehakukyselyjen jälkeen kävi ilmi, että teoria osuu aika hyvin yhteen käytännön kanssa! Ohjelma itse asiassa etsii asiakirjoja, joilla on samankaltainen sisältö, ja näyttää ne luettelossa lajittelemalla ne samankaltaisuusprosenttien mukaan.

Katsotaan seuraavaksi, mitä SearchInform (erityisesti sen yritysversio SearchInform Corporate) tarjoaa työskentelyyn yritysverkossa. Sovelluksia on kahdenlaisia: palvelinpuoli ja käyttäjäpuoli. Palvelinosa käsittelee erikseen määritellyt indeksit, ja käyttäjät voivat käyttää niitä hakuun, riippuen niille myönnetyistä käyttöoikeuksista. Käyttäjät voidaan määrittää automaattisesti käyttämällä Windows-tilejä (ammattimaisesti SearchInform käyttää NTFS Windows -todennusta) tai manuaalisesti (käyttäjät on lisättävä erikseen). Jokaiselle käyttäjälle voidaan sallia tai evätä pääsy tiettyihin indekseihin, ja käyttäjät voidaan myös yhdistää ryhmiin. Yleisesti ottaen SearchInformin verkkotyöskentelyasetukset ovat joustavuuden suhteen edellä Googlea ja mukavuuden ja yksinkertaisuuden suhteen Ishhound Serveriä.

Virallinen sivusto:
Jakelun koko: 14,7 Mb Indeksointinopeuksien vertailu

HakujärjestelmäIndeksointiaikaIndeksin koko
Bloodhound Prof Deluxe 4.538 tuntia 46 minuuttia19 GB
Isys Desktop 7.06 tuntia 13 minuuttia7,9 Gt
DtSearch 7.06 tuntia 3 minuuttia8,6 Gt
Google Desktop Search Enterprise8 tuntia 17 minuuttia4,5 Gt
Copernic Desktop Search *10 tuntia 51 minuuttia7 Gt
SearchInform 1.5.023 tuntia 17 minuuttia4,4 Gt

* Suurin osa venäjänkielistä tekstiä sisältävistä document.html- ja .txt-tiedostoista oli mahdotonta löytää paitsi niiden nimien perusteella, vaikka ne oli indeksoitu

Kaikki ohjelmat ovat huomion arvoisia.

Testien ja jokaisen katsauksessa esitetyn ohjelman huolellisen tarkastelun perusteella voidaan tehdä tiettyjä johtopäätöksiä. Joten Google Desktop Search Copernic Desktop Search sopii kokemattomalle käyttäjälle kodin tiedonhakujärjestelmäksi. Ne selviävät hyvin yksinkertaisista kyselyistä, eivät ylikuormita käyttäjää asetuksilla ja ovat lisäksi täysin ilmaisia. Googlen pyrkimys päästä yrityshakukonemarkkinoille ei ole vielä kovin perusteltua: jotta se toimisi kunnolla, ohjelma on varustettava lisämoduuleilla, eikä sen käyttöönotto ole läheskään helppoa. Siksi itsestään selvät nimet Desktop Search, Copernic ja Google varaavat taakseen "työpöytähakukoneiden" markkinaraon.

Totta, tehokkaammat ratkaisut - dtSearch, iSYS ja SearchInform eivät myöskään ole idioottivarmoja ja tarjoavat käyttäjille heidän "työpöytäversionsa". Mutta kohtuulliseen hintaan, toisin kuin Googlen ja Copernicin ilmaiset ohjelmistot. Tietysti joudut maksamaan tehosta, nopeudesta ja toimivuudesta. Mutta dtSearchin, iSYS:n ja SearchInformin kehittäjien pääpaino on tietysti yrityssektorilla. Verkottuminen, toiminnallisuus, indeksointi ja hakunopeus erottavat nämä tuotteet "kilpailijoistaan". Testitulosten perusteella löydettiin suosikki - SearchInform. Ohjelma tarjoaa mahdollisuuden etsiä samankaltaisia ​​asiakirjoja, sillä on nopein indeksointi ja hakunopeus, ja siinä on hyvä joukko toimintoja.

Aleksei Kutovenko

Ammattimainen Internet-haku

Johdanto

Internet-haku on tärkeä osa Internet-työskentelyä. Tuskin kukaan tietää varmasti nykyaikaisen Internetin verkkoresurssien tarkkaa määrää. Joka tapauksessa luku on miljardeissa. Jotta voisit käyttää kulloinkin tarvittavaa tietoa työ- tai viihdetarkoituksiin, sinun on ensin löydettävä se tästä jatkuvasti täydentyvasta resurssien valtamerestä. Tämä ei ole ollenkaan helppo tehtävä, koska nykyaikaisen Internetin tiedot eivät ole jäsenneltyjä, mikä aiheuttaa ongelmia sen löytämisessä. Ei ole sattumaa, että Internetin hakukoneista on tullut ainutlaatuisia "ikkunoita" tähän tietoavaruuteen.

On epätodennäköistä, että Internetin käyttäjien joukossa on ihmisiä, jotka eivät ole koskaan käyttäneet suuria universaaleja hakukoneita. Nimet Google, Yandex ja pari muuta suurta konetta ovat kaikkien huulilla. Ne selviävät erittäin hyvin jokapäiväisistä Internet-hakutehtävistä, eivätkä käyttäjät usein edes yritä etsiä korvaavaa. Samaan aikaan Internet-hakukoneiden määrä meidän aikanamme on tuhansia. Vaihtoehtoisten koneiden valikoiman syillä on erilaiset juuret. Jotkut hankkeet yrittävät kilpailla suoraan maailmanlaajuisten markkinajohtajien kanssa tekemällä huolellista työtä kansallisten Internet-resurssien kanssa. Toiset tarjoavat kyselyominaisuuksia, joita ei ole saatavilla tunnetuista hakukoneista. Huomattava osa vaihtoehtoisista moottoreista on erikoistunut tietyn aihealueen tai tietyntyyppisen sisällön etsimiseen ja saavuttaa vaikuttavia tuloksia näiden ongelmien ratkaisemisessa. Oli miten oli, tällaisten hakukoneiden sisällyttäminen käyttäjän omaan Internet-hakutyökalujen arsenaaliin voi parantaa merkittävästi sen laatua. Tässä on kuitenkin yksi vivahde: ​​sinun on tiedettävä tällaisista koneista ja kyettävä käyttämään niiden ominaisuuksia.

Oletamme, että tämän kirjan lukijat tuntevat jo melko hyvin yleisiä hakukoneita käyttävät hakutekniikat. Niin hyvä, että he tunsivat käyttöön liittyvät rajoitukset. Todennäköisesti tällaiset ihmiset ovat jo yrittäneet etsiä ja käyttää tiettyjä lisätyökaluja. Painettu sana ei sivuuta Internet-haun aihetta: artikkeleita ilmestyy säännöllisesti ja kirjoja julkaistaan. Mutta heidän sankarinsa ovat yleensä samat - useita johtavia universaaleja hakukoneita. Kirjasta eroaa se, että se yrittää kattaa kaikki modernit hakuratkaisut. Täältä löydät kuvauksia ja suosituksia parhaiden nykyaikaisten palvelujen käyttämiseen yleisimpiin hakuongelmiin. Tämä kirja on tarkoitettu ihmisille, jotka työskentelevät paljon Internetin parissa ja käyttävät verkostoa löytääkseen tarvitsemansa tiedon - olipa kyseessä sitten liike, opiskelu tai harrastus.

Internet-haun onnistuminen edellyttää kahden ehdon täyttymistä: kyselyjen on oltava hyvin muotoiltuja ja niitä tulee kysyä sopivista paikoista. Toisin sanoen käyttäjältä edellytetään toisaalta kykyä kääntää kiinnostuksen kohteet hakukyselyn kielelle ja toisaalta hyvää tietoa hakukoneista, käytettävissä olevista hakutyökaluista, niiden eduista ja haittoja, joiden avulla hän voi valita sopivimmat hakutyökalut kussakin tapauksessa .

Tällä hetkellä ei ole olemassa yhtä resurssia, joka täyttäisi kaikki Internet-hakuvaatimukset. Siksi, jos otat haun vakavasti, sinun on väistämättä käytettävä erilaisia ​​​​työkaluja, joista jokaista käytetään sopivimmassa tapauksessa.

Tarjolla on monia hakutyökaluja. Ne voidaan yhdistää useisiin ryhmiin, joista jokaisella on tiettyjä etuja ja haittoja. Kirjamme luvut on omistettu nykyaikaisten Internet-hakukoneiden pääryhmille.

Luku 1, "Universaalit Internet-hakukoneet", on omistettu suurille yleisille järjestelmille tiedon hakemiseen Webistä. Pääpaino on heidän edistyneimmissä instrumenteissaan, jotka yleensä jäävät suuren yleisön tutkan alle. Tunnettujen koneiden ominaisuuksien tarkastelu antaa meille eräänlaisen lähtökohdan ja antaa meille mahdollisuuden kuvitella selkeästi vaihtoehtoisten hakuratkaisujen soveltamisalaa.

Luku 2, "Pystysuuntainen haku", puhuu järjestelmistä, jotka ovat erikoistuneet tiettyihin aihealueisiin tai tietyntyyppiseen sisältöön.

Luku 3, "Metahaku", tutkii metahakukoneita, jotka voivat lähettää kyselyn samanaikaisesti useille Internet-hakukoneille ja sitten kerätä ja käsitellä tulokset yhdessä käyttöliittymässä.

Luku 4, "Semanttiset ja visuaaliset Internet-hakukoneet", tarjoaa yleiskatsauksen kokeellisista järjestelmistä, jotka tarjoavat alkuperäisiä käyttöliittymiä sekä mielenkiintoisia lähestymistapoja kyselyjen käsittelyyn.

Luku 5, "Suosituskoneet", puhuu äskettäin syntyneistä hakupalveluista, joiden englanniksi on osuvasti kutsuttu "Discovery Engines". Niiden avulla voit käsitellä useita kyselyitä, jotka ovat liian vaikeita muun tyyppisille Internet-hakukoneille.

Jos mikään valmis tuote ei sovi sinulle, voit luoda oman Internet-hakukoneesi. Luku 6, "Henkilökohtaiset hakukoneet", on omistettu tällaisten henkilökohtaisten koneiden luomiselle.

Useat kirjamme luvut on omistettu erityyppisen verkkosisällön etsimiseen. Luku 7, "Kuvanhaku", esittelee Internet-kuvahaun tämänhetkiset suuntaukset sekä siihen liittyvien kokeellisten järjestelmien ominaisuudet. Luku 8, "Videohaku", tarjoaa yleiskatsauksen johtavien yleisten Internet-hakukoneiden videohakutyökaluista sekä tämän alueen parhaista erikoisjärjestelmistä.

Luku 9, "Piilotetun sisällön löytäminen" on yleiskatsaus järjestelmiin, joiden avulla voit etsiä sisältöä, jota yleiset hakukoneet eivät näe. Tällaista "piilotettua" sisältöä ovat esimerkiksi torrentit tai FTP-palvelimilla ja tiedostojen isännöintisivustoilla isännöidyt tiedostot.

Luku 10, "Search for Web 3.0", esittelee Internet-hakutyökalut semanttisen Webin muodoissa oleville tiedoille.

Haku ei pääty vain tulosten saamiseen yhdestä tai toisesta hakukoneesta. Kirjamme viimeinen luku, luku 11, "Apuohjelmat", on omistettu tulosten käsittelyn ja tallentamisen työkaluille.

Ennen kuin aloitat tarinan tietyistä tuotteista, on järkevää ymmärtää nykyaikaisten Internet-hakutyökalujen luokittelu sekä määritellä termit, joita kirjamme sivuilta löytyy jatkuvasti.

Tärkeimmät Internet-hakutyökalut voidaan jakaa seuraaviin pääryhmiin:

Hakukoneet;

Web-hakemistot;

Ohjeresurssit;

Paikalliset ohjelmat Internetistä etsimiseen.

Suosituimmat hakuvälineet ovat hakukoneet - niin sanotut Internet-hakukoneet (Search Engines). Maailmanlaajuisen mittakaavan kolme parasta johtajaa ovat melko vakaita - Google, Yahoo! ja Bing. Monissa maissa omat paikalliset hakukoneet, jotka on optimoitu työskentelemään paikallisen sisällön kanssa, lisätään tähän luetteloon. Heidän avullaan voit teoriassa löytää minkä tahansa tietyn sanan monien miljoonien sivustojen sivuilta.

Monista eroista huolimatta kaikki Internetin hakukoneet toimivat samanlaisilla periaatteilla ja koostuvat teknisestä näkökulmasta samanlaisista alijärjestelmistä.

Hakukoneen ensimmäinen rakenteellinen osa on erikoisohjelmat, joita käytetään automaattiseen hakuun ja sitä seuraavaan verkkosivujen indeksointiin. Tällaisia ​​ohjelmia kutsutaan yleensä roboteiksi tai roboteiksi. He katsovat verkkosivujen koodia, löytävät niillä olevia linkkejä ja löytävät siten uusia verkkosivuja. On olemassa vaihtoehtoinen tapa sisällyttää sivusto hakemistoon. Monet hakukoneet tarjoavat resurssien omistajille mahdollisuuden lisätä itsenäisesti sivusto tietokantaansa. Verkkosivut kuitenkin ladataan, analysoidaan ja indeksoidaan. Ne korostavat rakenteellisia elementtejä, etsivät avainsanoja ja määrittävät niiden yhteydet muihin sivustoihin ja verkkosivuihin. Suoritetaan myös muita toimintoja, joiden tuloksena muodostuu hakukoneen indeksitietokanta. Tämä tietokanta on minkä tahansa hakukoneen toinen pääelementti. Tällä hetkellä ei ole olemassa yhtä täysin täydellistä hakemistotietokantaa, joka sisältäisi tiedot kaikesta Internetin sisällöstä. Koska eri hakukoneet käyttävät erilaisia ​​verkkosivujen hakuohjelmia ja rakentavat hakemistonsa eri algoritmeilla, hakukoneiden hakemistotietokannat voivat vaihdella huomattavasti. Useat hakukoneet indeksoivat joitakin sivustoja, mutta vain yhden hakukoneen tietokantaan sisältyy aina tietty prosenttiosuus resursseista. Tällaisen alkuperäisen ja ei-päällekkäisen hakemiston osan läsnäolo jokaisessa hakukoneessa antaa meille mahdollisuuden tehdä tärkeä käytännön johtopäätös: jos käytät vain yhtä hakukonetta, jopa suurinta, menetät varmasti tietyn prosenttiosuuden hyödyllisistä linkeistä. .

Mikä tämä on

DuckDuckGo on melko tunnettu avoimen lähdekoodin hakukone. Palvelimet sijaitsevat Yhdysvalloissa. Oman robotin lisäksi hakukone käyttää tuloksia muista lähteistä: Yahoo, Bing, Wikipedia.

Parempi

DuckDuckGo asettuu hakukoneeksi, joka tarjoaa maksimaalisen yksityisyyden ja luottamuksellisuuden. Järjestelmä ei kerää tietoja käyttäjästä, ei tallenna lokeja (ei hakuhistoriaa), ja evästeiden käyttö on mahdollisimman rajoitettua.

DuckDuckGo ei kerää tai jaa henkilökohtaisia ​​tietoja käyttäjiltä. Tämä on tietosuojakäytäntömme.

Gabriel Weinberg, DuckDuckGon perustaja

Miksi tarvitset tätä

Kaikki suuret hakukoneet yrittävät personoida hakutuloksia näytön edessä olevan henkilön tietojen perusteella. Tätä ilmiötä kutsutaan "suodatinkuplaksi": käyttäjä näkee vain ne tulokset, jotka vastaavat hänen mieltymyksiään tai jotka järjestelmä pitää sellaisina.

Muodostaa objektiivisen kuvan, joka ei riipu aiemmasta käyttäytymisestäsi Internetissä, ja eliminoi Googlen ja Yandexin temaattisen mainonnan kyselyjesi perusteella. DuckDuckGon avulla on helppo etsiä tietoa vierailla kielillä, kun taas Google ja Yandex suosivat oletusarvoisesti venäjänkielisiä sivustoja, vaikka kysely annettaisiin toisella kielellä.


Mikä tämä on

not Evil on järjestelmä, joka etsii anonyymiä Tor-verkkoa. Jotta voit käyttää sitä, sinun on mentävä tähän verkkoon, esimerkiksi käynnistämällä erikoistunut .

not Evil ei ole ainoa hakukone laatuaan. Siellä on LOOK (oletushaku Tor-selaimessa, käytettävissä tavallisesta Internetistä) tai TORCH (yksi Tor-verkon vanhimmista hakukoneista) ja muita. Päädyimme ei Eviliin Googlen selkeän vihjeen vuoksi (katso vain aloitussivu).

Parempi

Se etsii paikkoja, joissa Google, Yandex ja muut hakukoneet ovat yleensä kiinni.

Miksi tarvitset tätä

Tor-verkko sisältää monia resursseja, joita ei löydy lainkuuliaisesta Internetistä. Ja heidän määränsä kasvaa, kun hallituksen valvonta Internetin sisällöstä kiristyy. Tor on eräänlainen verkosto Internetissä, jossa on omat sosiaaliset verkostonsa, torrent-seurantaohjelmat, media, kauppaympäristöt, blogit, kirjastot ja niin edelleen.

3. YaCy

Mikä tämä on

YaCy on hajautettu hakukone, joka toimii P2P-verkkojen periaatteella. Jokainen tietokone, johon pääohjelmistomoduuli on asennettu, skannaa Internetiä itsenäisesti, eli se on analoginen hakurobotin kanssa. Saadut tulokset kootaan yhteiseen tietokantaan, jota kaikki YaCyn osallistujat käyttävät.

Parempi

On vaikea sanoa, onko tämä parempi vai huonompi, koska YaCy on täysin erilainen lähestymistapa haun järjestämiseen. Yhden palvelimen ja omistajayhtiön puuttuminen tekee tuloksista täysin riippumattomia kenenkään mieltymyksistä. Jokaisen solmun autonomia eliminoi sensuurin. YaCy pystyy etsimään syväverkosta ja indeksoimattomista julkisista verkoista.

Miksi tarvitset tätä

Jos olet avoimen lähdekoodin ohjelmistojen ja ilmaisen Internetin kannattaja, etkä ole valtion virastojen ja suuryritysten vaikutuksen alainen, YaCy on valintasi. Sitä voidaan käyttää myös haun järjestämiseen yrityksen tai muun autonomisen verkon sisällä. Ja vaikka YaCy ei ole kovin hyödyllinen jokapäiväisessä elämässä, se on hakuprosessin kannalta arvokas vaihtoehto Googlelle.

4. Pipl

Mikä tämä on

Pipl on järjestelmä, joka on suunniteltu etsimään tietoa tietystä henkilöstä.

Parempi

Piplin kirjoittajat väittävät, että heidän erikoisalgoritminsa tekevät hakuja tehokkaammin kuin "tavalliset" hakukoneet. Erityisesti etusijalla ovat sosiaalisten verkostojen profiilit, kommentit, jäsenluettelot ja erilaiset henkilötietoja julkaisevat tietokannat, kuten tuomioistuinten päätösten tietokannat. Lifehacker.comin, TechCrunchin ja muiden julkaisujen arviot vahvistavat Piplin johtajuuden tällä alueella.

Miksi tarvitset tätä

Jos haluat löytää tietoja Yhdysvalloissa asuvasta henkilöstä, Pipl on paljon tehokkaampi kuin Google. Venäjän tuomioistuinten tietokannat eivät ilmeisesti ole hakukoneen käytettävissä. Siksi hän ei tule niin hyvin toimeen Venäjän kansalaisten kanssa.

Mikä tämä on

FindSounds on toinen erikoistunut hakukone. Hakee erilaisia ​​ääniä avoimista lähteistä: talo, luonto, autot, ihmiset ja niin edelleen. Palvelu ei tue venäjänkielisiä kyselyjä, mutta siellä on vaikuttava luettelo venäjänkielisistä tunnisteista, joilla voit hakea.

Parempi

Lähtö sisältää vain äänet, ei mitään ylimääräistä. Asetuksissa voit määrittää haluamasi muodon ja äänenlaadun. Kaikki löydetyt äänet ovat ladattavissa. On haku kaavan mukaan.

Miksi tarvitset tätä

Jos haluat nopeasti löytää musketin laukauksen äänen, imevän tikan iskuja tai Homer Simpsonin huudon, tämä palvelu on sinua varten. Ja valitsimme tämän vain saatavilla olevista venäjänkielisistä kyselyistä. Englanniksi kirjo on vielä laajempi.

Vakavasti, erikoistunut palvelu vaatii erikoistuneen yleisön. Mutta entä jos se on hyödyllistä myös sinulle?

Mikä tämä on

Wolfram|Alpha on laskennallinen hakukone. Linkkien sijasta avainsanoja sisältäviin artikkeleihin se tarjoaa valmiin vastauksen käyttäjän pyyntöön. Jos esimerkiksi kirjoitat englanninkieliseen hakulomakkeeseen "vertaa New Yorkin ja San Franciscon populaatioita", Wolfram|Alpha näyttää välittömästi vertailun sisältävät taulukot ja kaaviot.

Parempi

Tämä palvelu on muita parempi faktojen etsimiseen ja tietojen laskemiseen. Wolfram|Alpha kerää ja järjestää verkossa saatavilla olevaa tietoa useilta eri aloilta, mukaan lukien tieteestä, kulttuurista ja viihteestä. Jos tämä tietokanta sisältää valmiin vastauksen hakukyselyyn, järjestelmä näyttää sen, jos ei, se laskee ja näyttää tuloksen. Tässä tapauksessa käyttäjä ei näe vain mitään tarpeetonta.

Miksi tarvitset tätä

Jos olet esimerkiksi opiskelija, analyytikko, toimittaja tai tutkija, voit käyttää Wolfram|Alphaa työhösi liittyvien tietojen etsimiseen ja laskemiseen. Palvelu ei ymmärrä kaikkia pyyntöjä, mutta kehittyy ja fiksuutuu jatkuvasti.

Mikä tämä on

Dogpile-metahakukone näyttää yhdistetyn luettelon hakutuloksista Googlesta, Yahoosta ja muista suosituista järjestelmistä.

Parempi

Ensinnäkin Dogpile näyttää vähemmän mainoksia. Toiseksi palvelu käyttää erityistä algoritmia löytääkseen ja näyttääkseen parhaat tulokset eri hakukoneista. Dogpilen kehittäjien mukaan heidän järjestelmänsä tuottavat täydellisimpiä hakutuloksia koko Internetissä.

Miksi tarvitset tätä

Jos et löydä tietoa Googlesta tai muusta tavallisesta hakukoneesta, etsi se useista hakukoneista kerralla Dogpilen avulla.

Mikä tämä on

BoardReader on järjestelmä tekstihakuun foorumeilla, kysymys- ja vastauspalveluissa ja muissa yhteisöissä.

Parempi

Palvelun avulla voit rajata hakukentän sosiaalisiin alustoihin. Erikoissuodattimien ansiosta löydät nopeasti kriteereitäsi vastaavat viestit ja kommentit: kieli, julkaisupäivä ja sivuston nimi.

Miksi tarvitset tätä

BoardReader voi olla hyödyllinen PR-asiantuntijoille ja muille mediaasiantuntijoille, jotka ovat kiinnostuneita massojen mielipiteestä tietyistä asioista.

Lopulta

Vaihtoehtoisten hakukoneiden elämä on usein ohikiitävää. Lifehacker kysyi Yandexin Ukrainan sivuliikkeen entiseltä pääjohtajalta Sergei Petrenkolta tällaisten projektien pitkän aikavälin näkymistä.


Sergei Petrenko

Yandex.Ukrainan entinen pääjohtaja.

Mitä tulee vaihtoehtoisten hakukoneiden kohtaloon, se on yksinkertainen: olla erittäin kapealla projektilla pienellä yleisöllä, joten ilman selkeitä kaupallisia näkymiä tai päinvastoin täysin selkeästi niiden puuttumisesta.

Jos katsot artikkelin esimerkkejä, voit nähdä, että tällaiset hakukoneet joko erikoistuvat kapeaan mutta suosittuun markkinarakoon, joka ei ehkä ole vielä kasvanut tarpeeksi havaittavaksi Googlen tai Yandexin tutkissa, tai ne testaavat sijoituksen alkuperäinen hypoteesi, joka ei vielä sovellu tavalliseen hakuun.

Jos esimerkiksi Tor-haku yhtäkkiä osoittautuu kysytyksi, toisin sanoen vähintään prosenttiosuus Googlen yleisöstä tarvitsee sieltä saatuja tuloksia, tavalliset hakukoneet alkavat tietysti ratkaista ongelman. löytää ne ja näyttää ne käyttäjälle. Jos yleisön käyttäytyminen osoittaa, että merkittävälle osalle käyttäjiä huomattavassa määrässä kyselyitä tulokset, jotka on annettu ottamatta huomioon käyttäjästä riippuvia tekijöitä, näyttävät osuvammilta, Yandex tai Google alkaa tuottaa tällaisia ​​tuloksia.

"Ole parempi" tämän artikkelin yhteydessä ei tarkoita "ole parempi kaikessa". Kyllä, sankarimme ovat monilta osin kaukana Yandexistä (jopa kaukana Bingistä). Mutta jokainen näistä palveluista antaa käyttäjälle jotain, mitä hakualan jättiläiset eivät voi tarjota. Tiedät varmasti myös vastaavia projekteja. Jaa kanssamme - keskustellaan.

AMMATILLINEN TIEDONHAKU INTERNETISSÄ

Internet-haku on tärkeä osa Internet-työskentelyä. Tuskin kukaan tietää varmasti nykyaikaisen Internetin verkkoresurssien tarkkaa määrää. Joka tapauksessa luku on miljardeissa. Jotta voisit käyttää kulloinkin tarvittavaa tietoa työ- tai viihdetarkoituksiin, sinun on ensin löydettävä se tästä jatkuvasti täydentyvasta resurssien valtamerestä.

Internet-haun onnistuminen edellyttää kahden ehdon täyttymistä: kyselyjen on oltava hyvin muotoiltuja ja niitä tulee kysyä sopivista paikoista. Toisin sanoen käyttäjältä edellytetään toisaalta kykyä kääntää kiinnostuksen kohteet hakukyselyn kielelle ja toisaalta hyvää tietoa hakukoneista, käytettävissä olevista hakutyökaluista, niiden eduista ja haittoja, joiden avulla hän voi valita sopivimmat hakutyökalut kussakin tapauksessa .

Tällä hetkellä ei ole olemassa yhtä resurssia, joka täyttäisi kaikki Internet-hakuvaatimukset. Siksi, jos otat haun vakavasti, sinun on väistämättä käytettävä erilaisia ​​​​työkaluja, joista jokaista käytetään sopivimmassa tapauksessa.

Perus Internet-hakutyökalutvoidaan jakaa seuraaviin pääryhmiin:

Hakukoneet;

Web-hakemistot;

Ohjeresurssit;

Paikalliset ohjelmat Internetistä etsimiseen.

Suosituimmat hakutyökalut ovathakukoneet– niin sanotut Internet-hakukoneet (Search Engines). Maailmanlaajuisen mittakaavan kolme parasta johtajaa ovat melko vakaita - Google, Yahoo! ja Bing. Monissa maissa omat paikalliset hakukoneet, jotka on optimoitu työskentelemään paikallisen sisällön kanssa, lisätään tähän luetteloon. Heidän avullaan voit teoriassa löytää minkä tahansa tietyn sanan monien miljoonien sivustojen sivuilta. Käyttäjän näkökulmasta hakukoneiden suurin haittapuoli on väistämätön läsnäolotiedon melutuloksissa. Tämä on tavanomainen nimi tuloksille, jotka syystä tai toisesta sisältyvät hakuluetteloon ja jotka eivät vastaa pyyntöä.

Monista eroista huolimatta kaikki Internetin hakukoneet toimivat samanlaisilla periaatteilla ja koostuvat teknisestä näkökulmasta samanlaisista alijärjestelmistä. Hakukoneen ensimmäinen rakenteellinen osa on erikoisohjelmat, joita käytetään automaattiseen hakuun ja sitä seuraavaan verkkosivujen indeksointiin. Tällaisia ​​ohjelmia kutsutaan yleensä roboteiksi tai roboteiksi. He katsovat verkkosivujen koodia, löytävät niillä olevia linkkejä ja löytävät siten uusia verkkosivuja. On olemassa vaihtoehtoinen tapa sisällyttää sivusto hakemistoon. Monet hakukoneet tarjoavat resurssien omistajille mahdollisuuden lisätä itsenäisesti sivusto tietokantaansa. Verkkosivut kuitenkin ladataan, analysoidaan ja indeksoidaan. Ne korostavat rakenteellisia elementtejä, etsivät avainsanoja ja määrittävät niiden yhteydet muihin sivustoihin ja verkkosivuihin. Suoritetaan myös muita toimintoja, joiden tuloksena muodostuu hakukoneen indeksitietokanta. Tämä tietokanta on minkä tahansa hakukoneen toinen pääelementti. Tällä hetkellä ei ole olemassa yhtä täysin täydellistä hakemistotietokantaa, joka sisältäisi tiedot kaikesta Internetin sisällöstä. Koska eri hakukoneet käyttävät erilaisia ​​verkkosivujen hakuohjelmia ja rakentavat hakemistonsa eri algoritmeilla, hakukoneiden hakemistotietokannat voivat vaihdella huomattavasti. Useat hakukoneet indeksoivat joitakin sivustoja, mutta vain yhden hakukoneen tietokantaan sisältyy aina tietty prosenttiosuus resursseista. Tällaisen alkuperäisen ja ei-päällekkäisen hakemiston osan läsnäolo jokaisessa hakukoneessa antaa meille mahdollisuuden tehdä tärkeä käytännön johtopäätös: jos käytät vain yhtä hakukonetta, jopa suurinta, menetät varmasti tietyn prosenttiosuuden hyödyllisistä linkeistä. .

Internet-hakukoneen seuraava osa on varsinaiset haku- ja lajitteluohjelmat. Nämä ohjelmat ratkaisevat kaksi pääongelmaa: ensin ne etsivät tietokannasta sivut ja tiedostot, jotka vastaavat saapuvaa pyyntöä, ja lajittelevat sitten tuloksena olevan tietotaulukon eri kriteerien mukaan. Menestys hakutavoitteiden saavuttamisessa riippuu pitkälti heidän työn tehokkuudestaan.

Internet-hakukoneen viimeinen elementti on käyttöliittymä. Hakukoneiden käyttöliittymillä on verkkosivujen tavanomaisten esteettisyys- ja käyttömukavuusvaatimusten lisäksi toinen tärkeä vaatimus: niiden tulee tarjota erilaisia ​​työkaluja kyselyjen laatimiseen ja selkeyttämiseen sekä tulosten lajitteluun ja suodattamiseen. Hakukoneiden etuja ovat erinomainen lähteiden kattavuus, suhteellisen nopea tietokantasisällön päivitys sekä hyvä valikoima lisätoimintoja.

Hakukoneiden kanssa työskentelyn tärkein työkalu on kysely.

Internet-hauissa käytetään myös erityisiä sovelluksia, jotka on asennettu paikalliseen tietokoneeseen. Nämä voivat olla joko yksinkertaisia ​​ohjelmia tai melko monimutkaisia ​​komplekseja tietojen etsimiseen ja analysointiin. Yleisimmät ovat hakulaajennukset selaimille, selainpaneelit, jotka on suunniteltu toimimaan tietyn hakupalvelun kanssa, ja metahakupaketit, joissa on kyky analysoida tuloksia.

Web-hakemistot – Nämä ovat resursseja, joissa sivustot on jaettu temaattisiin luokkiin. Jos käyttäjä työskentelee hakukoneiden kanssa vain kyselyiden kautta, luettelossa on mahdollista tarkastella temaattisia osia kokonaisuudessaan. Toinen perustavanlaatuinen ero hakemistojen ja automaattisten hakukoneiden välillä on, että ihmiset ovat yleensä suoraan mukana niiden täyttämisessä, resurssien katselemisessa ja sivuston luokittelussa johonkin luokkaan. Verkkohakemistot jaetaan yleensä yleisiin ja temaattisiin. Universaalit pyrkivät kattamaan mahdollisimman monta aihetta. Löydät sieltä mitä tahansa: runoutta käsittelevistä verkkosivustoista tietokoneresursseihin. Toisin sanoen heidän hakuleveys on suurin. Temaattiset hakemistot ovat erikoistuneet tiettyyn aiheeseen ja tarjoavat maksimaalisen hakusyvyyden vähentämällä resurssien kattavuutta.

Hakemistojen etuja ovat resurssien suhteellisen korkea laatu, koska jokainen siinä oleva sivusto on henkilön katselema ja valitsema. Sivustojen temaattinen ryhmittely mahdollistaa samankaltaisten aiheiden sivustojen järjestämisen kätevästi. Tämä toimintatapa on hyvä löytää sinulle uusia sivustoja kiinnostavasta aiheesta - se on tarkempaa kuin hakukoneen käyttäminen. On suositeltavaa käyttää verkkoluetteloita ensimmäiseen tutustumiseen minkä tahansa aihealueen kanssa sekä epämääräisten kyselyiden etsimiseen - sinulla on mahdollisuus "vaeltaa" luettelon osien läpi ja määrittää tarkemmin, mitä tarvitset.

Verkkohakemistojen haitat ovat tiedossa. Ensinnäkin tämä on tietokannan hidas täydentäminen, koska sivuston sisällyttäminen luetteloon vaatii ihmisen osallistumista. Tehokkuuden kannalta verkkohakemisto ei ole hakukoneiden kilpailija. Lisäksi verkkohakemistot ovat tietokannan koon suhteen huomattavasti huonompia kuin hakukoneet.

Internet-hausta puhuttaessa emme voi sivuuttaa useita termejä, jotka liittyvät läheisesti tähän alueeseen ja joita käytetään usein kuvaamaan ja arvioimaan hakukoneita. Esimerkiksi: leveys ja syvyys Internet-haku. Laaja haku on sellainen, joka kaappaa mahdollisimman monta tietolähdettä. Tässä tapauksessa vähintään maininta pyynnölle sopivasta sivustosta katsotaan riittäväksi. Haun syvyys viittaa kunkin tietyn resurssin indeksoinnin ja myöhemmän haun yksityiskohtiin. Esimerkiksi monet hakukoneet lähestyvät eri sivustojen indeksointia eri tavalla. Suuret ja suositut sivustot indeksoidaan mahdollisimman suuressa määrin. Samanaikaisesti muilla sivustoilla voidaan indeksoida vain otsikkosivu ja muutama sisältösivu. Nämä olosuhteet vaikuttavat luonnollisesti myöhempään etsintään. Syvähaku toimii periaatteella "on parempi sisällyttää tuloksiin tarpeetonta tietoa kuin jättää väliin mitään hakuaiheeseen liittyvää tietoa."

Melko usein voit kohdata sellaisia ​​​​käsitteitä kuin globaali ja paikallinen Internet-haku. Paikalliset Internet-haut ottavat huomioon käyttäjän maantieteellisen sijainnin ja suosivat tuloksia, jotka liittyvät jotenkin tiettyyn maahan tai paikkakuntaan. Globaalin haun aikana näitä tietoja ei oteta huomioon, vaan haku suoritetaan kaikista käytettävissä olevista resursseista.

Kun kirjoitat kyselyä Internetin hakukoneissa, käytössä on erilaisia ​​hakutiloja. Tyypillisiä useimmissa Internet-koneissa olevia hakutiloja ovat: yksinkertainen ja edistyksellinen Hae. Yksinkertaisen haun avulla voit määrittää vain yhden hakutoiminnon yhdessä pyynnössä. Tarkennettu haku mahdollistaa kyselyn luomisen useista ehdoista linkittämällä ne loogisilla operaattoreilla.

Tarkenna hakukyselyitä, erilaisia suodattimet . Suodattimet ovat sellaisia ​​tai muita apuvälineitä kyselyn laatimiseen, jotka eivät liity kyselyehtojen sisältöpuoleen, vaan rajoittavat hakutuloksia jollakin muodollisella ominaisuudella. Joten esimerkiksi käyttäessään tiedostotyyppisuodatinta etsiessään, käyttäjä ei anna järjestelmälle pyyntönsä aiheeseen liittyviä tietoja, vaan yksinkertaisesti rajoittaa saadut tulokset tiettyyn pyyntönsä ehdossa määritettyyn tiedostotyyppiin.

Useimmille käyttäjille yleiset hakukoneet ovat tärkein ja usein ainoa Internet-haun keino. Ne tarjoavat hyvän kattavuuden lähteistä sekä joukon työkaluja, jotka riittävät perushakuongelmien ratkaisemiseen.

Yleisten hakukoneiden markkinat ovat melko suuret. Yritimme analysoida tunnetuimpia hakukoneita ja esitimme tulokset taulukossa 1.

Universaalin hakukoneen valinnassa sen avulla löydettyjen resurssien laadulla on tärkeä rooli. Voit määrittää tietyille tehtäville ensisijaisen hakukoneen käyttämällä "merkkimenetelmää". Sen olemus on, että ensin laaditaan tietty temaattinen hakukysely, jonka jälkeen joukko ihmisiä - alan asiantuntijoita - tutkitaan tunnistamaan heidän mielestään parhaat Internet-resurssit valitusta aiheesta. Tutkimustietojen perusteella luodaan luettelo merkintäkohteista, jotka ovat taatusti relevantteja pyyntöön ja sisältävät laadukasta tietoa. Pyyntö lähetetään sitten testatuille hakukoneille. Arvioinnin logiikka on yksinkertainen: mitä korkeammalle merkitsijät sijaitsevat hakutuloksissa, sitä paremmin tietty resurssi soveltuu koeaiheen tiedon etsimiseen.