Data esittelee datamartin viittauksia. Kolmitasoisen tietovaraston edut. Kolmikerroksisen tietovaraston haitat


Tietovarasto Tietovarasto on toimialuekohtainen, integroitu, historiallinen, tuhoutumaton tiedon kokoelma, joka on suunniteltu tukemaan johdon päätöksentekoa. (William Inmon) Termiä "tietovarasto" voidaan ajatella yhdistävän kaksi perusideaa: erilaisten tietojen yhdistäminen yhdeksi arkistoon ja tietojoukot ja sovellukset erottelemalla käsittelyä ja analysointia.


Tiedot lähteestä eri lähteistä sijoitetaan arkistoon ja niiden kuvaukset metatietoarkistoon. Loppukäyttäjä voi analysoida varastossa olevia tietoja erilaisilla työkaluilla. Tuloksena on tietoa valmiiden raporttien, löydettyjen piilomallien ja mahdollisten ennusteiden muodossa. Koska loppukäyttäjän keinot työskennellä tietovaraston parissa voivat olla hyvin erilaisia, heidän valintansa ei saisi vaikuttaa varaston rakenteeseen ja sen ajan tasalla pitämiseen. Tämän järjestelmän fyysinen toteutus voi olla hyvin monipuolinen. Havainnemalli tietovarastot


Lähestymistavat ja käytettävissä olevat toteutusratkaisut IBM A Data Warehouse Plus. Tavoitteena on tarjota integroitu ohjelmistotuotteita ja -palveluita, jotka perustuvat yhteen arkkitehtuuriin. Tietovarastojen perustana on DB2-perhe DBMS. IBM:n etuna on, että operatiivisesta tietokannasta poimittava ja tietovarastoon sijoitettava data on IBM järjestelmät. Siksi ohjelmistotuotteiden tiivis integrointi on luonnollista. Tietovarastointiratkaisuja on saatavilla kolme: Isolated data mart. Suunniteltu ratkaisemaan yksittäisiä ongelmia yhteyden ulkopuolella jaettu tallennustila yritykset. Riippuva datakauppa. Samanlainen kuin eristetty datakauppa, mutta tietolähteet ovat keskitetyn hallinnan alaisia. Globaali tietovarasto. Yrityksen tietovarasto, jota ohjataan ja hallitaan täysin keskitetysti. Globaali tietovarasto voidaan tallentaa keskitetysti tai se voi koostua useista tietomarkkinoista, jotka on hajautettu verkon yli.


Lähestymistavat ja käytettävissä olevat toteutusratkaisut (jatkuu) Oracle Solution Oraakkeli perustuu kahteen tekijään: yrityksen itsensä laajaan tuotevalikoimaan ja Warehouse Technology Initiative -ohjelman yhteistyökumppaneiden toimintaan. Oraclen valmiudet tietovarastojen alalla perustuvat seuraaviin komponentteihin: Oracle 7:n relaatiotietokantajärjestelmän saatavuus, jota kehitetään jatkuvasti vastaamaan paremmin tietovarastojen tarpeita; joukon olemassaolo valmiita sovelluksia, joka tarjoaa tietovaraston kehitysominaisuuksia; yrityksen korkea teknologinen potentiaali data-analyysin alalla; useiden muiden yritysten valmistamien tuotteiden saatavuus.


Lähestymistavat ja käytettävissä olevat toteutusratkaisut (jatkuu) Hewlett Packard OpenWarehouse. Tämän ohjelman suorittamisen pitäisi tarjota mahdollisuus rakentaa tietovarastoja perustuen tehokkaita tietokoneita HP, muiden valmistajien laitteet ja ohjelmistokomponentit. HP:n lähestymistapa perustuu Unix-alustoille ja ohjelmistoÄlykäs varasto, suunniteltu tietovarastojen hallintaan. HP:n tarjoama perusta tietovarastojen rakentamiselle jättää vapauden valita relaatiotietokantajärjestelmä, uudelleensuunnittelutyökalut jne. NCR Sellaisten yritysten ongelmien ratkaiseminen, joilla on yhtä suuri tarve sekä päätöksentekojärjestelmille että toimintajärjestelmille analyyttinen käsittely tiedot. Ehdotettu arkkitehtuuri on nimeltään Enterprise Information Factory, ja se perustuu kokemukseen Teradata DBMS:n ja siihen liittyvien rinnakkaiskäsittelymenetelmien käytöstä.


Lähestymistavat ja käytettävissä olevat toteutusratkaisut (jatkoa) Informix Software Yhtiön strategian tavoitteena on laajentaa On-Line Dinamic Parallel Server -tuotteen markkinoita. Ehdotettu arkkitehtuuri perustuu neljään teknologiaan: relaatiotietokannat tiedot, ohjelmisto tietovaraston hallintaan, tiedonkäyttötyökaluihin ja avoimiin järjestelmäalustaan. Vapautumisen jälkeen Universal Server, objektirelaatiolähestymistavan perusteella voimme olettaa, että sitä käytetään myös tietovarastojen rakentamiseen. SAS Institute Yhtiö pitää itseään toimittajana täydellinen ratkaisu tietovaraston järjestämiseen. Lähestymistapa perustuu seuraaviin: pääsyn tarjoaminen tietoihin ja mahdollisuus hakea se useista tietovarastoista (sekä relaatiosta että ei-relaatiosta); tietojen muuntaminen ja käsittely 4GL:n avulla; moniulotteisen tietokantapalvelimen saatavuus; laaja valikoima menetelmiä ja työkaluja analyyttiseen käsittelyyn ja tilastolliseen analyysiin.


Lähestymistavat ja käytettävissä olevat toteutusratkaisut (loppu) Sybase Yrityksen strategia perustuu sen kehittämään Warehouse WORKS -arkkitehtuuriin. Lähestymistapa perustuu Sybase System 11 -relaatiotietokannan hallintajärjestelmään, OmniCONNECT-tietokantayhteys- ja pääsytyökaluun sekä PowerBuilder-sovelluskehitystyökaluun. Yhtiö jatkaa DBMS-järjestelmän parantamista vastaamaan paremmin tietovarastojen tarpeita (esimerkiksi bitin indeksointi on otettu käyttöön). Software AG Open Data Warehouse Initiative. Ohjelma perustuu yrityksen ydintuotteisiin ADABAS ja Natural 4GL, omistettuihin ja ostettuihin tiedonpoiminta- ja analysointityökaluihin sekä SourcePoint-tietovaraston hallintatyökaluun. SourcePointin avulla voit automatisoida tietojen purkamisen ja siirron sekä niiden lataamisen tietovarastoon.


Tietovarastojen säännöt (William ja Kelly) 1. Tietovarastot ja toimintaympäristö on erotettava. 2. Varastossa olevat tiedot on integroitava. 3. Tallennus sisältää yli kertynyttä dataa pitkään aikaan. 4. Tallennetut tiedot ovat tilannekuva tiedoista, jotka on hankittu Tämä hetki aika. 5. Varastossa olevat tiedot ovat aihekohtaisia. 6. Varastossa olevat tiedot on suunniteltu luettavaksi ja päivitettäväksi määräajoin toimintatietojen perusteella. Varastossa olevia tietoja ei voi päivittää nopeasti.


Tietovarastojen säännöt (jatkuu) 7. Elinkaari tietovarastossa eroaa perinteisestä tietojärjestelmä. Tietovarastossa data on eturintamassa ja operatiivisessa tietokannassa prosessi eturintamassa. 8. Tietovarastoon tallennetaan tietoja useilla yksityiskohtaisilla tasoilla (nykyinen, vanha, heikosti yleistetty, erittäin yleistynyt data). 9. Tietovarastoympäristölle on ominaista tapahtumat, jotka lukevat vain suuria tietomääriä. (Toimintatietokantaympäristö - iso luku päivitä tapahtumat). 10. Tietovarasto sisältää järjestelmän, joka seuraa tietolähteitä, muunnoksia ja tallennusta.


Tietovarastojen säännöt (jatkuu) 11. Tallennuksen metatiedot - olennainen komponentti tämän infrastruktuurin, koska se kuvaa kunkin tietoelementin lähteitä, muuntamista, tallennusta, käyttöä, suhteita, integrointia ja historiaa. 12. Tietovarastossa on oltava mekanismi resurssien käyttämiseksi kaikkien prosessien optimointiin. Kaksi lähestymistapaa: tiedot tallennetaan kuutioiden muodossa; joka kerta kun virtuaalinen kuutio luodaan. He yrittävät luoda kuution tietojen tallentamiseksi siihen - esimerkiksi alimmalle tasolle - itse tiedot, seuraavalla - ensimmäinen yksityiskohtataso, seuraavalla - toinen jne. – yleisimmälle indikaattorille.


Virtuaalinen tietovarasto Virtuaalinen tietovarasto on järjestelmä, joka tarjoaa pääsyn tavalliseen tallennusjärjestelmään, joka emuloi työskentelyä tietovaraston kanssa. Virtuaalitallennus voidaan järjestää kahdella tavalla: luoda sarja "näkymiä" tietokantaan, käyttää erityisiä keinoja tietokantakäyttö (esimerkiksi työpöydän OLAP-tuotteet)


Hyödyt ja haitat virtuaalisia varastoja+ yksinkertaisuus ja alhaiset toteutuksen kustannukset + yksi alusta tietolähteellä + poissaolo verkkoyhteyksiä tietolähteen ja tietovaraston välillä - työskentely tietovaraston illuusion kanssa - alhainen suorituskyky - vaikeus muunnella tietoja ja integroida dataa muihin lähteisiin - historian puute - ongelmat tiedon puhtaudessa - riippuvuus tietovaraston saatavuudesta ja rakenteesta tietokanta


Data Marts Data Marts -konsepti ehdotettiin vuonna 1992. Data markkinoiden tulo oli yritys pehmentää tietovarastojen vaatimuksia. Datamarketilla tarkoitetaan erikoistuneita varastotiloja, jotka palvelevat yhtä toiminta-aluetta. Ajo-ohjeet tunnistetaan koko tietovarastosta ja automatisoidaan. Pääsääntöisesti otetaan ensinnäkin ne prosessit, jotka on helppo automatisoida, ovat hyvin tutkittuja, eivät ole niin monimutkaisia, ja näiden tietomarkkinoiden toteuttamisen avulla voit nopeasti saavuttaa takaisinmaksun pienillä esimerkeillä. Hyvin usein tietovaraston ja datamarkkinoiden kehittäminen etenee rinnakkain, eli tulevaisuudessa tarvitaan tietovarastoa, mutta kehitetään myymälää, joka alkaa tuottaa tuloksia, toisaalta niiden avulla kehittäjät voivat näyttää asiakkaille että vaikutusta on.


Vitriinien edut + yksinkertaisuus ja alhaiset toteutuskustannukset + korkea suorituskyky rekisteröinnin fyysisen erottamisen vuoksi analyyttiset järjestelmät, tietojen lataamisen ja muuntamisen erottaminen erilliseksi prosessiksi, analysointia varten optimoitu tiedon tallennusrakenne + historiatuki + mahdollisuus lisätä metatietoja


Kaksitasoisessa tietovarastoarkkitehtuurissa rakennetaan datamarkkinoita luomatta keskusvarastoa, jossa tiedot tulevat tallennusjärjestelmistä ja rajoitetaan tiettyyn aihealueeseen. Markkinoiden rakentamisessa noudatetaan tietovarastojen rakentamisen perusperiaatteita, joten niitä voidaan pitää pienoistietovarastojena. Kaksikerroksinen säilytysrakenne




Vuonna 1994 ehdotettiin datamarkkinoiden ja tietovarastojen käsitteiden yhdistämistä ja varastojen käyttöä datamarkkinoilta. Yhdistämisen tavoitteena oli, että itse datamarkkinat perustuisivat tietovarastoihin tallennettuun tietoon. Ehdotettiin kolmen tason ns. monitasoista arkkitehtuuria: hajautettuun DBMS:ään perustuvan yleisen yritystietokannan 1. taso; Osastotietokannan 2. taso. Tänne tallennetaan koottua dataa, toisin sanoen relaatiotietokannat tallentavat operatiivista dataa ja aggregoitu data hylätään tasolle 2. Taso 3 on tiettyjä paikkoja käyttäjäanalyytikot. Ne käyttäjät, jotka tekevät joitain johtopäätöksiä datamarkkinoiden perusteella.


Joskus yhdellä osastolla tehty analyysi on ristiriidassa toisella osastolla saatujen tulosten kanssa. Johdonmukaisuuden puute johtuu yleisten liiketoimintatermien epäjohdonmukaisista määritelmistä ja epäjohdonmukaisista tiedoista koko organisaatiossa. Välitön ratkaisu tähän ongelmaan on luoda koordinoituja datamarkkinoita, jotka tunnetaan myös nimellä integroitu varasto. Koordinoitujen datamarkkinoiden luomiseen kuuluu koko organisaation järjestelmän suunnittelu ja sen jälkeen yksittäisten toimintojen yksityiskohtainen kehittäminen. Tämä iteratiivinen lähestymistapa vähentää mahdollinen riski ja tarjoaa välittömästi monia etuja, ja mahdollistaa myös järjestelmän kehittämisen ajan myötä analyyttiset valmiudet ei kata kaikkia organisaation toimintoja.




Koordinoitujen julkisivujen optimointi koostuu sellaisen rakenteen luomisesta, joka mahdollistaa mahdollisimman tehokkaan data-analyysin ja raporttien laatimisen ja tarjoaa asiakkaalle nopeasti tarvittavat tiedot hänen yrityksestään. Tähtipiiri sopii parhaiten tähän tarkoitukseen. Tähtiskeemassa on kahdentyyppisiä taulukoita - tietotaulukot ja dimensiotaulukot. Edellinen sisältää tapahtumahistorian, joka liittyy tiettyyn mallinnettavaan toimintaan. Ne tallentavat vastaavat numeeriset indikaattorit ja ID-kentät (tunnisteet) kullekin ulottuvuudelle. Tähtikaaviossa faktataulukoita ympäröivät tukevat mittataulukot, joiden avulla käyttäjä voi nopeasti perehtyä tietoihin ja tunnistaa korrelaatioita tietotaulukoiden ulottuvuuksien ja elementtien välillä.




Tietovarastoarkkitehtuuri Nykyään on ehdotettu monia arkkitehtuuria, tarkastelemme viittä yleisintä: 1. itsenäiset datamarts 2. data-mart väyläarkkitehtuuri linkitetyillä ulottuvuuksilla datamarteilla 3. "tähti" arkkitehtuuri (keskitin ja puoli) 4. keskitetty tietovarasto 5. hajautettu arkkitehtuuri.


Riippumattomat datamarkkinat Ei ole harvinaista, että yrityksen jokainen divisioona kehittää oman datamarkkinansa. Kaikki nämä vitriinit täyttävät tarpeet, joita varten ne on luotu, mutta samalla ne eivät ole riippuvaisia ​​toisistaan ​​eivätkä anna yhtenäistä näkemystä yrityksen tilanteesta. Ne sisältävät epäjohdonmukaisia ​​tietoja, käyttö eri mitat ja indikaattorit, ja siksi tietojen analysointi myymälän välillä on vaikeaa.


Yhdistettyjen datakeskusten väylä (Ralph Kimball) Tällaisen arkkitehtuurin luominen alkaa tiettyjen liiketoimintaprosessien, kuten tilausten, asiakkaiden, laskujen ja niin edelleen, vaatimusten analysoimisesta. Ensimmäinen datamarket on rakennettu yhdelle liiketoimintaprosessille käyttämällä mittoja ja indikaattoreita, joita käytetään myöhemmin muissa komponenteissa. Myöhemmät datamarkkinat kehitetään näitä ulottuvuuksia käyttämällä, mikä johtaa loogisesti integroituihin marteihin.


Star-arkkitehtuuri (Bill Inmon) Edustaa keskitettyä tietovarastoa, jossa on riippuvaisia ​​datamarkkinoita. Tämä arkkitehtuuri on kehitetty tietovaatimusten yritysanalyysin perusteella. On tärkeää kiinnittää huomiota skaalautuvan ja ylläpidettävän infrastruktuurin luomiseen. Yrityksen dataesityksen käyttöön perustuen arkkitehtuuria kehitetään iteratiivisesti, osa-alue toisensa jälkeen. Yksityiskohtaiset tiedot tallennetaan normalisoidussa muodossa tietovarastoon. Riippuvaiset datamarkkinat vastaanottavat tietoja tietovarastosta. Riippuvaisia ​​datamarkkinoita kehitetään osastoille tai tietyille toiminnallisille alueille, tarkoituksiin ja ne voidaan joko normalisoida tai denormalisoida tai muodostaa minkä tahansa aggregoidun tietorakenteen. Useimmat käyttäjät suorittavat kyselyitä riippuvaisille datamarkkinoille.


Keskitetty tietovarasto (ei riippuvaisia ​​datamarkkinoita) Tämä arkkitehtuuri on samanlainen kuin tähtiarkkitehtuuri, paitsi että siinä ei ole riippuvaisia ​​​​datamarkkeja. Tietovarasto sisältää yksityiskohtaisia ​​tietoja, joitain koostetietoja ja loogisia näkymiä. Kyselyt ja sovellukset toimivat sekä relaatiotiedoissa että moniulotteisissa näkymissä.


Federated arkkitehtuuri Tämä arkkitehtuuri käyttää jo olemassa olevia päätöksen tukirakenteita ( OS, marts ja tietovarastot). Tiedot on poimittu luetellut järjestelmät liiketoiminnan vaatimusten perusteella. Tiedot integroidaan loogisesti tai fyysisesti käyttämällä metatietoja, hajautettuja kyselyitä ja muita tekniikoita. Tämä arkkitehtuuri on käytännöllinen ratkaisu yrityksille, jotka jo käyttävät analyyttisin keinoin enkä halua luopua niistä.

Data mart(Englanti) Data Mart; muut käännösvaihtoehdot: erikoistunut tietovarasto, datakioski, datamarkkinat) - tietovaraston osa, joka on joukko temaattisia, tarkasti kohdennettuja tietoja, jotka on suunnattu esimerkiksi yhden tietovaraston käyttäjille. työryhmä tai osastolla.

Data Mart -konsepti

Forrester Research ehdotti datamarkkinoita jo vuonna 1991. Kirjoittajien mukaan datamarkkinat- monia temaattisia tietokantoja (DB), jotka sisältävät tietoa organisaation toiminnan yksittäisistä näkökohdista.

Konseptilla on useita kiistattomia etuja:

  • Analyytikot näkevät ja työskentelevät vain niiden tietojen kanssa, joita he todella tarvitsevat.
  • Kohdetietokanta on mahdollisimman lähellä loppukäyttäjää.
  • Tietomarkkinat sisältävät yleensä temaattisia osajoukkoja esikootusta tiedosta, ja niitä on helpompi suunnitella ja mukauttaa.
  • Data markkinoiden toteuttaminen ei vaadi suurta tehoa Tietokonetekniikka.

Mutta datamarkkinoiden käsitteessä on myös erittäin vakavia aukkoja. Pohjimmiltaan tämä edellyttää maantieteellisesti hajautetun tietojärjestelmän toteuttamista, jossa on vain vähän hallittua redundanssia, mutta se ei ehdota tapoja varmistaa siihen tallennettujen tietojen eheys ja johdonmukaisuus.

Sekoitettu käsite datamarkkinoista ja tietovarastoista

Ajatus kahden tietovarastojen ja datamarkkinoiden yhdistämisestä näyttää saaneen alkunsa M. Demarestilta, joka vuonna 1994 ehdotti näiden kahden käsitteen yhdistämistä ja tietovaraston käyttämistä yhtenä yhtenäisenä tietolähteenä datamarkkinoille.

Ja tänään tämä on juuri se monitasoinen ratkaisu:

  • ensimmäinen taso on yleinen yritystietokanta, joka perustuu relaatiotietokantajärjestelmään, jossa on normalisoitu tai heikosti denormalisoitu skeema (yksityiskohtaiset tiedot);
  • toinen taso - osastojen (tai loppukäyttäjän) tason tietokannat, jotka on toteutettu moniulotteisen DBMS:n (aggregated data) perusteella;
  • kolmas taso - loppukäyttäjien työasemat, joihin analyyttiset työkalut on asennettu suoraan;

siitä on vähitellen tulossa de facto standardi, joka mahdollistaa kunkin lähestymistavan täysimittaisen täytäntöönpanon ja hyödyn:

  • Yksityiskohtaisten tietojen kompakti tallennus ja tuki relaatiotietokantajärjestelmien tarjoamille erittäin suurille tietokannoille;
  • asennuksen helppous ja Hyvät ajat vastaus, kun työskentelet moniulotteisen DBMS:n tarjoaman aggregoidun tiedon kanssa.

Yritysten keskustietokannassa käytetty tietojen relaatiomuoto tarjoaa kompakteimman tavan tallentaa tietoja. Nykyaikaiset relaatiotietokantajärjestelmät pystyvät jo toimimaan useiden teratavujen luokkaa olevien tietokantojen kanssa. Vaikka tällainen keskusjärjestelmä ei yleensä pysty tarjoamaan toimintatila analyyttisten kyselyjen käsittelyssä, kun käytetään uusia menetelmiä tietojen indeksoimiseen ja tallentamiseen sekä taulukoiden osittaiseen denormalisointiin, ennalta säänneltyjen kyselyiden käsittelyaika (ja sellaisena voimme harkita säänneltyjä menettelyjä tietojen lataamiseksi moniulotteisiin tietokantoihin) osoittautuu olla varsin hyväksyttävää.

Moniulotteisen DBMS:n käyttö alemman tason solmuissa puolestaan ​​tarjoaa minimikerrat sääntelemättömien käyttäjien pyyntöjen käsittely ja niihin vastaaminen. Lisäksi joissakin moniulotteisissa DBMS-järjestelmissä on kyky tallentaa tietoja muodossa pysyvä perusta(suoraan moniulotteisessa tietokannassa) ja dynaamisesti (istunnon ajaksi) ladata tietoja relaatiotietokannoista (säänneltyjen kyselyiden perusteella).

Näin ollen on mahdollista tallentaa pysyvästi vain tietyssä solmussa useimmin pyydetty data. Kaikille muille tallennetaan vain kuvaukset niiden rakenteesta ja ohjelmat niiden purkamiseksi keskustietokannasta. Vaikka ensimmäinen vasteaika tällaiseen virtuaaliseen dataan voi olla melko pitkä, tämä ratkaisu tarjoaa suuren joustavuuden ja vaatii halvempaa laitteistoa

Katso myös

Kirjoita arvostelu artikkelista "Data Showcase"

Ote Data Martista

"Makar Alekseichilla on luettelot", sanoi ensihoitaja. "Tulkaa upseerien asuntoon, näette siellä itse", hän lisäsi kääntyen Rostoviin.
"Eh, on parempi olla menemättä, isä", sanoi lääkäri, "muuten saatat jäädä tänne." "Mutta Rostov kumarsi lääkärille ja pyysi ensihoitajaa seuraamaan häntä.
"Älä syytä minua liikaa", lääkäri huusi portaiden alta.
Rostov ja ensihoitaja astuivat käytävälle. Sairaalan haju oli niin voimakas tässä pimeässä käytävässä, että Rostov tarttui hänen nenänsä ja joutui pysähtymään kerätäkseen voimiaan ja jatkaakseen matkaa. Ovi avautui oikealle, ja laiha, keltainen mies, paljain jaloin ja vain alusvaatteet päällä, nojautui kainalosauvojen varaan.
Hän nojasi kattoon ja katsoi ohikulkijoita loistavin, kateellisin silmin. Katsoessaan ovesta Rostov näki, että sairaat ja haavoittuneet makasivat siellä lattialla oljella ja päällystakkeilla.
-Saanko tulla katsomaan? - kysyi Rostov.
- Mitä minun pitäisi katsoa? - sanoi ensihoitaja. Mutta juuri siksi, että ensihoitaja ei ilmeisesti halunnut päästää häntä sisään, Rostov astui sotilaiden kammioihin. Haju, jonka hän oli jo haistanut käytävällä, oli täällä vielä voimakkaampi. Tämä haju on hieman muuttunut täällä; hän oli terävämpi, ja saattoi tuntea, että hän oli täältä kotoisin.
Pitkässä huoneessa, jossa aurinko kirkkaasti valaisi suurista ikkunoista, sairaat ja haavoittuneet makasivat kahdessa rivissä, päänsä seiniin päin ja jättäen keskelle käytävän. Suurin osa heistä oli unohduksissa eivätkä kiinnittäneet huomiota sisään tulleisiin. Ne, jotka olivat muistissa, nousivat kaikki seisomaan tai kohottivat ohuet, keltaiset kasvonsa, ja kaikki samalla tavoin toivoen apua, moittimista ja kateutta toisten ihmisten terveydestä katsoivat silmiään irti katsomatta Rostovia. Rostov meni ulos huoneen keskelle, katsoi naapurihuoneisiin, joissa oli avoimia ovia, ja näki saman asian molemmilta puolilta. Hän pysähtyi ja katseli hiljaa ympärilleen. Hän ei koskaan odottanut näkevänsä tätä. Heidän edessään makasi melkein keskikäytävän poikki, paljaalla lattialla, sairas mies, luultavasti kasakka, koska hänen hiuksensa oli leikattu olkaimiin. Tämä kasakka makasi selällään, valtavat kätensä ja jalat ojennettuina. Hänen kasvonsa olivat purppuranpunaiset, hänen silmänsä olivat täysin käännettyinä taaksepäin, niin että vain valkoiset olivat näkyvissä, ja hänen paljaissa jaloissaan ja käsillään, jotka olivat edelleen punaiset, suonet olivat jännittyneet kuin köydet. Hän löi päänsä lattiaan ja sanoi jotain käheästi ja alkoi toistaa sanaa. Rostov kuunteli, mitä hän sanoi, ja selvitti sanan, jota hän toisti. Sana oli: juo - juo - juo! Rostov katseli ympärilleen etsiessään jotakuta, joka voisi laittaa tämän potilaan paikalleen ja antaa hänelle vettä.
- Kuka täällä hoitaa sairaita? – hän kysyi ensihoitajalta. Tällä hetkellä Furstadtin sotilas, sairaalanhoitaja, tuli ulos viereisestä huoneesta ja nousi ylös Rostovin eteen lyömällä askeleella.
- Toivotan teille hyvää terveyttä, kunnianne! – huusi tämä sotilas pyöritellen silmiään Rostoville ja ilmiselvästi luullen hänet sairaalaviranomaisiksi.
"Vie hänet pois, anna hänelle vettä", sanoi Rostov osoittaen kasakkaa.
"Kuuntelen, kunnianne", sotilas sanoi iloisesti, pyöräytti silmiään vielä ahkerammin ja ojentautui, mutta liikkumatta paikaltaan.
"Ei, et voi tehdä täällä mitään", ajatteli Rostov laskeen silmänsä ja oli menossa ulos, mutta oikea puoli hän tunsi merkittävän katseen kohdistuneen itseensä ja katsoi takaisin häneen. Melkein nurkassa istui päällystakki, jolla oli ohut, ankarat kasvot, keltainen kuin luuranko ja karvaamaton harmaa parta, vanha sotilas ja katsoi itsepäisesti Rostovia. Toisaalta vanhan sotilaan naapuri kuiskasi hänelle jotain osoittaen Rostovia. Rostov tajusi, että vanha mies aikoi pyytää häneltä jotain. Hän tuli lähemmäksi ja näki, että vanhalla miehellä oli vain toinen jalka koukussa ja toinen ei ollut ollenkaan polven yläpuolella. Toinen vanhan miehen naapuri, joka makasi liikkumattomana pää taakse käännettynä, melko kaukana hänestä, oli nuori sotilas, jolla oli vahamainen kalpeus tylynenäisillä kasvoillaan, edelleen pisamioiden peitossa ja hänen silmänsä kääntyivät takaisin silmäluomien alle. Rostov katsoi nenäkärkistä sotilasta, ja hänen selkärankaa pitkin juoksi vilunväristys.

Data Mart ) on Data Warehousen pitkälle erikoistunut alijärjestelmä, sen erillinen elementti.

Jos jokin yrityksen toiminnan osa-alue ei käytännössä liity muihin, niin on mahdollista rakentaa itsenäinen, itsenäisesti toimiva datakauppa ilman, että se on sidottu keskitettyyn yrityksen tallennustilaan. Tai aloita yrityksen automatisointi, ei yrityksen tietovaraston luomisella, vaan itsenäisellä datamarketilla yrityksen kysytyimmälle aihealueelle.

Datamarketilla tarkoitetaan tässä tapauksessa pitkälle erikoistunutta tietovarastoa, joka palvelee yhtä yrityksen toimialaa.

Datamarketit ovat lähtökohtaisesti paljon halvempia ja helpompia rakentaa kuin tietovarastot, niiden toteuttaminen ei vie paljon aikaa ja tuo nopean ja konkreettisen vaikutuksen. Samalla on ymmärrettävä, että tällä lähestymistavalla itsenäiset datamarkkinat eivät luo yhtenäistä yritystietojärjestelmää yhtenäinen järjestelmä tiedon kerääminen, yhdistäminen, hallinta ja ylläpito.

Jos yritys on pieni, se voi turvallisesti lähteä luomaan itsenäisiä datamarkkinoita. Jos yritys on suuri, autonomisten datamarkkinoiden luomista tulisi koordinoida yksi keskus jotta lopulta päästään yhtenäisen yrityksen tietovaraston luomiseen.

Datamarketin luominen

Datakaupan luominen tarkoittaa vastaavan tietokannan ja järjestelmän luomista sen lataamiseksi. Jos tietokannan luominen on puhtaasti tekninen ongelma, latausjärjestelmän luominen on suurin vaikeus. Tämä järjestelmä sisältää kolme vaihetta:

1. Tiedon poimiminen edellyttää rakenteen tarkkaa tuntemusta lähdejärjestelmiä. Taulukoiden rakenteet ja suhteet, tietorakenteet lähdejärjestelmässä. Sinun on tiedettävä selkeästi, mistä taulukoista ja kentistä tiedot on poimittava ja mikä näiden tietojen rakenne on.

2. Lähdejärjestelmää ei ole alun perin suunniteltu toimimaan datakaupan kanssa, eikä siitä poimittua dataa ole tarkoitettu suoraan käytettäväksi, ja sen on läpikäytävä useita muunnoksia. Näiden muunnosten prosessi riippuu sekä lähdejärjestelmien rakenteesta että itse datamarkkin vaatimuksista, ja se voi sisältää monia toimintoja:

  • Aggregaattitietojen luominen
  • Tietomuotojen muuttaminen.
  • Tietojen luotettavuuden ja eheyden tarkistaminen.
  • Ylimääräisten tietojen poistaminen
  • Jne.

Kaikki nämä muutokset suoritetaan vain siinä vaiheessa, kun tiedot syötetään myymälään, mikä varmistaa suuri nopeus poimimaan tietoja markkinoilta ja esittämään tiedot parhaiten käyttäjän näkökulmasta. Lopulta se johtaa parempiin asioihin. tietotuki käyttäjälle ja edistää oikeiden hallintopäätösten nopeaa hyväksymistä.

3. Liikkeen tietojen on vastattava lähdejärjestelmien tietoja, jotka luonnollisesti muuttuvat ajan myötä. Siksi työkaluja, jotka suorittavat muunnoksia ja lataavat tietoja myymälään, on käynnistettävä säännöllisesti, kun lähdejärjestelmien tiedoissa tapahtuu tiettyjä muutoksia ja/tai automaattisesti tietyn aikataulun mukaan.

Yllä olevasta se seuraa melkoisesti tärkeä johtopäätös. Et voi ostaa valmiita datamarkkinoita yrityksellesi. Data showcase on eksklusiivinen räätälöity tuote, joka on luotava suoraan tietylle yritykselle sen kaikkia ominaisuuksia varten.

Mikä on tietovarasto? Yleensä tämä on tietokanta, johon on tallennettu koko joukko tietoja tietyn yrityksen toiminnasta. Mutta usein on tarpeen eristää tästä koko laajamittaisesta monimutkaisesta tiedosta organisaation työ-, jaosto- tai palvelukysymyksen yksi alue. Tässä tulee apuun toisenlainen tallennusmuoto - niin sanotut datamartit. Mikä se on, mitkä ovat sen edut, haitat, lajikkeet, tarkastelemme koko artikkelissa.

Mikä tämä on?

Mitä datamarkkinat ovat? englanninkielinen versio- Data Mart. Käsitteellä on useita synonyymejä:

  • Erikoisvarasto
  • Datakioski.
  • Datamarkkinat jne.

Määritellään termin "data showcase" tulkinta:

  • Osa tietokannasta, tietovarasto, joka on suunniteltu edustamaan joukko erittäin erikoistuneita, temaattisia tietoja, jotka on suunnattu tietyn osaston työntekijöiden pyyntöihin, organisaation työn vektori.
  • Erikoistunut tietovarasto, joka sisältää tietoa yhdestä yrityksen toiminnan vektoreista.
  • Joukko temaattisesti liittyviä aiheita, jotka liittyvät organisaation tiettyihin työalueisiin.

Datamarketissa ei ole mahdollista mainostaa. Se on yksi säilytystyypeistä sisäisiä tietoja tiedottamisen sijaan laajalle piirille käyttäjiä.

Varastointikonsepti

Forrester Research ehdotti ajatusta datamarkkinoiden luomisesta vuonna 1991. Kirjoittajat esittelivät tämän tietovaraston tiettynä joukkona tiettyjä tietokantoja, jotka sisältävät tietoa, joka liittyy yrityksen toiminnan tiettyihin vektoreihin.

Forrester Research korosti seuraavaa vahvuuksia projektisi - datamarkkinat:

  • Analyytikoille vain ne tiedot, joita todella tarvitaan tiettyä työtehtävää tai työprofiilia varten.
  • Tietovaraston kohdeosan enimmäisetäisyys tietty käyttäjä.
  • Asiantuntijoiden aiemmin yhdistämien temaattisten osajoukkojen sisältö, joka on helpompi konfiguroida ja suunnitella tulevaisuudessa.
  • Data martin (erityistyyppinen tietovarasto) toteuttaminen ei vaadi suuritehoisia laskentalaitteita.

Mutta sama Forrester Research puhui myös heikkouksia hänen keksinnöstään:

  • Tietojen toteuttaminen alueellisesti hajautettu järjestelmä, jonka redundanssia valvotaan huonosti.
  • Ei ole ehdotettu menetelmiä tai menetelmiä, jotka voisivat varmistaa datamartiin (erittäin erikoistunut tietokanta) tallennettujen tietojen eheyden ja johdonmukaisuuden.

Siirrytään nyt asiaan uusi aihe.

Näytön suunnittelu

Pääesimerkki Datamarkkinat ovat esikoottujen tietojen temaattisia osajoukkoja. Näin ollen tällaiset tietokannat on paljon helpompi suunnitella ja konfiguroida. He luovat samanlaisia ​​esityksiä etsiäkseen tiettyjä vastauksia käyttäjien pyyntöihin. Tekijä mukauttaa niissä olevat tiedot tietyille työntekijäryhmille. Tällainen optimointi helpottaa näyttökoteloiden täyttämisprosessia ja auttaa parantamaan tällaisten tietokantojen suorituskykyä.

Tiedetään, että monimutkaisten tietovarastojen suunnittelu on melko monimutkainen prosessi, joka voi kestää jopa useita vuosia. Yrityksen tai yrityksen yksittäisille rakenteille ominaisia ​​datamarkkinoita on kuitenkin helpompi ja nopeampi luoda. On sanottava, että useat esittelyt voivat menestyä rinnakkain päätietovaraston kanssa, antaen siitä osittaisen käsityksen.

Kuten mainitsimme, datamarkkinoiden suunnittelu on teknisesti helpotettu prosessi. Mutta VD:n tekijöiden on muistettava, että rakentamisen aikana voi myöhemmin syntyä ongelmia tietojen integroinnissa (jos suunnittelu on suoritettu ottamatta huomioon monimutkaista liiketoimintamallia).

Riippumattomat julkisivut: esimerkkejä

Showcase SQL-tiedot- analyyttinen rakenne, joka tukee jonkin sovelluksen, divisioonan tai liiketoimintaosion toimintaa. Sen työntekijät tekevät yhteenvedon tietovaatimuksistaan ​​ja mukauttavat näytön omiin liiketoimintatarpeisiinsa. Seuraavaksi tulee näiden tietojen kanssa tekemisissä olevan henkilöstön tarjoaminen tietyillä interaktiivisilla raportointityökaluilla.

Riippumattomat datamarkkinat ovat historiallisesti kehittyneet suuria organisaatioita joilla on suuri määrä itsenäisiä osastoja, joilla on omat osastonsa tietotekniikat. Esimerkkejä niistä ovat seuraavat:

  • Markkinointiosaston datamart. Sisältää tietoa yrityksen tuotteista, asiakkaista, myyntisuunnitelmista jne.
  • Myyntiosaston tietojen esittely.
  • Talousosaston sisäasiainjohtaja.
  • Riskinarviointiyksikön sisäasiat jne.

Riippumattomien julkisivujen edut

Korostetaan tietomarkkinoiden tärkeimpiä etuja, jotka suorat tekijät ja käyttäjät ovat löytäneet:

  • Ne keskittyvät maksimaalisesti työntekijään ja tarjoavat hänelle vain sitä tietoa, joka on tarpeen työtehtävää suorittaessaan.
  • Huomattavasti vähemmän painoa kuin tietokannat.
  • Liikkeiden luominen on teknisesti helpompi prosessi (kuin monimutkaisten tietovarastojen suunnittelu). Lisäksi VD-tiedostojen täyttäminen ja työskentely loppukäyttäjien kannalta on helpompaa.
  • Ne sisältävät koottua tietoa tietyistä aiheista.
  • Melko nopea datamarkkinoiden toteutus.
  • Luotu vastaamaan tiettyihin kysymyksiin.
  • Tiedot on optimoitu tietyn käyttäjäryhmän käyttöön. Tämä yksinkertaistaa HP:n täyttämistä ja parantaa järjestelmän suorituskykyä.

Riippumattomien julkisivujen haitat

Määritellään datamarkkinoiden haitat, joita käyttäjät ja suunnittelijat korostavat:

Sekoitettu konsepti

Mitä tapahtuu, jos yhdistät datamarkkinoiden ja tietovarastojen käsitteet? M. Demarest esitti tämän kysymyksen vuonna 1994. Hän ehdotti yllä olevien käsitteiden yhdistämistä tietovaraston (tietokannan) jatkokäyttöön integroituna yhtenä lähteenä datamarkkinoita suunniteltaessa.

Tämä ratkaisu yhdistää kolme tasoa:

  1. Yleinen yritystietokanta, joka perustuu relaatiotietokantajärjestelmään (tietokannan hallintajärjestelmä). Sillä on heikosti denormalisoitu tai normalisoitu skeema (tai yksityiskohtaisia ​​tietoja).
  2. Tietyn osaston, organisaation osaston tai loppukäyttäjän työntekijän tietokanta (DB). Se on jo toteutettu moniulotteisen DBMS:n (aggregated data) pohjalta.
  3. Loppukäyttäjien työntekijöiden työpaikat, joille analyyttiset työkalut asennetaan suoraan.

Tästä moniulotteisesta rakenteesta tulee lopulta standardi monissa yrityksissä. pääsyy Lisäksi se yhdistää kahden lähestymistavan edut:

  • Yksityiskohtaisten tietojen kompakti tallennus, tuki suurille tietokantoille, joka toteutetaan relaatiotietokannan hallintajärjestelmien pohjalta.
  • Helppo asennus, nopea vastaus käyttäjien pyyntöihin työskennellessään moniulotteisiin tietokannan hallintajärjestelmiin perustuvan aggregoidun tiedon kanssa.

3D-esineiden edut

Plussat tämän tyyppistä VD:t ovat seuraavat:

  • Yksinkertaistettu tällaisten tietokeskusten luominen, koska ne täytetään standardoidusta, luotettavasta yhdestä lähteestä.
  • VD:t ovat synkronoituja ja yhteensopivia yrityksen tietokannan kanssa.
  • Suhteellisen helppo tallennustilan laajentaminen, mahdollisuus lisätä uusia vitriinejä.
  • Taattu hyvä järjestelmän suorituskyky.

3D-esineiden haitat

Tässä on myös useita haittoja:


Olemme keskustelleet siitä, mitä datakauppa on, mitä eroja on itsenäisten ja kolmitasoisten tietovarastojen välillä, mitkä ovat tärkeimmät edut ja tällaisten suurten yritysten tietovarastojen haitat.