IBM Watson Content Analytics puhuu sinulle omalla kielelläsi

3. syyskuuta 2015 klo 11.34

IBM Watsonin kognitiivinen järjestelmä: Luonnollisen kielen kanssa työskentelyn periaatteet

  • IBM-blogi,
  • Algoritmit

IBM Watson on yksi ensimmäisistä kognitiivisista järjestelmistä maailmassa. Tämä järjestelmä voi tehdä paljon, minkä ansiosta Watsonin ominaisuuksia hyödynnetään monilla alueilla - ruoanlaitosta tapaturmien ennustamiseen asutuilla alueilla. Yleensä suurin osa Watsonin kyvyistä ei ole jotain ainutlaatuista, mutta yhdessä kaikki nämä ominaisuudet ovat erittäin voimakas työkalu ratkaisemaan erilaisia ​​asioita.

Esimerkiksi - luonnollisen kielen tunnistus, dynaaminen järjestelmäoppiminen, hypoteesien rakentaminen ja arviointi. Kaikki tämä antoi IBM Watsonille mahdollisuuden oppia antamaan suoria, oikeita vastauksia (erittäin luotettavasti) operaattorin kysymyksiin. Samalla kognitiivinen järjestelmä pystyy käyttämään suuria joukkoja globaalia strukturoimatonta dataa työhön, Suuri data. Mitkä ovat IBM Watsonin kielen kanssa työskentelyn perusperiaatteet? Tästä lisää jatko-osassa.

Luonnollisen kielen tunnistamisen tärkeimmät haasteet

Ihmisille kieli on keino ilmaista ajatuksia. Käytämme kieltä välittääksemme mielipiteitämme, tietojamme ja tietojamme. Voimme tehdä ennusteita ja muodostaa teorioita. Se on kieli, joka on tietoisuutemme kulmakivi. Samaan aikaan tässä on paradoksi: ihmisten kieli on erittäin epätarkka.

Monet termit ovat epäloogisia, ja tietokonejärjestelmien voi olla hyvin vaikea ymmärtää meitä. Miten esimerkiksi ääni voi olla ohut? Kuinka voit polttaa häpeästä? Koneelle tämä on ongelma, mutta ihmiselle täysin tavallinen asia. Tosiasia on, että kysymykseen oikein vastaamiseksi on monissa tapauksissa tarpeen ottaa huomioon olemassa oleva konteksti. Ilman riittävää faktatietoa kysymykseen on vaikea vastata oikein, vaikka voit kirjaimellisesti löytää tarkan vastauksen kysymyksen osiin.

Luonnollisen kielen käsittely – Aloitus

Monet tietokonejärjestelmät pystyvät analysoimaan kieltä, mutta analyysi on pinnallista. Tämä voi olla järkevää esimerkiksi, jotta voidaan tehdä tilastollisesti pätevä arvio tunteiden muutosten trendeistä suurilla tietomäärillä. Tässä tiedonsiirron tarkkuudella ei ole suurta merkitystä, sillä vaikka oletetaan, että väärien positiivisten tulosten määrä on suunnilleen yhtä suuri kuin väärien negatiivisten tulosten määrä, ne kumoavat toisensa.

Mutta jos kaikilla tapauksilla on merkitystä, pinnallisen kielianalyysin kanssa toimivat järjestelmät eivät voi enää tehdä työtänsä kunnolla. Silmiinpistävä esimerkki tästä voisi olla minkä tahansa ääniavustajan tehtävä mobiililaitteet. Jos sanot "etsi minulle pizza", avustaja näyttää luettelon pizzeroista. Jos sanot esimerkiksi "älä etsi pizzaa minulle Madridista", järjestelmä etsii silti. Tällaiset järjestelmät toimivat tunnistamalla tietyt avainsanat ja käyttämällä tiettyjä sääntöjä. Tulos voi olla tarkka tietyssä sääntöjärjestelmässä, mutta virheellinen.

Syvä luonnollisen kielen käsittely

Opettaakseen järjestelmän analysoimaan monimutkaisia ​​semanttisia rakenteita, ottaen huomioon tunteet ja muut tekijät, asiantuntijat käyttivät syvää luonnollisen kielen käsittelyä. Nimittäin kysymyksiin vastaava sisällönanalytiikkajärjestelmä (Deep Question*Answering, DeepQA). Jos vaaditaan suurempaa tarkkuutta, sinun on käytettävä lisämenetelmiä luonnollisen kielen käsittely.
IBM Watson on syvän luonnollisen kielen käsittelyjärjestelmä. Tiettyä kysymystä analysoidessaan järjestelmä pyrkii arvioimaan mahdollisimman laajaa kontekstia oikean vastauksen antamiseksi. Tämä käyttää kysymystietojen lisäksi myös tietokantatietoja.
Luonnollisen kielen syväkäsittelyyn kykenevän järjestelmän luominen mahdollisti toisen ongelman - analyysin - ratkaisemisen suuri määrä päivittäin syntyvää tietoa. Tämä on jäsentämätöntä tietoa, kuten twiittejä, viestejä sosiaaliset verkostot, raportteja, artikkeleita ja paljon muuta. IBM Watson on oppinut käyttämään tätä kaikkea inhimillisten ongelmien ratkaisemiseen.

IBM Watsonin kognitiivinen järjestelmä

Watson on eri tason laskentaominaisuudet. Järjestelmä voi erottaa tietyt lausunnot luonnollisella kielellä ja löytää yhteyksiä näiden lauseiden välillä. Samaan aikaan Watson selviää tehtävästä, monissa tapauksissa jopa parempi kuin mies, vaikka tietojenkäsittely on paljon nopeampaa, työtä tehdään paljon suuremmilla määrillä - ihminen ei yksinkertaisesti pysty siihen.

Kognitiivisen järjestelmän perusominaisuudet

Järjestelmä toimii tässä järjestyksessä:

1. Kun Watson saa kysymyksen, se suorittaa sen. jäsentäminen korostaakseen ongelman pääpiirteitä.

2. Järjestelmä luo sarjan hypoteeseja skannaamalla korpusta etsimällä lauseita, jotka tietyllä todennäköisyydellä voivat sisältää vaaditun vastauksen. Johdakseen tehokas haku jäsentämättömän informaation virroissa tarvitaan täysin erilaisia ​​laskentaominaisuuksia * niitä kutsutaan kognitiivisiksi järjestelmiksi. (En oikein ymmärrä viimeistä lausetta ja tähden roolia)

3. Järjestelmä suorittaa syvän vertailun kysymyksen kielen ja kunkin mahdollisen vastausvaihtoehdon kielen välillä käyttämällä erilaisia ​​algoritmeja looginen päätelmä.

Tämä on vaikea vaihe. Päättelyalgoritmeja on satoja, ja ne kaikki tekevät erilaisia ​​vertailuja. Jotkut esimerkiksi etsivät vastaavia termejä ja synonyymejä, toiset tarkastelevat ajallisia ja spatiaalisia piirteitä, kun taas toiset analysoivat relevantteja kontekstuaalisen tiedon lähteitä.

4. Jokainen päättelyalgoritmi antaa yhden tai useamman pistemäärän, jotka osoittavat, missä määrin mahdollinen vastaus seuraa kysymyksestä algoritmin tarkastelemalla alueella.

5. Jokaiselle saadulle pisteelle annetaan sitten painoarvo tilastollisella mallilla, joka tallentaa kuinka hyvin algoritmi onnistui tunnistamaan loogiset yhteydet kahden samanlaisen lauseen välillä kyseisellä alueella Watsonin "harjoittelujakson" aikana. Tämän tilastollisen mallin avulla voidaan sitten määrittää Watsonin yleinen luottamustaso siihen, että mahdollinen vastaus seuraa kysymyksestä.

6. Watson toistaa prosessin kaikille mahdollinen vaihtoehto vastaa, kunnes hän löytää vastauksia, joilla on paremmat mahdollisuudet olla oikein kuin muilla.

Kuten edellä mainittiin, järjestelmän on otettava yhteyttä, jotta kysymykseen voidaan vastata oikein lisälähteitä tiedot. Nämä voivat olla oppikirjoja, käsikirjoja, usein kysyttyjä kysymyksiä, uutisia ja kaikkea muuta. Watson käsittelee valtavia määriä tietoa sekunneissa saadakseen oikean vastauksen. Samalla myös löydetty sisältö tarkistetaan, vanhentuneet ja turhat tiedot poistetaan.

Kognitiivisen järjestelmän elementit

Watson päättelee tekstin yleisen merkityksen saaduista tiedoista, lisätietokannasta. Tämä käyttää asiakirjan otsikkoa, osaa asiakirjan tekstistä tai koko tekstiä.

Kognitiiviset järjestelmät, niiden tiedonkeruu-, muistamis- ja tiedonhakumenetelmät ovat samanlaisia ​​kuin ihmiset analysoivat tietoa. Tässä tapauksessa kognitiiviset järjestelmät voivat välittää tietoa ja toimia. Tässä on esimerkkejä käyttäytymisrakenteista, joita käytetään tässä tapauksessa:

Kyky luoda ja testata hypoteeseja;
- kyky jakaa osiin ja tehdä kielestä loogisia johtopäätöksiä;
- kyky poimia ja arvioida hyödyllistä tietoa(kuten päivämäärät, paikat ja ominaisuudet).

Ilman näitä kykyjä tietokone tai ihminen ei pysty määrittämään oikeaa suhdetta kysymysten ja vastausten välillä.
Korkeamman asteen kognitiiviset prosessit voivat saavuttaa korkean ymmärryksen tason keskittymällä taustalla oleviin käyttäytymismuotoihin. Ymmärtääksemme jotain, meidän on kyettävä jakamaan tiedot pienemmiksi elementeiksi, jotka ovat melko hyvin organisoituja kyseisellä tasolla. Fyysiset prosessit ihmisissä etenevät täysin eri tavalla kuin prosessit kosmisessa mittakaavassa tai alkuainehiukkasten tasolla. Samoin kognitiiviset järjestelmät on suunniteltu toimimaan ihmistasolla, vaikka ne edustavat valtavasti erilaisia ​​ihmisiä.

Tässä suhteessa kielen ymmärtäminen alkaa ymmärtämisestä enemmän yksinkertaiset säännöt kieli - ei vain muodollinen kielioppi, vaan myös epämuodolliset käytännöt, joita noudatetaan jokapäiväisessä käytössä.

Mitä varten tämä kaikki on?

Nyt vuosien koulutuksen ja parantamisen ansiosta IBM Watsonin kognitiivinen järjestelmä voi toimia useilla eri aloilla. Täällä meillä on lääketiede, ruoanlaitto, kielitiede ja yritysongelmien ratkaiseminen tieteellisillä ongelmilla.

Aluksi asiantuntijoilla oli valinta - tehdä järjestelmästä universaali tai erikoistunut. Jokaisella vaihtoehdolla on omat etunsa ja haittansa, mutta valinta tehtiin monipuolisuuden suuntaan.

Yritys on jo monta kertaa vakuuttunut tekevänsä oikean valinnan – ennenkin

Nykytekniikan toimintaa on usein vaikea selittää, ja kun puhutaan kognitiivisesta laskennasta ja IBM Watsonista, aihe näyttää olevan käsittämätön. tavallinen ihminen. Mutta tämä ei ole ollenkaan totta: ammattilaiset voivat selittää kaiken, myös monimutkaisimmat asiat, melko helposti ymmärrettävillä sanoilla. Tänään IBM:n asiantuntijat puhuvat IBM Watson -kognitiivisen järjestelmän toiminnasta ja muista yrityksen innovatiivisista ratkaisuista. Näitä ovat Venäjän ja IVY-maiden IBM:n teollisten ratkaisujen yrityskonsultti Vladimir Alekseev, IBM:n Venäjän ja IVY-maiden johtava järjestelmäarkkitehti Aleksandr Dmitriev sekä IBM:n Venäjän ja IVY-maiden liiketoiminnan kehityspäällikkö Julia Pakina.

IBM on työskennellyt kognitiivisten teknologioiden alalla useiden vuosien ajan. Kerro meille, missä hankkeissa yritys on tällä hetkellä mukana tähän suuntaan?

Aleksanteri Dmitrijev

Vastataksemme tähän kysymykseen, meidän on puhuttava hieman itse tekniikoista. Kognitiiviset teknologiat ovat suuntaa tekoälyjärjestelmien kehittämiseen, joiden päätehtävänä on auttaa ihmistä tekemään päätöksiä monimutkaisessa ympäristössä. On olemassa useita toimialoja ja prosesseja, jotka vaativat hallintaa, jossa on valtava määrä muuttuvia parametreja, monimutkaisia ​​riippuvuuksia ja vaikeasti ennustettavia tuloksia. Tässä tapauksessa päätökset on tehtävä lähes reaaliajassa. Yksinkertaisin esimerkki olisi sähköinen kaupankäynti pörssissä tai verkko-ostokset. Esimerkiksi suositut ostossivustot tarjoavat usein kampanjoita, kun halpoja tavaroita asetettu myyntiin tietystä ajankohdasta alkaen. Ihminen ei ehdi edes painaa nappia, ja tuote on jo myyty: automaattiset ostojärjestelmät laukeavat. Samoin osakkeiden ostoa ja myyntiä maailman pörsseissä tukevat järjestelmät, jotka keräävät suuria määriä tietoa eri lähteistä ja "automaattisesti" päätösten tekeminen tiettyjen osakesarjojen ostosta tai myynnistä. Itse asiassa päätöksen tekee ihminen, kun hän luo ja kouluttaa tätä järjestelmää.

Kaikesta tästä seuraa ymmärrys asiakasvalikoimasta ja mahdollisista projekteista, joihin kognitiiviset teknologiat sopivat: nämä ovat ensisijaisesti suuria yrityksiä niiltä toimialoilta, joissa on välttämätöntä käsitellä nopeasti ja tehokkaasti suuria tietomääriä, tunnistaa monimutkaisia ​​yhteyksiä ja riippuvuuksia, ja inhimillistä ajattelua lähellä olevien algoritmien avulla kehittää ratkaisuvaihtoehtoja, jotta johtamisen asiantuntijat voivat tehdä valinnan nopeasti Tarvittavat toimet. Nämä ovat ensisijaisesti suuria toimialoja, joilla on suuria resursseja ja tietomääriä - sekä teknisistä järjestelmistä että henkilöstötoimista (öljyteollisuus, pankit, rakentaminen, raskas konepaja jne.). Nämä ovat myös alueita, joilla tarvitaan hallintaa ja ymmärrystä Suuri määrä tiedot uudesta kehityksestä ottaen huomioon kertynyt kokemus ja suuret riskit päätöksiä tehtäessä. Tämä koskee lääketieteen alaa, sosiaalinen hallinta. Lääketieteellisten päätösten hinta on ihmisen henki ja terveys. Tässä kognitiiviset teknologiat ovat erityisen arvokkaita. Ne tarjoavat asiantuntijoille abstraktia tietoa uusista saavutuksista tietyn lääketieteellisen alueen alalla, auttavat valinnassa paras vaihtoehto Hoito kullekin potilaalle ottaen huomioon hänen sairautensa historia ja erityispiirteet.


Lisäksi yksi tärkeimmistä alueista on tietokantojen luominen tietyltä tieteenalalta, tekniikasta, toimintatyypistä, historiasta jne.

Nyt erityisistä projekteista. Tänään on jo kokonainen sarja suuret yritykset luoda monimutkaisia ​​päätöksenteon tukijärjestelmiä, ei vain ulkomailla, vaan myös Venäjällä. Jos puhumme ulkomaisista esimerkeistä, Australian suurin öljy-yhtiö Woodside on luonut teollisuudelleen tietopohjan ottaen huomioon oma kokemus. Tämä mahdollisti useiden monimutkaisten ongelmien ratkaisemisen - ensinnäkin henkilöstön tehokkuuden lisäämisen, koulutusjakson merkittävän nopeuttamisen ja jo kokemuksen käytön ja toistamisen toteutetut hankkeet. Tämä on valtava rahansäästö isolle yritykselle.

Venäläinen esimerkki on suurten tekstimäärien käsittelyyn tarkoitetun järjestelmän käyttöönotto VINITI RAS:ssa, jossa Watson Exploreriin perustuvia teknologioita otetaan menestyksekkäästi käyttöön. Tämä järjestelmä auttaa käsittelemään erilaista jäsenneltyä ja jäsentämätöntä tietoa aihealueita kuvaavien indikaattoreiden välisten korrelaatioiden tunnistamiseksi tieteellinen tutkimus Venäjällä.

Lisäksi toteutettiin yhteistyössä All-venäläisen yleisen mielipiteen tutkimuskeskuksen kanssa kansainvälisten suhteiden aihe. Yli 55 tuhatta tekstiä kohteesta avoimet lähteet analysoitiin Watsonin kognitiivisten teknologioiden avulla tärkeitä kohtia Venäjän ja Etelä-Korean välisissä kulttuurisissa ja sosiaalisissa suhteissa.

Myös useita Watson Health -tuotteeseen perustuvia lääketieteen pilottiprojekteja on saatu päätökseen, ja tulokset osoittavat runsaasti mahdollisuuksia parantaakseen potilashoidon laatua.

On sanottava, että kognitiivisten teknologioiden ala on vielä hyvin uusi, ja siksi meille tulee lähes päivittäin uusia asiakkaita eri aloilta ja valitsemme heille tarvittavat työkalut koko IBM:n saatavilla olevasta ratkaisuvalikoimasta.

Kerro minulle, mikä IBM Watson alun perin oli ja miksi he päättivät käyttää tätä järjestelmää esimerkiksi lääketieteessä, liiketoiminnassa ja vakuutuksissa?

Julia Pakina

Watsonin ensimmäinen esiintyminen oli vuonna 2011 Jeopardyssa! Watson oli tuolloin suuri joukko erilaisia ​​ohjelmia, jotka koottiin erityisesti tätä peliä varten, ja siihen tuolloin rakennetut ominaisuudet tähtäsivät luonnollisen kielen ymmärtämiseen. Tätä varten oli ensinnäkin välttämätöntä kääntää ääni tekstiksi ja toiseksi tulkita tuloksena oleva tekstimateriaali oikein. Siten järjestelmä pystyi aluksi tulkitsemaan tekstiä, jäsentämään kysymyksiä ja "ymmärtämään" niiden merkityksen. Tietenkin Watsonin taso ja tuottavuus ovat nyt paljon korkeammat kuin vuonna 2011.

Mitä muuta sitten voisi tehdä? Watson järjestelmä? Etsi vastaus kysymykseen kysyi kysymys sen sisältämän tiedon syvyyksissä. Järjestelmän erottuva piirre oli, että se ei ollut yhteydessä ulkoisista lähteistä- ei Internetiin eikä mihinkään muuhunkaan. Sen, mitä hänen muistiinsa jäi, hän käytti. Mielenkiintoisinta on, että sisäänrakennetun logiikan ansiosta järjestelmä järjesti mahdolliset vastausvaihtoehdot ja antoi sen, joka logiikkansa ansiosta oli varmasti oikea. Vuonna 2011 Watson-järjestelmä voitti suurella erolla muihin ihmisiin osallistujia. Ja tämän pelin jälkeen heräsi kysymys: "Mitä seuraavaksi?"


Peli on mahtava! Mutta mikä voisi olla järjestelmän jatkosovellus? Tämän jälkeen asiantuntijat alkoivat pohtia, missä Watson-teknologioita voitaisiin kaupallisesti soveltaa, millä alalla, millä markkinoilla. IBM päätti, että Watsonia tulisi käyttää siellä, missä on suuri virtaus luonnollisella kielellä olevaa rakenteellista tietoa ja missä ihminen tarvitsee älykkään avustajan. Ja aloimme työskennellä terveydenhuoltoalalla. Asia on, että Watson, kuten jo tiedämme, pystyy käsittelemään valtavan määrän tietoa. Ja esimerkiksi onkologiassa ilmestyy vuosittain 500 tuhatta uutta tieteellisiä artikkeleita eri aloilla ja tutkimusalueilla. Ja on selvää, että elävä ihminen ei pysty selviytymään sellaisesta tiedon tulvasta. Mutta uusia materiaaleja tällä alueella ei voida jättää huomiotta, ne on käsiteltävä älyllisesti, punnitsemalla, vertaamalla, kääntyen aikaisempaan kokemukseen.

Samalla on ehdottomasti otettava huomioon, että kaikki, mitä Watson nyt voi tehdä, on lahjakkaiden ohjelmoijien, lingvistien ja aiheiden asiantuntijoiden panostanut siihen.

Mikä on visiosi IBM Watsonin tulevaisuudesta? Esimerkiksi mitä ongelmia järjestelmä pystyy ratkaisemaan 5-10 vuodessa? Mitä hän ei voi tehdä nyt, mutta yrityksen asiantuntijat aikovat opettaa hänet tekemään pian?

Aleksanteri Dmitrijev

IBM:n johtava järjestelmäarkkitehti Venäjällä ja IVY-maissa

Tulevaisuuden ennustaminen on melko vaikeaa, sillä useimmat asiantuntijat puhuvat siitä nykyaikaisia ​​ratkaisuja, käytä ilmausta "nykypäivän nopeatempoisessa maailmassa". Tilanne on todellakin muuttumassa hyvin nopeasti ja usein arvaamattomasti, mutta päätrendit kognitiivisten teknologioiden alalla ovat edelleen melko selvät.

Ensinnäkin tämä on suurten tietokantojen luomista yksityisellä ja julkisella tasolla. Nyt kaikki maailman johtavat maat ovat huolissaan tästä. He pyrkivät erittäin aktiivisesti kokoamaan, prosessoimaan ja ottamaan tuotantoon poistojärjestelmän arvokasta tietoa useista eri lähteistä. Näemme, että tämä prosessi tapahtuu kahdella päätasolla. Ensinnäkin suurten, kansainvälisesti merkittävien yritysten tasolla, joilla on satojatuhansia työntekijöitä, sivuliikkeitä eri maissa ja monimutkaista tuotantoa. Päätekijä tässä on kilpailuedun saaminen. On selvää, että tämän tason projektit vaativat vakavia investointeja, mutta ne alkavat maksaa itsensä takaisin lähes välittömästi, mikä lisää merkittävästi toiminnan tehokkuutta. Pääpaino on ennustavassa analyysissä, jonka Watson-teknologiat tarjoavat: hallintaa ei tapahdu tiettyjen tapahtumien päätyttyä, vaan ottaen huomioon yrityksen koko kokemus ennustetilassa. Korkeampi taso on valtiotaso, jolloin luodaan kansallisen mittakaavan tiedon keruu- ja käsittelyjärjestelmiä sekä tietoa muista maista. Nämä ovat tieteen, teknologian, kansanterveyden ja sosiaalisen johtamisen kehittämiseen liittyviä aloja.

Watson on jo hallinnut kokin, lääkärin, rahoittajan ja kääntäjän ammatit. Mitä muita ammatteja hän aikoo hallita lähitulevaisuudessa?

Aleksanteri Dmitrijev

IBM:n johtava järjestelmäarkkitehti Venäjällä ja IVY-maissa

Mitä tulee Watsonin "ammatteihin", on kaksi näkökohtaa. Ensimmäinen on mahdollisuuksien laajentaminen jo hallituissa ammateissa. Oletetaan, että lääketieteen alalla Watsonia käytetään useiden onkologisten sairauksien hoidossa. Mutta lääketieteen erityispiirre on se, että sairauksien tyyppejä ei ole vain valtavasti, vaan myös potilaat itse eroavat henkilökohtaisista ominaisuuksistaan ​​ja sairautensa historiasta. Kehitys johtuu siis sekä hoidettavien sairauksien kirjon lisääntymisestä että mahdollisuudesta kehittää yhä yksityiskohtaisempi yksilöllinen hoitokuvio tietylle potilaalle.

Toinen on muiden ammattien "hallinta". Watson on jo "hallinnut" öljyteollisuuden erikoistumisen: useat ulkomaiset yritykset ovat ottaneet käyttöön päätöksen tukijärjestelmiä öljyasiantuntijoilleen. Toinen lupaava suunta on työskentely sosiaaliset ryhmät ja väestö. Nämä ovat myös alueita, joilla on tarpeen käsitellä tietoa ja kehittää palveluita ja tarjouksia suurille asiakasryhmille (sadoille tuhansille ja miljoonille ihmisille). Välittömiä kehitysnäkymiä ovat siis pankkialan ammatit, tietoliikenne, joissa tietomäärät ovat uskomattoman suuret ja päätöksiä on tehtävä todellinen tila aika.

Yleisesti ottaen uskon, että Watson tulee pian palvelun muodossa jokaiselle ihmiselle - on mahdollista esittää kysymys melkein miltä tahansa kiinnostavalta tietoalueelta ja saada pätevä vastaus.

Julia Pakina

IBM Business Development Manager Venäjällä ja IVY-maissa

Viime aikoina IBM Watsonia on käytetty muun muassa kaivosteollisuudessa. Alexander jo mainitsi hyvä esimerkki menestystarinoita - australialainen Woodside Energy, jonka kognitiivinen järjestelmä auttoi toimimaan paljon tehokkaammin optimoiden työprosessin. Ennen Watsonia kaivojen porauspäätöksen tekivät Woodside Energyn asiantuntijat pitkän ja huolellisen työn perusteella kerätäkseen kaiken mahdollisen dokumentaation kentältä, mukaan lukien alueen geologinen rakenne, kaivojen läsnäolo lähellä, esiintymän tyyppi, mahdollisuus käyttää laitteita, joita tarvitaan tässä projektissa.

Lisäksi aiemmin tämä valmistelujakso vei jopa 80 % yrityksen ajasta. Näin ollen vain 20 % ajasta jäi itse kaivon kehittämiseen. Nyt olemme yhdessä Woodside Energyn kanssa saavuttaneet sen, että vain 20 % ajasta käytetään tutkimukseen ja poraukseen valmistautumiseen, ja loput ajasta kairaukseen ja uusien kaivojen kehittämiseen.

Nyt monet yritykset puhuvat kehityksestään tekoälyn alalla. IBM puhuu kognitiivisesta alustasta. Kerro minulle, mitä erityistä on IBM:n kognitiivisissa palveluissa ja voidaanko niitä kutsua tietyntyyppisiksi tekoälyiksi?

Aleksanteri Dmitrijev

IBM:n johtava järjestelmäarkkitehti Venäjällä ja IVY-maissa

Mitä tulee tekoälyyn, en painottaisi liikaa terminologiaa. Vaikka tiede kokonaisuutena ei täysin ymmärrä ihmisen ajattelun menetelmiä (ja tällä alueella on edelleen monia sokeita pisteitä), on sopimatonta kiistellä, mikä on tekoälyä ja mikä ei. Voidaan sanoa, että Watson-järjestelmä vuonna 2011 "läpäisi" hieman muokatun muodollisen Turingin testin oikeudesta kutsua tekoälyä. Testin yleisidea on yksinkertainen: jos henkilö, joka kommunikoi jonkin järjestelmän kanssa ja esittää sille joukon kysymyksiä vapaassa muodossa, ei pysty erottamaan, onko hän kommunikoimassa henkilön vai konejärjestelmän kanssa, niin tällainen järjestelmä voi vaatia "keinoälyn" titteliä.

Voitettuaan Jeopardy-pelin, jossa oli tarpeen vastata kysymyksiin useilta tietoalueilta, Watson voitti live-osanottajat ja läpäisi tämän testin. Mutta siitä ei ole kysymys. Mitä ikinä kutsummekaan kognitiivisiksi teknologioiksi, on tärkeää, että ne täyttävät päätehtävänsä ja tulevat mielen "vahvistimeksi" tehdessään monimutkaisia ​​päätöksiä, sekä operatiivisia että strategisia. Ihmisen muisti ei ole rajaton, pätevien asiantuntijoiden kouluttaminen kaikilla toimialoilla on kallista ja aikaa vievää työtä. Kognitiiviset järjestelmät näyttävät luovan virtuaalisia asiantuntijakonsultteja, joiden puoleen kuka tahansa voi kääntyä. Tämä on tekoälyn ydin. On tärkeää, että lopullinen päätös kaikissa asioissa jää henkilölle.

Julia Pakina

IBM Business Development Manager Venäjällä ja IVY-maissa

Kyllä, yleensä kognitiivinen järjestelmä luotiin juuri vapauttamaan ihminen rutiineista ja antamaan enemmän aikaa luovuudelle, monimutkaisten ongelmien ratkaisemiseen ja uusien järjestelmien luomiseen. Siksi emme puhu tekoälyn ratkaisusta, vaan tehostetusta älykkyydestä, lisätystä älykkyydestä.

Kerro meille lisää kognitiivisten teknologioiden mahdollisuuksien hyödyntämisestä liiketoiminnassa.

Aleksanteri Dmitrijev

IBM:n johtava järjestelmäarkkitehti Venäjällä ja IVY-maissa

Kognitiivisten teknologioiden käyttö liiketoiminnassa on tarkoitettu ratkaisemaan useita ongelmia, jotka liittyvät paitsi suuriin määriin nopeasti muuttuvaan dataan, myös tarpeeseen poimia tästä datasta nopeasti tarvittavat tiedot ja käyttää sitä liiketoiminnassa alan ja yrityksen omat kokemukset huomioiden. Kognitiiviset järjestelmät ovat siis yhteydessä erilaisiin tietolähteisiin (yrityksen omat tietokannat, Internet, suoratoistovideo, tiedot tekniset anturit eri järjestelmät, tiedot tietyn alueen tapahtumista). Näiden tietojen perusteella kognitiiviset järjestelmät käyttävät erityisiä algoritmeja löytääkseen tarvittavat ratkaisut ja tarjotakseen niitä esimiehille ja asiantuntijoille.

On tärkeää, että työkokemuksen ja onnistuneen toiminnan kerryttämisen tietyllä alueella kognitiivisia järjestelmiä voidaan kouluttaa, konfiguroida ja myös asettaa itseoppimistila. Siksi yritysten kognitiivisilla järjestelmillä on yksi tärkeä ominaisuus, jota millään muulla järjestelmällä ei ole: mitä kauemmin ne toimivat, sitä korkeampi on niiden kerroin. hyödyllistä toimintaa. Niistä itsestään tulee toiminnan aikana yritykselle arvokkaampia. Ja tärkeintä on, että tämä kertynyt kokemus on yrityksen työntekijöiden käytettävissä ja sitä siis jatkuvasti hyödynnetään - toistuvasti, toistuvasti, aina tarvittaessa. Tavanomainen tilanne on, että asiantuntija lähtee ja hänen henkilökohtainen tietonsa ja kokemuksensa menetetään yritykselle. Toteutetun kognitiivisen järjestelmän avulla kaikki kokemus jää yritykseen ja on helposti siirrettävissä muille asiantuntijoille.

Kuinka lohkoketju voi olla hyödyllinen yrityksille? Nyt he sanovat, että tämä tekniikka voi muuttaa tavanomaista yrittäjyyden maailmaa. Onko tämä totta, ja jos on, mitä nämä muutokset ovat?

Vladimir Alekseev

Varhaiset ajatukset siitä, miten teknologia voisi muuttaa yrittäjyyden maailmaa, keskittyivät yleensä vertaisverkkojen luomiseen, eli ympäristöön, jossa jokainen yritys voisi olla vuorovaikutuksessa suoraan toistensa kanssa ilman välittäjiä. Tämä on tosin liian yksinkertaistettu kuvaus, ja ajan myötä idea on kehittynyt ja täydennetty. Nyt voidaan sanoa, että blockchain mahdollistaa ensinnäkin hajautetun vastuun varmistamisen, mikä on äärimmäisen tärkeää, jos meillä on useita yrityksiä, jotka eivät luota kovinkaan paljon toisiinsa ja eivät ole millään tavalla yhteydessä toisiinsa. Toiseksi kaikkien liiketoimien avoimuus ja mahdottomuus tehdä muutoksia jo suoritettuihin tapahtumiin. Liiketoimi ei tarkoita vain pankkitapahtumaa, vaan enemmänkin omaisuuden siirtoa yhdeltä yritykseltä toiselle. Kolmanneksi tämä on mahdollisuus käyttää älykkäitä sopimuksia liiketoimintalogiikassa eli koko toimintaprosessin varmistamisessa. Muuten lohkoketjua voitaisiin käyttää vain tallennusjärjestelmänä ja kaikki toimintojen logiikka voitaisiin tehdä sen puitteiden ulkopuolella, mikä ei takaa toiminnan läpinäkyvyyttä tai luotettavuutta.


Onko kaupallisten yritysten lohkoketjun käytöstä jo olemassa myönteisiä esimerkkejä?

Vladimir Alekseev

IBM:n teollisuusratkaisujen yrityskonsultti Venäjällä ja IVY-maissa

Takana viime vuonna IBM on pilotoinut yli 400 pilottia eri puolilla maailmaa asiakkaiden kanssa useilla eri toimialoilla. Tämä sisältää tietysti rahoitussektorin, vähittäiskaupan ja energian. Erityisesti pilottihankkeet ABN Amron kanssa taloudellisen uudelleenjärjestelyn ja kiinteistöhallinnon alalla. Bank of Tokio-Mitsubishin kanssa saatiin päätökseen projekti lohkoketjuteknologian avulla IT-alan ulkoistussopimusten automatisoimiseksi.

Toteutusten käytännön tuloksista (kvantitatiivisista liiketoimintaindikaattoreista) on nyt aikaista puhua: lohkoketju on vielä uusi teknologia, jonka testaamiseen tarvitaan myös aikaa. Lohkoketjua ei voi olla erillään, joten integrointi olemassa oleviin järjestelmiin, palvelukehitystä vaaditaan, osaamista vaaditaan. Vuosi 2016 oli omistettu pilotoinnille; Vuotta 2017 leimaa lohkoketjuteknologian integrointi organisaatioiden olemassa olevaan IT-infrastruktuuriin.

IBM-instituutin tutkimuksen mukaan yrityksille Arvo, yli 50% tutkituista rahoitusalan johtajista aikoo muuttaa kaupallinen käyttö teknologiat vuosina 2018-2020.

Blockchain tarjoaa sikäli kuin voidaan ymmärtää, suuria mahdollisuuksia monille liiketoiminta-alueille. Mitä voit sanoa kaupankäynnistä pörsseistä? arvopapereita? Voisiko tästä tekniikasta olla hyötyä?

Vladimir Alekseev

IBM:n teollisuusratkaisujen yrityskonsultti Venäjällä ja IVY-maissa

On syytä huomata, että Exchanges oli yksi ensimmäisistä organisaatioista, jotka kiinnostuivat teknologiasta ja osallistuivat aktiivisesti sen kehittämiseen. Esimerkiksi Saksan pörssi (Deutsche Boerse) on pääasiallinen osallistuja HyperLedger-lohkoketjuprojektiin IBM:n ohella, ja Moskovan pörssi on myös jäsen. Käytännön kokemuksista teknologian käyttämisestä pörssissä haluan huomioida seuraavaa: Japanin pörssi teki viime vuonna IBM:n avustuksella selvityksen hajautettujen rekisterien käyttömahdollisuuksista toiminnassaan. Pörssi painotti raportissaan teknologian lupaavuutta ja mainitsi keskeisiksi eduiksi kyvyn luoda uusia innovatiivisia finanssipalveluita ja kustannussäästöjä. Japanin pörssin asiantuntijoiden mukaan lohkoketju auttaa automatisoimaan kaupankäyntimenettelyjen koordinointiprosesseja ja lisäämään koko järjestelmän vikasietoisuutta ottamalla käyttöön jakeluperiaatteen.


Kerro meille, mitä IBM aikoo tehdä seuraavan 5-10 vuoden aikana? Millaisena yritys näkee tulevaisuuden yritysmaailman?

Vladimir Alekseev

IBM:n teollisuusratkaisujen yrityskonsultti Venäjällä ja IVY-maissa

IBM julkisti aiemmin tänä vuonna näkemyksensä siitä, kuinka teknologiset innovaatiot muuttavat maailmaa tulevaisuudessa. Raportin on tuottanut IBM Research ja se heijastaa yhtiön näkemyksiä siitä, kuinka maailma muuttuu viiden vuoden kuluttua viidellä tavalla. Ensinnäkin yhtiö kiinnittää erityistä huomiota siihen, miten me kaikki puhumme ja kirjoitamme, ja uskoo, että näitä tekijöitä käytetään psyykkisen tilan ja fyysisen terveyden indikaattoreina. Seuraavaksi ihmiset voivat saada "supernäön" pienten ja tehokkaiden kameroiden ansiosta, joiden avulla voidaan tutkia lähes 100 % sähkömagneettisesta spektristä verrattuna alle 1 %:iin tällä hetkellä. Tekniikka voidaan integroida mobiililaitteisiin ja auttaa analysoimaan elintarvikkeiden tai lääkkeiden koostumusta. Toisaalta viiden vuoden kuluttua pystymme ymmärtämään maapallon monimutkaisuuden hämmästyttävän yksityiskohtaisesti. Tämä tulee mahdolliseksi Internet of Things (IoT) ja koneoppimisalgoritmien kehityksen ansiosta, joiden pohjalta voidaan tehdä johtopäätöksiä mitattujen parametrien analysoinnista. IBM:n tutkijat kutsuvat tätä yhteisesti "makroskoopiksi". Se auttaa ennustamaan ilmiöitä, kuten muutoksia ilmastossa, vedenkorkeudessa, saastumisuhkia tai vaikutuksia ulkoiset tekijät planeetallemme.

IBM:n teknologian kehityksen seuraava suunta on lääketieteellisten laboratorioiden luominen "siruille" sairauksien seuraamiseksi nanotasolla, mikä auttaa ennustamaan sairauksia aikaisemmissa vaiheissa. IBM:n laboratorioissa asiantuntijat luovat 20 nm:n siruja, jotka voidaan liittää sekä tekoälyjärjestelmiin että muihin antureisiin reaaliajassa. Ja lopuksi, viides alue on "älykkäiden" antureiden luominen ja jakelu ympäristön saastumisen tasojen havaitsemiseen aikaisemmin. Tällaiset anturit voivat olla erittäin hyödyllisiä myös kaasuputkissa sekä lähellä luonnollisia päästölähteitä, esimerkiksi metaania, hälyttämään erilaisten aineiden kasvavista pitoisuuksista.

On syytä huomata, että kaikilla alueilla teknologiat ovat jo kehitteillä, joten ennuste ei näytä liian futuristiselta. Toisaalta olemassa olevien tuotteiden jalostaminen ja massakäyttöön vieminen vie aikaa ja vaivaa.

Pitkän aikavälin näkökulmasta (10 vuotta tai enemmän) voidaan antaa esimerkki kvanttitietokonetekniikasta. Kvanttitietokoneiden toiminta-algoritmi sisältää täysin erilaiset periaatteet kuin ne, joilla nykyaikaiset tietokoneet toimivat. Siksi niiden käyttö voi muuttaa täysin olemassa olevia prosesseja, kuten kryptografiaa, ja tarjota täysin uuden tason laskentatehoa. IBM on yksi johtavista tällä alalla, ja se tarjoaa jo ilmaisen kokeiluversion realille kvanttitietokone IBM Quantum Experience -pilviinfrastruktuurin kautta.

Kysy IBM-asiantuntijalta Elena Sinka, IBM:n ratkaisujen myyntiedustaja Kysyä

Kiitos!
Kysymyksesi on lähetetty

IBM Watson on yksi ensimmäisistä kognitiivisista järjestelmistä maailmassa. Tällä järjestelmällä voidaan tehdä paljon, minkä ansiosta Watsonin kykyjä hyödynnetään monilla alueilla - ruoanlaitosta aina onnettomuuksien ennustamiseen asutuilla alueilla. Yleisesti ottaen useimmat Watsonin kyvyistä eivät ole ainutlaatuisia, mutta yhdessä kaikki nämä ominaisuudet edustavat erittäin tehokasta työkalua erilaisten ongelmien ratkaisemiseen.

Esimerkiksi - luonnollisen kielen tunnistus, dynaaminen järjestelmäoppiminen, hypoteesien rakentaminen ja arviointi. Kaikki tämä antoi IBM Watsonille mahdollisuuden oppia antamaan suoria, oikeita vastauksia (erittäin luotettavasti) operaattorin kysymyksiin. Samaan aikaan kognitiivinen järjestelmä pystyy käyttämään suuria joukkoja globaalia strukturoimatonta dataa, Big Dataa. Mitkä ovat IBM Watsonin kielen kanssa työskentelyn perusperiaatteet? Tästä lisää jatko-osassa.

Luonnollisen kielen tunnistamisen tärkeimmät haasteet

Ihmisille kieli on keino ilmaista ajatuksia. Käytämme kieltä välittääksemme mielipiteitämme, tietojamme ja tietojamme. Voimme tehdä ennusteita ja muodostaa teorioita. Se on kieli, joka on tietoisuutemme kulmakivi. Samaan aikaan tässä on paradoksi: ihmisten kieli on erittäin epätarkka.

Monet termit ovat epäloogisia, ja tietokonejärjestelmien voi olla hyvin vaikea ymmärtää meitä. Miten esimerkiksi ääni voi olla ohut? Kuinka voit polttaa häpeästä? Koneelle tämä on ongelma, mutta ihmiselle täysin tavallinen asia. Tosiasia on, että kysymykseen oikein vastaamiseksi on monissa tapauksissa tarpeen ottaa huomioon olemassa oleva konteksti. Ilman riittävää faktatietoa kysymykseen on vaikea vastata oikein, vaikka voit kirjaimellisesti löytää tarkan vastauksen kysymyksen osiin.

Luonnollisen kielen käsittely – Aloitus

Monet tietokonejärjestelmät pystyvät analysoimaan kieltä, mutta analyysi on pinnallista. Tämä voi olla järkevää esimerkiksi, jotta voidaan tehdä tilastollisesti pätevä arvio tunteiden muutosten trendeistä suurilla tietomäärillä. Tässä tiedonsiirron tarkkuudella ei ole suurta merkitystä, sillä vaikka oletetaan, että väärien positiivisten tulosten määrä on suunnilleen yhtä suuri kuin väärien negatiivisten tulosten määrä, ne kumoavat toisensa.

Mutta jos kaikilla tapauksilla on merkitystä, pinnallisen kielianalyysin kanssa toimivat järjestelmät eivät voi enää tehdä työtänsä kunnolla. Silmiinpistävä esimerkki tästä voisi olla minkä tahansa mobiililaitteen puheavustajan tehtävä. Jos sanot "etsi minulle pizza", avustaja näyttää luettelon pizzeroista. Jos sanot esimerkiksi "älä etsi pizzaa minulle Madridista", järjestelmä etsii silti. Tällaiset järjestelmät toimivat tunnistamalla tietyt avainsanat ja käyttämällä tiettyjä sääntöjä. Tulos voi olla tarkka tietyssä sääntöjärjestelmässä, mutta virheellinen.

Syvä luonnollisen kielen käsittely

Opettaakseen järjestelmän analysoimaan monimutkaisia ​​semanttisia rakenteita, ottaen huomioon tunteet ja muut tekijät, asiantuntijat käyttivät syvää luonnollisen kielen käsittelyä. Nimittäin kysymyksiin vastaava sisällönanalytiikkajärjestelmä (Deep Question*Answering, DeepQA). Jos vaaditaan suurempaa tarkkuutta, on käytettävä muita luonnollisen kielen käsittelymenetelmiä.
IBM Watson on syvän luonnollisen kielen käsittelyjärjestelmä. Tiettyä kysymystä analysoidessaan järjestelmä pyrkii arvioimaan mahdollisimman laajaa kontekstia oikean vastauksen antamiseksi. Tämä käyttää kysymystietojen lisäksi myös tietokantatietoja.
Luonnollisen kielen syväprosessointiin kykenevän järjestelmän luominen mahdollisti toisen ongelman ratkaisemisen - päivittäin syntyvän valtavan tiedon analysoinnin. Tämä on jäsentämätöntä tietoa, kuten twiittejä, sosiaalisen median viestejä, raportteja, artikkeleita jne. IBM Watson on oppinut käyttämään tätä kaikkea inhimillisten ongelmien ratkaisemiseen.

IBM Watsonin kognitiivinen järjestelmä

Watson on eri tason laskentaominaisuudet. Järjestelmä voi erottaa tietyt lausunnot luonnollisella kielellä ja löytää yhteyksiä näiden lauseiden välillä. Samaan aikaan Watson selviää tehtävästä, monissa tapauksissa jopa paremmin kuin ihminen, kun taas tietojenkäsittely on paljon nopeampaa, työ suoritetaan paljon suuremmilla volyymeilla - ihminen ei yksinkertaisesti pysty tähän.

Kognitiivisen järjestelmän perusominaisuudet

Järjestelmä toimii tässä järjestyksessä:

1. Kun Watson saa kysymyksen, se jäsentää sen erottaakseen kysymyksen keskeiset ominaisuudet.

2. Järjestelmä luo sarjan hypoteeseja skannaamalla korpusta etsimällä lauseita, jotka tietyllä todennäköisyydellä voivat sisältää vaaditun vastauksen. Strukturoimattomien tietovirtojen tehokkaaseen etsimiseen tarvitaan täysin erilaisia ​​laskentaominaisuuksia * niitä kutsutaan kognitiivisiksi järjestelmiksi. (En oikein ymmärrä viimeistä lausetta ja tähden roolia)

3. Järjestelmä suorittaa perusteellisen vertailun kysymyksen kielestä ja kunkin mahdollisen vastausvaihtoehdon kielestä käyttämällä erilaisia ​​päättelyalgoritmeja.

Tämä on vaikea vaihe. Päättelyalgoritmeja on satoja, ja ne kaikki suorittavat erilaisia ​​vertailuja. Jotkut esimerkiksi etsivät vastaavia termejä ja synonyymejä, toiset tarkastelevat ajallisia ja spatiaalisia piirteitä, kun taas toiset analysoivat relevantteja kontekstuaalisen tiedon lähteitä.

4. Jokainen päättelyalgoritmi antaa yhden tai useamman pistemäärän, jotka osoittavat, missä määrin mahdollinen vastaus seuraa kysymyksestä algoritmin tarkastelemalla alueella.

5. Jokaiselle saadulle pisteelle annetaan sitten painoarvo tilastollisella mallilla, joka tallentaa kuinka hyvin algoritmi onnistui tunnistamaan loogiset yhteydet kahden samanlaisen lauseen välillä kyseisellä alueella Watsonin "harjoittelujakson" aikana. Tämän tilastollisen mallin avulla voidaan sitten määrittää Watsonin yleinen luottamustaso siihen, että mahdollinen vastaus seuraa kysymyksestä.

6. Watson toistaa prosessia jokaiselle mahdolliselle vastaukselle, kunnes se löytää vastaukset, joilla on paremmat mahdollisuudet olla oikein kuin muut.

Kuten edellä mainittiin, järjestelmän on käytettävä lisätietolähteitä voidakseen vastata kysymykseen oikein. Nämä voivat olla oppikirjoja, käsikirjoja, usein kysyttyjä kysymyksiä, uutisia ja kaikkea muuta. Watson käsittelee valtavia määriä tietoa sekunneissa saadakseen oikean vastauksen. Samalla myös löydetty sisältö tarkistetaan, vanhentuneet ja turhat tiedot poistetaan.

Kognitiivisen järjestelmän elementit

Watson päättelee tekstin yleisen merkityksen saaduista tiedoista, lisätietokannasta. Tämä käyttää asiakirjan otsikkoa, osaa asiakirjan tekstistä tai koko tekstiä.

Kognitiiviset järjestelmät, niiden tiedonkeruu-, muistamis- ja tiedonhakumenetelmät ovat samanlaisia ​​kuin ihmiset analysoivat tietoa. Tässä tapauksessa kognitiiviset järjestelmät voivat välittää tietoa ja toimia. Tässä on esimerkkejä käyttäytymisrakenteista, joita käytetään tässä tapauksessa:

Kyky luoda ja testata hypoteeseja;
- kyky jakaa osiin ja tehdä kielestä loogisia johtopäätöksiä;
- kyky hakea ja arvioida hyödyllistä tietoa (kuten päivämäärät, paikat ja ominaisuudet).

Ilman näitä kykyjä tietokone tai ihminen ei pysty määrittämään oikeaa suhdetta kysymysten ja vastausten välillä.
Korkeamman asteen kognitiiviset prosessit voivat saavuttaa korkean ymmärryksen tason keskittymällä taustalla oleviin käyttäytymismuotoihin. Ymmärtääksemme jotain, meidän on kyettävä jakamaan tiedot pienemmiksi elementeiksi, jotka ovat melko hyvin organisoituja kyseisellä tasolla. Fyysiset prosessit ihmisissä etenevät täysin eri tavalla kuin prosessit kosmisessa mittakaavassa tai alkuainehiukkasten tasolla. Samoin kognitiiviset järjestelmät on suunniteltu toimimaan ihmistasolla, vaikka ne edustavat valtavasti erilaisia ​​ihmisiä.

Tässä suhteessa kielen ymmärtäminen alkaa ymmärtämällä kielen yksinkertaisempia sääntöjä - ei vain muodollista kielioppia, vaan myös arkikäytössä havaittuja epävirallisia käytäntöjä.

Mitä varten tämä kaikki on?

Nyt vuosien koulutuksen ja parantamisen ansiosta IBM Watsonin kognitiivinen järjestelmä voi toimia useilla eri aloilla. Täällä meillä on lääketiede, ruoanlaitto, kielitiede ja yritysongelmien ratkaiseminen tieteellisillä ongelmilla.

Aluksi asiantuntijoilla oli valinta - tehdä järjestelmästä universaali tai erikoistunut. Jokaisella vaihtoehdolla on omat etunsa ja haittansa, mutta valinta tehtiin monipuolisuuden suuntaan.

Yritys on jo monta kertaa vakuuttunut tekevänsä oikean valinnan – ennenkin

) on tekoälyjärjestelmällä varustettu IBM:n supertietokone, jonka loi David Ferruccin johtama tutkijaryhmä. Sen luominen on osa DeepQA-projektia. Watsonin päätehtävänä on ymmärtää luonnollisella kielellä muotoiltuja kysymyksiä ja etsiä niihin vastauksia tietokannasta. Nimetty IBM:n perustajan Thomas Watsonin mukaan.

Osallistuminen "Jeopardy!"

Helmikuussa 2011 testatakseen Watsonin kykyjä hän osallistui televisio-ohjelmaan Jeopardy! (Venäläinen vastine - oma peli). Hänen vastustajansa olivat Brad Rutter, ohjelman suurin voittaja, ja Ken Jennings, pisimmän lyömättömän sarjan ennätys. Watson voitti saamalla miljoona dollaria, kun taas Jennings ja Rutter saivat 300 000 dollaria ja 200 000 dollaria.

Alusta

Watson koostuu 90 Power7 750 -palvelimesta, joista jokaisessa on 4 kahdeksanytimistä POWER7-prosessoria. Kaikki yhteensä RAM Watsonilla on yli 15 teratavua.

Järjestelmällä oli pääsy 200 miljoonalle sivulle strukturoitua ja strukturoimatonta tietoa 4 teratavulla, mukaan lukien koko teksti Wikipedia. Pelin aikana Watsonilla ei ollut pääsyä Internetiin.

Projektin tulevaisuus

IBM aikoo yhdessä Nuance Communicationsin kanssa kehittää seuraavan kahden vuoden aikana tuotteen, joka auttaa diagnosoimaan ja hoitamaan potilaita. Myös muiden alojen sovelluksia, kuten vakuutusten tai energiatehokkuuden arviointia, harkitaan.

Watsonin tarina alkoi vuonna 2006, kun David Ferrucci, IBM:n semanttisen analytiikan divisioonan vanhempi johtaja, alkoi testata yhtä yrityksen tehokkaimmista supertietokoneista, joka on yksi maailman 500 tehokkaimman koneen joukossa. Ferrucci päätti testata, kuinka tehokkaasti kone selviytyy "luonnollisen kielen" asettamista tehtävistä, ja kutsui sen vastaamaan 500 kysymykseen jo pidetyssä Jeopardyssa! Tulokset osoittautuivat tuhoisiksi: livepelaajiin verrattuna kone ei "painanut nappia" tarpeeksi nopeasti (eli oli valmis vastaamaan), ja siinä tapauksessa, että se pystyi vielä kilpailemaan ihmisten kanssa, oikeita vastauksia ei ylittänyt 15 %

Ferrucci kiinnostui supertietokoneen käyttäytymisen syistä, ja sen seurauksena hän onnistui vuonna 2007 vakuuttamaan IBM:n johdon antamaan hänelle 15 hengen tiimin ja 3–5 vuotta aikaa luoda tehokas. automaattinen järjestelmä pystyy vastaamaan epävirallisiin kysymyksiin. Tällainen järjestelmä olisi hyödyllinen kaikenlaisille puhelinkeskuksille, help deskille ja muille asiakkaita palveleville palveluille. IBM:llä on jo onnistunut kokemus ihmisen älykkyyden kanssa kilpailevan koneen luomisesta - puhumme Deep Blue -supertietokoneesta, joka voitti shakin maailmanmestari Garry Kasparovin vuonna 1997. Tämä voitto teki iso mainos IBM, mutta kaupallista sovellusta tällaiselle asennukselle ei löytynyt. Automaattisen kysymysvastausjärjestelmän tapauksessa kaupallinen potentiaali on ilmeinen.

Pohjimmainen ero Watsonin ja Deep Bluen välillä on se, että vaikka shakkikone noudattaa tiukasti loogisia pelisääntöjä, niin "luonnollisen puheen" tunnistava kone kohtaa paljon enemmän. monimutkaiset säännöt kieli ja lukuisat vääristymät ja poikkeamat niistä. Suurin haaste on kuitenkin se, että ihmiset kommunikoivat kulttuurisessa ja sosiaalisessa kontekstissaan ymmärtämättään. Puhekieli on täynnä vihjeitä, viittauksia ja konnotaatioita, viittauksia tiettyihin tietylle sosiaaliselle ympäristölle yhteisiin faktoihin, käsitteisiin ja ilmiöihin. Näitä ovat uskonnolliset ajatukset, poliittiset uskomukset ja kaikenlaiset taideteokset - kirjoista ja maalauksista elokuviin ja tietokonepelit.

Tällaisten tietojen tehokkaaseen käsittelyyn käytetään tilastollisia algoritmeja, jotka mahdollistavat erilaisten käsitteiden välisten yhteyksien luomisen analysoimalla monenlaisia ​​asiakirjoja. Yksinkertaisesti sanottuna se määrittää, mitä sanoja käytetään useimmiten yhdessä. Esimerkiksi "Kremli" yhdistetään useammin sanoihin "Venäjä", "Moskova", hieman harvemmin "Kazan", "Nižni Novgorod", vielä harvemmin "katedraali", "ikoni" jne. Vaikka nämä algoritmit ovat olleet tunnettuja pitkään, niiden täysi käyttö tuli mahdolliseksi vasta viimeisen vuosikymmenen aikana - tuottavuuden dramaattisen kasvun jälkeen tietokone teknologia ja alentaa asemien kustannuksia valtavien tietomäärien tallentamiseen.

Ferruccin tiimi lataa miljoonia kaikenlaisia ​​asiakirjoja IBM Watsonin muistiin – oppikirjoja, tietosanakirjoja, hakuteoksia, kaunokirjallisuutta ja uskonnollista kirjallisuutta. Kysymysten analysointiin käytetään samanaikaisesti yli sataa algoritmia, jotka tarjoavat satoja mahdolliset ratkaisut. Sitten muut algoritmit arvioivat potentiaalisten vastausten luotettavuutta ja eliminoivat ne, jotka ovat objektiivisista syistä mahdottomia (esimerkiksi tapahtuman päivämäärän ja toimijoiden elinvuosien väliset erot) ja epätodennäköiset. Mitä enemmän identtisiä vastauksia saadaan, sitä todennäköisemmin ne ovat oikein - pelin aikana tulostaulu näyttää useiden todennäköisimpien vastausten arvosanan yleisimmän vastauksen lisäksi.

Vuoteen 2008 mennessä IBM Watson oli siirtynyt "häviäjien" luokasta niin sanotun "voittajien pilven" huipulle, joka koostui ihmisistä, jotka painoivat painiketta ensimmäisenä 50 % ajasta, mikä osoitti olevansa valmis. vastaamaan ja sitten 85-95% ajasta antamaan oikea vastaus . IBM jopa sopi Jeopardyn tuottajien kanssa erityisen pelisarjan järjestämisestä syksyllä 2010, johon osallistuvat Watson ja aikaisempien vuosien voittajat. Näihin peleihin valmistautumiseksi (eli itse asiassa algoritmien parantamiseksi) se luotiin uudelleen likimääräinen sisustus tietokilpailustudiossa ja aloitti testien tekemisen live-pelaajien ja juontajan kanssa. Samaan aikaan ”Watson” antaa odotetusti vastauksensa ääneen syntetisoidulla tietokoneäänellä, mikä huvittaa läsnä olevia suuresti.

"Koulutuksen" aikana paljastui mielenkiintoinen tosiasia: vaikka Watsonilla ei ole täyttä potentiaalia, hän ei voi vain voittaa useimpia pelejä, vaan myös hävitä yli puolet niistä. Syitä on useita: "Hänen Majesteettinsa mahdollisuudesta" (tilanteet, joissa vastustaja voi voittaa yksinkertaisesti korottamalla panoksia ja jättämällä auton konkurssiin) sääntöjen erityispiirteisiin. Kummallista kyllä, ihminen pystyy painamaan nappia nopeammin kuin kone, ja tämä johtuu pelin säännöistä, joita ei voi muuttaa.

Tosiasia on, että jokainen kysymys näkyy näytöllä ja esittelijä lukee sen, ja voit painaa painiketta vasta, kun olet lukenut kysymyksen. Watson saa kysymyksen tekstin sähköisesti samalla kun se näkyy ruudulla, mutta silloinkaan se ei ehdi saapua valmis ratkaisu nopeammin kuin ihminen. Kun esittelijä lukee kysymystä, joka kestää kuudesta seitsemään sekuntia, kokenut pelaaja voi jo arvioida mahdollisuuksiaan antaa oikea vastaus ja on valmis painamaan painiketta vain kymmenissä millisekunneissa. Säännöt sallivat vielä viisi sekuntia seuraavaan vastaukseen.

Nappia painamalla ihminen ottaa riskin: jos hän ei anna oikeaa vastausta kysymykseen 100 yksikön verran, hänen virtuaalitilinsä tyhjenee saman verran. Tietokone ei ole taipuvainen ottamaan riskejä ja antaa vastauksia vasta, kun kaikki laskelmat on suoritettu ja vain, jos sillä on tarpeeksi tietoa arvioidakseen tämän vastauksen luotettavuutta ja todennäköisyyttä. Voit katsoa videolta, miltä se näyttää pelin aikana. Ottamalla riskejä elävä pelaaja voi voittaa, koska hän muistaa halutun vastauksen käytettävissään olevissa 11-12 sekunnissa.

Hieman muodollisemmassa tilanteessa kuin peliesitys, Watsonin algoritmit voivat tarjota paljon ennakoitavampia ja tarkempia vastauksia. Erityisesti IBM:n tutkimusosaston johtaja John Kelly aikoo luoda tästä laitteesta lääketieteellisen version epävirallisella nimellä Watson M.D. Tällainen järjestelmä auttaisi lääkäreitä nopeasti ottamaan oikeita päätöksiä ottaen huomioon valtava määrä potilasta koskevaa dataa, jota on fyysisesti mahdotonta pitää aina muistissa. "Watson" voi hyvinkin korvata ihmisoperaattoreita tietokone- ja puhelinpalveluissa vähittäiskaupassa pankkisektori ja kuljetuksissa.

IBM Watson -luokan järjestelmän hinta voi nykyään olla useita miljoonia dollareita, koska sen toiminta vaatii vähintään miljoonan dollarin IBM-supertietokone. Kelly uskoo, että seuraavan kymmenen vuoden aikana tällainen tekniikka voidaan ottaa käyttöön paljon halvemmalla palvelimella, ja tulevaisuudessa tällainen ohjelma toimii tietokoneella, joka ei ole kalliimpi moderni kannettava tietokone.

Ne, jotka puhuvat englantia, voivat kilpailla IBM Watsonin kanssa verkossa The New York Times -sivustolla.

IBM Watson -supertietokonetta on suunniteltu käytettäväksi teknisessä tukipalvelussa live-operaattoreiden sijaan. Kaikki nämä tehtävät liittyvät kuitenkin enemmän oikean vastauksen löytämiseen käyttäjien pyyntöihin tunnetun tiedon perusteella. IBM uskoo, että todellinen tekoäly on kyettävä löytämään luovia ratkaisuja, luomaan ja keksimään uusia asioita, ei vain analysoimaan vanhaa.

Watsonin luovien kykyjen kehittämiseksi hänen luojansa valitsivat kulinaarisen taiteen. Tämä on erittäin kätevä testauskenttä: ruoanlaitto on erittäin "inhimillinen", intuitiivinen prosessi, joka on huonosti soveltuva algoritmisointiin ja standardointiin. Ja kuka tahansa kadulla voi arvioida tuloksia. Espanjalaistyylisiä manteli-suklaakeksejä, ecuadorilaista mansikkajälkiruokaa, grillattuja tomaatteja paahtoleivän päällä sahramin kanssa - näitä ja muita Watsonin luomia ruokia on jo kokeiltujen aikana valmistettu ja nautittu. Ja pari viikkoa sitten julkaistiin esipainos artikkelista, jossa kuvattiin algoritmeja ja matemaattisia malleja, joita Watson käyttää alkuperäisten reseptien luomiseen.

Jokaisen luovan ratkaisun on täytettävä samanaikaisesti kaksi kriteeriä - olla uusi ja laadukas. Uutuus on suhteellisen helppo saavuttaa yksinkertaisesti yhdistämällä ainesosia ja prosessointitekniikoita. Mutta laadun suhteen tilanne on paljon monimutkaisempi. Opeta tietokone ymmärtämään, mikä maku, tuoksu, rakenne ja ulkomuoto astiat ovat erittäin vaikeita.

Watsonin alustavat tiedot olivat useita miljoonia Internetistä kerättyjä reseptejä. Ne ajettiin testattujen luonnollisen kielen käsittelyalgoritmien läpi, joita käytettiin tietokilpailun voittamiseen ja Watsonin lääketieteen opettamiseen. Wikipediasta poimittiin tietoa tyypillisistä raaka-aineista ja prosessointitekniikoista, jotka ovat ominaisia ​​maailman eri kansojen keittiöille. Lopulta Watson sai perusteellisen tiedon ihmisen maku- ja hajuaistimuksen kemiasta ja fysiologiasta.

Uusia reseptejä luotiin olemassa olevista geneettisellä algoritmilla käyttämällä uutuus-, miellyttävyys- ja yhteensopivuusarvoja kuntofunktioina.

Matemaattinen malli Reseptin uutuuden arviointi perustuu Bayesin lauseeseen, jossa käytettiin ns. Bayesin yllätyslähestymistapaa, joka alun perin kehitettiin mallintamaan katsojan käyttäytymistä videon katselun aikana. Lyhyesti sanottuna menetelmän ydin on se, että mitataan ero aiemman ja jälkikäteen olevan todennäköisyyden välillä kohdata tietty tuoteyhdistelmä reseptitilassa, kun siihen lisätään uusi. Siten pähkinöiden ja suklaan tai sinapin ja makkaroiden yhdistelmät ovat täysin banaalisia eivätkä aiheuta todennäköisyyksien muutoksia. erilaisia ​​yhdistelmiä. Mutta suklaalla päällystetyt makkarat vaikuttavat näihin todennäköisyyksiin paljon enemmän.

Kemiaa on käytetty ensisijaisesti miellyttävyyden arvioinnissa. Tietäen kemiallinen koostumus tuotteet sekä niiden sekoitus- ja käsittelyjärjestys, tietokone laski mitkä aineet määräävät ruuan maun ja tuoksun. Mielenkiintoista kyllä, haju osoittautui paljon tärkeämmäksi kuin ruuan maku. Makukäsityksemme liittyy hyvin läheisesti hajuun ja tuoksuun. Ihminen erottaa vain muutaman perusmaun - hapan, makea, suolainen, karvas. Eri kulttuurit erottavat useita perusmakuja, kuten torttu tai umami. Mutta tuoksuvalikoima on paljon suurempi, eivätkä ne rajoitu yksinkertaisiin perusyhdistelmiin.

Lopuksi tuotteen yhteensopivuuden arviointi perustui myös vakavaan tieteellinen perusta, erityisesti amerikkalaisten ja brittiläisten tutkijoiden yhteistutkimuksesta "Makuverkostot ja ruokayhdistelmien periaatteet", jossa analysoitiin noin 50 000 reseptiä ja rakennettiin eri alueiden keittiöille tyypillisiä tuotteiden yhteensopivuuskarttoja.

Tuloksena syntyi sovellus, jossa voit määrittää tuotesarjan, kansallisen tyylin ja ruokalajikkeen, minkä jälkeen Watson antoi joukon reseptejä, joita voi tilata uutuusasteen, miellyttävyyden ja yhteensopivuuden mukaan. Yksittäisten ruokien lisäksi Watson voi luoda kokonaisia ​​ruokalistoja, jolloin teemamallinnuksen avulla saadaan aikaan vaihtelua ja oikeat ruokien yhdistelmät. Tämä on tapa rakentaa malli tekstidokumenttien kokoelmasta, joka jakaa kokoelman aiheisiin ja määrittää, mihin aiheeseen kukin dokumentti kuuluu. Watson soveltaa tätä mallia resepteihin - kuten avainsanoja Yksittäiset ainesosat toimivat asiakirjoina ja itse reseptit asiakirjoina.

Nykyaikaisia ​​supertietokoneita on useita palvelintietokoneet yhdistynyt verkostoksi. Niiden laskentanopeus mitataan petaflopseina.

  • 1 petaflops = 10 15 operaatiota sekunnissa

Ihmisaivojen keskimääräinen suorituskyky on 20 petaflopsia. Vain harvoilla supertietokoneilla maailmassa on erinomainen suorituskyky, mutta mikään niistä ei voi korvata ihmisen aivoja.

Maailmassa on tällä hetkellä useita satoja supertietokoneita. Tehokkaimmat ovat mukana vuotuisessa TOP-500 rankingissa. Vuonna 2016 tämän luokituksen ylitti kiinalainen Sunway TaihuLight. Ennen tätä kiinalainen tietokone Tianhe-2 piti myös johtoa kolmen vuoden ajan. IBM:llä on kaksi supertietokonetta tässä luokassa: Mira ja Sequoia. Jälkimmäinen oli johtaja vuonna 2012 ja on nyt neljännellä.

Andrey Filatov (IBM:n toimitusjohtaja Venäjällä ja IVY-maissa) kognitiivisista teknologioista

DR. Watson on tunnetuin supertietokone

Watsonin tärkein etu on, että se ymmärtää kysymykset luonnollisella kielellä ja vastaa niihin analysoimalla tietoja. Vuonna 2011 Watson voitti ihmisiä peliohjelmassa Vaara!(Venäläinen vastine - "Oma peli").

Watson on kokoelma sovellustekniikoita, joita kutsutaan "pilvipalveluiksi". Watsonia käytetään aktiivisimmin lääketieteessä, mikä auttaa diagnosoimaan ja hoitamaan syöpää. Sen muisti sisältää yli 600 000 lääketieteelliset raportit. Sitä käytetään myös rahoitusalalla, oikeuskäytännössä, hotelliliiketoimintaa ja monilla muilla toimialoilla. Lisäksi hän pystyy jopa keskustelemaan julkkisten kanssa.

Ladattaessa tapahtui virhe.

Watson keskustelee amerikkalaisen tennispelaajan Serena Williamsin kanssa

Hakemukset IBM Watsonille

koulutus. Koulut kaikkialla Yhdysvalloissa testaavat Teacher Advisoria Watsonin kanssa. Se on kognitiivinen työkalu, joka tarjoaa neuvoja opetussuunnitelmien parantamiseen ja oppimisohjelmien personointiin.

Tiede. Johnson & Johnson käyttää Watsonia analysoidakseen tieteellistä kirjallisuutta. Kolossaalista materiaalimäärästä hän valitsee tutkimukseen tarpeelliset, ja tutkimus voidaan tehdä paljon nopeammin ja tehokkaammin.

Turvallisuus. Valssatun teräksen valmistaja North Star BlueScope Steel aikoo käyttää Watson Internet of Things -palvelua luodakseen ratkaisuja työntekijöiden suojelemiseksi äärimmäisiä tilanteita. Työntekijät käyttävät myös laitteita tietojen keräämiseen ja käsittelyyn. Jos vaarallisia olosuhteita ilmenee, tiedot lähetetään välittömästi North Starin johdolle.

Kyberturvallisuus. Kyberrikolliset hakkeroivat Tietojärjestelmä yrityksiä ja sitten myydä niihin pääsyä "mustassa" Internetissä. Jos yhdessä osassa maapallo Jos tapahtuu vika tai petos, Watson-järjestelmä varoittaa muita järjestelmän käyttäjiä.

Lääke. Pohjois-Carolinan yliopisto ja 12 muuta syöpätutkimuskeskusta käyttävät Watsonia potilaiden DNA:n analysointiin yksilöllisten hoitojen kehittämiseksi.

Yksikään lääkäri ei pysty analysoimaan niin suurta tietootosta, vain tietokone