Когнитивная система IBM Watson Health – прорыв в сфере здравоохранения

Современные суперкомпьютеры – это несколько серверных компьютеров, объединенных в сеть. Скорость их вычислений измеряется в петафлопсах.

1 петафлопс = 10 15 операций в секунду

Средняя производительность головного мозга человека - 20 петафлопс. Всего несколько суперкомпьютеров в мире имеют большую производительность, но при этом ни один из них не может заменить человеческий мозг.

В настоящее время в мире существуют несколько сотен суперкомпьютеров. Самые мощные попадают в ежегодный рейтинг ТОП-500. В 2016 году этот рейтинг возглавил китайский Sunway TaihuLight. До этого три года лидерство удерживал тоже китайский компьютер Tianhe-2. У компании IBM в этом рейтинге два суперкомпьютера: Mira и Sequoia. Последний в 2012 году был лидером, а сейчас занимает четвертое место.

Андрей Филатов (генеральный директор IBM в России и странах СНГ) о когнитивных технологиях

Dr. Watson - самый известный суперкомпьютер

Главное достоинство Watson в том, что он понимает вопросы на естественном языке и отвечает на них, анализируя данные. В 2011 году Watson выиграл у людей в телевикторине Jeopardy! (российский аналог - «Своя игра»).

Watson - это набор технологий применения, которые называются «облачными сервисами». Активнее всего Watson применяется в медицине, помогая диагностировать и лечить рак. В его памяти содержится более 600 000 медицинских заключений. Также он используется в финансовой сфере, юриспруденции, гостиничном бизнесе и многих других отраслях. Более того, даже способен поддержать беседу со знаменитостями.

Во время загрузки произошла ошибка.

Watson общается с американской теннисисткой Сереной Уильямс

Области применения IBM Watson

Образование. Школы в США тестируют Teacher Advisor with Watson - когнитивный инструмент, который предлагает советы по улучшению учебных планов и персонализации программ обучения.

Наука . Компания Johnson & Johnson использует Watson для того, чтобы анализировать научную литературу. Из колоссального количества материалов он выбирает необходимые для исследования, и исследование можно проводить намного быстрее и эффективнее.

Безопасность труда. Производитель прокатной стали North Star BlueScope Steel собирается использовать систему Watson Internet of Things, чтобы создать решения по защите рабочих в экстремальных ситуациях. Также рабочие будут носить устройства для сбора и обработки данных. При возникновении опасных для людей условий сведения будут сразу же отправляться руководству North Star.

Кибербезопасность . Киберпреступники взламывают информационные системы предприятий, а потом продают доступ к ним в «чёрном» интернете. Если в одной части земного шара произошёл сбой или мошенничество, система Watson позволит предупредить других пользователей этой системы.

Медицина . Университет Северной Каролины и ещё 12 центров по изучению онкологических заболеваний используют Watson для анализа ДНК пациентов, чтобы затем вырабатывать персонализированные методики лечения.

Ни один врач не в состоянии проанализировать такую огромную выборку информации, только компьютер

Компьютер может очень многое, по крайней мере, что касается обработки информации. Однако, научить его естественному языку - крайне нетривиальная задача. Этот вызов лег в основу проекта IBM DeepQA, в результате которого родилась когнитивная технология, получившая название IBM Watson, в честь Томаса Уотсона, стоявшего у истоков образования IBM.

Объяснить, что такое Watson, несложно - это когнитивная система, способная общаться с человеком на естественном языке. То есть понимать письменную речь и отвечать так же. И если бы IBM ограничились этим, Watson остался бы не более чем экспериментальной установкой. Но для него быстро нашлась работа, и для многих компаний он стал поистине незаменимым сотрудником.

Оказалось, применить это ноу-хау можно везде, где требуется обрабатывать большие объемы неструктурированных данных. Для качественной и быстрой аналитики таких данных их требуется обрабатывать, используя весь доступный инструментарий современных компьютерных технологий: машинное обучение, компьютерная лингвистика, онтологические построения и высокопроизводительные вычисления. Именно для этого предназначен IBM Watson.

Ключевые умения IBM Watson можно свести в четыре пункта:

Понимание естественного языка.
Построение гипотез на основе обработанных данных.
Обучение в процессе работы.
Вынесение рекомендации, сопровождая ее фактами, на которых основан вывод.

Человек не способен за приемлемое время анализировать по-настоящему большой объем данных, и в любом случае ему придется отбросить большую часть информации, выделив, по его мнению, главное. Тут неизбежны ошибки, кроме того, отброшенные данные также имеют значение и должны влиять на результат. И в этом аспекте Watson многократно превосходит человека: он учитывает все, ни один известный факт не останется без оценки.

Первым публичным испытанием системы стало участие в американской игре Jeopardy! (российский аналог - «Своя игра»). Не имея подключения к Интернету, пользуясь открытыми источниками информации, такие как текст всей Википедии, общие энциклопедии и словари, Watson смог победить двух рекордсменов этой игры.

Приглашаем Вас в клиентский центр IBM на семинар «Watson Analytics» и передовые технологии в области аналитики!

Объем медицинских данных удваивается каждые 3 года, а связанные с этим затраты возрастают на 7 триллионов долларов. Сфера здравоохранения не в состоянии «идти в ногу» с ошеломляющей скоростью появления новой информации, включающей в себя данные о лабораторных исследованиях, медицинских испытаниях и различных параметрах человека (масса тела, артериальное давление и прочее). Приблизительно каждые 35 центов из 1 доллара, потраченного на медицинскую помощь, расходуется впустую.

Именно большие расходы на обработку данных стали толчком для разработки уникальной системы IBM Watson. Она способна не только генерировать колоссальные объемы медицинской информации, но и распознавать малейшие отклонения в состоянии здоровья пациентов, которые может упустить даже высококвалифицированный врач с многолетним опытом.

Когнитивная система IBM Watson была названа в честь ее создателя Томаса Уотсона. Разработчикам удалось сотворить суперкомпьютер, который способен обрабатывать информацию наравне с человеческим разумом. Прежде, чем сделать определенный вывод, аналитическая платформа IBM Watson проходит такие стадии, как:

исследование вопроса;
первичный поиск и генерацию гипотез;
фильтрацию результатов;
выборку фактов и анализ их качества;
объединение результатов и их оценку.

Таким образом, суперкомпьютер обрабатывает человеческий язык и оперативно дает ответы на самые сложные вопросы. Медицина – не единственное направление работы IBM Watson. Составить прогноз погоды, придумать оригинальный кулинарный рецепт и даже вести свой собственный бизнес становится намного проще с данной системой. Но в перспективе она будет преимущественно использоваться в сфере здравоохранения.

Направления применения в медицине

Суперкомпьютер IBM Watson повышает удобство использования электронных медицинских карт. Для этого учеными был разработан специальный инструмент под названием EMRA. Врач может использовать это приложение с целью наблюдения за медицинской историей как одного пациента, так и всей его семьи, за историей болезней от других докторов, а также данных о страховщиках. Кроме того, приложение синхронизировано с фитнесс-трекером, поэтому у специалиста появляется возможность наблюдать за самым незначительным изменением состояния здоровья человека. Такая когнитивная система, проанализировав все данные, предоставляет индивидуальные рекомендации по поводу заботы о здоровье каждого пациента.

IBM Watson Health анализирует графические медицинские данные разного типа. Суперкомпьютер может с высокой скоростью определять детали и аномалии любых внутренних органов человека. Объединяя графические и мульти-модальные (текстовые) данные, IBM Watson в разы упрощает работу онкологов и радиологов. Так, уже на протяжении нескольких лет система функционирует в таиландской больнице Бумрунград, диагностируя и предоставляя рекомендации по поводу лечения различных раковых заболеваний.

Система IBM Watson помогает докторам выявить роль генетического фактора при диагностировании и лечении онкологических и редких патологий. Система анализирует геномные данные с электронной медицинской картой пациента, фильтрует информацию о таких же заболеваниях и, обработав ее, передает данные специалисту.

Суперкомпьютер помогает врачам-дерматологам определять различные кожные заболевания. Когнитивная система IBM Watson анализирует изображения, полученные с помощью дерматоскопа. Если специалист визуально способен поставить диагноз с точностью в 75%, то когнитивная система работает с точностью, равной 94%.

Пациенту не стоит переживать по поводу разглашения его личных данных. Компания IBM гарантирует конфиденциальность и анонимность.

Уже сейчас IBM Watson анализирует лекарственные препараты и помогает фармацевтическим компаниям создавать новые. При помощи суперкомпьютера удается снизить количество ошибочных диагнозов, повысить эффективность терапии и подарить шанс на выздоровление даже безнадежным пациентам. С течением времени суперкомпьютер становится все умнее, а это значит, что в ближайшем будущем он поможет предупредить развитие заболеваний до того, как их придется лечить.

IBM Watson - одна из первых когнитивных систем в мире. Эта система умеет очень многое, благодаря чему возможности Watson используются во многих сферах - от кулинарии до предсказания аварий в населенных пунктах. В общем-то, большинство возможностей Watson не являются чем-то уникальным, но в комплексе все эти возможности представляют собой весьма мощный инструмент для решения разнообразных вопросов.

Например - распознавание естественного языка, динамическое обучение системы, построение и оценка гипотез. Все это позволило IBM Watson научиться давать прямые корректные ответы (с высокой степенью достоверности) на вопросы оператора. При этом когнитивная система умеет использовать для работы большие массивы глобальных неструктурированных данных, Big Data. Каковы основные принципы работы IBM Watson с языком? Об этом - в продолжении.

Основные сложности распознавания естественного языка

Для человека язык - это средство выражения мысли. Мы используем язык для передачи своего мнения, каких-либо данных и сведений. Можем делать прогнозы и формировать теории. Именно язык - краеугольный камень нашего сознания. При этом, вот парадокс, язык человека очень неточный.

Многие термины - нелогичны, и компьютерным системам понять нас бывает очень сложно. Например, как может быть тонким голос? Как можно сгореть со стыда? Для машины это - проблема, для человека же - вполне обыденная вещь. Дело в том, что для правильного ответа на вопрос во многих случаях необходимо учитывать имеющийся контекст. При отсутствии достаточной фактической информации трудно правильно ответить на вопрос, даже если вы можете найти точный ответ на элементы вопроса в буквальном смысле.

Обработка естественного языка - начало

Многие компьютерные системы способны анализировать язык, но при этом проводится поверхностный анализ. Это может иметь смысл, например, для того, чтобы поставить статистически обоснованную оценку тенденций в изменении эмоций на больших массивах информации. Здесь точность передачи информации не слишком важна, поскольку если даже если предположить, что число ошибочно-позитивных результатов примерно равно числу ошибочно-негативных результатов, то они компенсируют друг друга.

Но если значение имеют все случаи, то системы, которые работают с поверхностным анализом языка, уже не могут нормально делать свою работу. Ярким примером сказанному может быть задача для голосового помощника любого из мобильных устройств. Если сказать «найди мне пиццу», то помощник выведет список пиццерий. Если же сказать «не ищи мне пиццу в Мадриде», например, система все равно будет искать. Такие системы работают, идентифицируя некоторые ключевые слова и используя определенный набор правил. Результат может быть точным в заданной системе правил, но неправильным.

Глубокая обработка естественного языка

Для того, чтобы научить систему анализировать сложные смысловые конструкции, с учетом эмоций и прочих факторов, специалисты использовали глубокую обработку естественного языка. А именно - вопросно-ответную систему контентной аналитики (Deep Question*Answering, DeepQA). Если требуется большая точность, то приходится использовать дополнительные методы обработки естественного языка.
IBM Watson - система глубокой обработки естественного языка. При анализе определенного вопроса, для того, чтобы дать правильный ответ, система старается оценить как можно более обширный контекст. При этом используется не только информация вопроса, но и данные базы знаний.
Создание системы, способной провести глубокую обработку естественного языка, позволило решить и другую проблему - анализ огромного количества информации, которая генерируется ежедневно. Это неструктурированная информация, вроде твитов, сообщений социальных сетей, отчеты, статьи и прочее. IBM Watson научился использовать все это для решения задач, поставленных человеком.

Когнитивная система IBM Watson

Watson - это уже иной уровень вычислительных возможностей. Система умеет разделять определенные высказывания на естественном языке и находить связи между этими высказываниями. При этом Watson справляется с задачей, во многих случаях, даже лучше человека, при этом обработка данных идет гораздо быстрее, работа ведется с гораздо большими объемами - человек на такое просто неспособен.

Основные характеристики когнитивной системы

Система работает в таком порядке:

1. Получив вопрос, Watson выполняет его синтаксический анализ, чтобы выделить основные особенности вопроса.

2. Система генерирует ряд гипотез, просматривая корпус в поисках фраз, которые с некоторой долей вероятности могут содержать необходимый ответ. Для того чтобы вести эффективный поиск в потоках неструктурированной информации, нужны совершенно другие вычислительные возможности * их называют когнитивными системами. (не очень понимаю последнее предложение и роль звёздочки)

3. Система выполняет глубокое сравнение языка вопроса и языка каждого из возможных вариантов ответа, применяя различные алгоритмы логического вывода.

Это трудный этап. Существуют сотни алгоритмов логического вывода, и все они выполняют разные сравнения. Например, одни выполняют поиск совпадающих терминов и синонимов, вторые рассматривают временные и пространственные особенности, тогда как третьи анализируют подходящие источники контекстуальной информации.

4. Каждый алгоритм логического вывода выставляет одну или несколько оценок, показывающих, в какой степени возможный ответ следует из вопроса, в той области, которая рассматривается данным алгоритмом.

5. Каждой полученной оценке затем присваивается весовой коэффициент по статистической модели, которая фиксирует, насколько успешно справился алгоритм с выявлением логических связей между двумя аналогичными фразами из этой области в “период обучения” Watson. Эта статистическая модель может быть использована впоследствии для определения общего уровня уверенности системы Watson в том, что возможный вариант ответа следует из вопроса.

6. Watson повторяет процесс для каждого возможного варианта ответа до тех пор, пока не найдет ответы, которые будут иметь больше шансов оказаться правильными, чем остальные.

Как уже говорилось выше, для правильного ответа на вопрос системе необходимо обращаться к дополнительным источникам данных. Это могут быть учебники, мануалы, FAQ, новости и все прочее. Watson за считанные секунды обрабатывает огромные массивы информации для получения правильного ответа. При этом найденное содержимое тоже проверяется, отсеиваются устаревшие и бесполезные данные.

Элементы когнитивной системы

Общий смысл текста Watson выводит из полученной информации, из дополнительной базы. При этом используется заголовок документа, часть текста документа или весь текст.

Когнитивные системы, их способы сбора, запоминания и извлечения информации схожи с тем, как анализирует информацию человек. При этом когнитивные системы могут передавать информацию и действовать. Вот примеры поведенческих конструктов, которые используются в этом случае:

Способность создавать и проверять гипотезы;
- способность разбивать на составляющие и строить логические выводы о языке;
- способность извлекать и оценивать полезную информацию (такую как даты, местоположения и характеристики).

Без этих способностей ни компьютер, ни человек не смогут определить правильную взаимосвязь между вопросами и ответами.
Когнитивные процессы более высокого порядка могут достичь высокого уровня понимания, ориентируясь на основные способы поведения. Для того чтобы понять что-то, мы должны уметь разделить информацию на более мелкие элементы, которые достаточно хорошо упорядочены на рассматриваемом уровне. Физические процессы у человека протекают совсем не так, как процессы в космическом масштабе или на уровне элементарных частиц. Так же и когнитивные системы предназначены для работы на уровне человека, хотя они представляют огромное множество людей.

В связи с этим понимание языка начинается с понимания более простых правил языка – не только формальной грамматики, но и неформальных соглашений, которые наблюдаются в повседневном использовании.

Зачем все это?

Сейчас когнитивная система IBM Watson, благодаря многолетнему обучению и совершенствованию, может выполнять работу в самых разных сферах. Здесь и медицина, и кулинария, и лингвистика, и решение бизнес-задач с задачами научными.

Изначально у специалистов был выбор - сделать систему универсальной или специализированной. У каждого из вариантов есть свои достоинства и недостатки, но выбор был сделан в сторону универсальности.

Компания уже много раз убедилась в правильности совершенного выбора - перед

Онлайн-кинотеатр MEGOGO в рамках социального проекта “Смотри как слышно” запустил одноименный интерактивный канал для людей с нарушениями слуха. На канале весь контент без исключения транслируется с сурдопереводом.

Большая часть контента (порядка 70%) рассчитана на детскую аудиторию, которой сложно дается восприятие субтитров. Поэтому, согласно концепции канала “Смотри как слышно”, здесь каждый день с утра будут показаны мультфильмы и детское кино, а в вечернее и ночное время предусмотрена программа с учетом интереса взрослых — фильмы и сериалы. Например, “Петля времени”, “Список контактов”, “Области тьмы”, “Афера по-американски”.

В MEGOGO говорят, что крупные студии и правообладатели с легкостью открывают права на видеопроизводство сопровождающего сурдоперевода. Поэтому на канале пользователи смогут посмотреть знаменитые блокбастеры и легендарные фильмы в HD качестве.

“Мы стараемся снабдить сурдопереводом каждый фильм, на который получаем права. Слабослышащие и люди с нарушениями слуха должны получать доступ ко всему контенту, как и все наши пользователи. Сейчас у нас уже весь контент имеет опцию “субтитры”, но этого недостаточно, есть те, кто не воспринимает тексты и им нужен помощник в виде сурдопереводчика. Канал “Смотри как слышно” отвечает международным тенденциям и практикам по интегрированию в социум людей с нарушениями слуха”, — рассказал Иван Шестаков, директор по маркетингу MEGOGO.

Сурдоперевод полностью создается на собственной студии MEGOGO, которую онлайн-кинотеатр запустил более 2-х лет назад, одновременно со специальным разделом “Смотри как слышно”. Тогда же в рамках одноименного проекта компания регулярно начала проводить кинотеатральные показы мультфильмов для детей с нарушением слуха в Украине, России, странах Балтии и СНГ. Где помимо фильмов при участии различных партнеров юным зрителям дарят подарки, угощения и организовывают развлекательную программу.

Новый интерактивный канал “Смотри как слышно” будет доступен в подписках “Кино и ТВ” в Украине, России, Молдове, Беларуси, Казахстане, Азербайджане, Таджикистане, Кыргызстане, Армении и Туркменистане.

По оценкам экспертов только в Украине кол-во людей с нарушением слуха — 1,3 млн человек. “В странах бывшего СССР их может быть более 8 млн. И они на равных должны быть обеспечены развлечениями. Например, в Финляндии, Швеции, Великобритании язык жестов приравнен к национальному. Ему обучают детей в школе, медработники, полицейские, учителя и обслуживающий персонал должны владеть языком жестов, а ТВ каналы обязаны показывать как минимум субтитры”, — рассказывают о западном примере организаторы благотворительного проекта “Почути”.