Разница между знанием и информацией. Отличия знаний от данных

Данные

Информация

Операции с данными

В ходе информационного процесса данные преобразуются из одного вида в другой. По мере развития НТП и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают (постоянное усложнение условий управления производством и обществом + быстрые темпы появления и внедрения новых носителей/хранителей данных – увеличение объёма данных).

1. Сбор – накопление данных с целью обеспечения достаточной полноты информации для принятия решения;

2. Формализация – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

3. Фильтрация – отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;

4. Сортировка – упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации;

5. Группировка – объединение данных по заданному признаку с целью повышения удобства использования; повышает доступность информации;

6. Архивация – организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат на хранение данных и повышает общую надежность информационного процесса в целом;

7. Защита – комплекс мер, направленных на предотвращение утраты, воспроизведение и модификации данных;

8. Транспортировка – прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя – клиентом;

9. Преобразование – перевод данных из одной формы в другую или из одной структуры в другую. Пример: изменение типа носителя; книги – бумага, электронная форма, микрофотоплёнка. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных.

2. Связь понятий «информация, данные, знания». Модель dikw

Универсальных опеределений нет.

Зна́ние - в теории искусственного интеллекта и экспертных систем - совокупность информации и правил вывода (у индивидуума, общества или системы ИИ) о мире, свойствах объектов, закономерностях процессов и явлений, а также правилах использования их для принятия решений. Главное отличие знаний от данных состоит в их структурности и активности, появление в базе новых фактов или установление новых связей может стать источником изменений в принятии решений.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Для решения задачи данные обрабатываются на основании имеющихся знаний, информация анализируется с помощью знаний. На основе анализа предлагаются варианты решения, принимвается лучшее, пополняет знания.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний. Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

DIKW (англ. data, information, knowledge, wisdom - данные, информация, знания, мудрость) - информационная иерархия, где каждый уровень добавляет определённые свойства к предыдущему уровню.

Сама модель ведет свои истоки от работ философа Мортимера Адлера, однако впервые в приложении к теории управления знаниями она была формализована Николя Анри. В качестве дополнения в 1989 г. Расселом Акоффом было предложено расширение этой модели слоем «understanding» (понимание): понимание требует анализа и предопределения, благодаря чему оно помещено между знанием и мудростью. Относительно временного распределения слоев он указывает на краткость жизненного цикла информации по сравнению с жизненным циклом знания; понимание считается непостоянным, а мудрость принимается за константу

В основании находится уровень данных.

Информация добавляет контекст.

Знание добавляет «как» (механизм использования)

Мудрость добавляет «когда» (условия использования)



Данные и знания

Информация

Данные

Процедурная декларативная

Предметной областью

Знания

Логический вывод

фактами Эвристики

механизмом вывода , логическим выводом или машиной вывода .

интерфейс

База знаний,

Механизм вывода,

Интерфейс с пользователем.

Понятие формальной системы

Основой логических моделей является понятие формальной системы, задаваемой четверкой M = (T , P , A , F ).

Множество T есть множество базовых элементов различной природы, например слов из некоторого ограниченного словаря. Предполагается, что существует процедура П(Т ) проверки принадлежности произвольного элемента множеству Т .

Множество P есть множество синтаксических правил. С их помощью из элементов T образуют синтаксически правильные выражения, например, из слов ограниченного словаря строятся синтаксически правильные выражения. Должна существовать процедура П(Р ), позволяющая определить, является ли

некоторое выражение синтаксически правильным.

В множестве Р выделяется подмножество А априорно истинных выражений (аксиом). Должна существовать процедура П(А ) проверки принадлежности любого синтаксически правильного выражения множеству А .

Множество F есть множество семантических правил вывода. Применяя их к элементам А , можно получать новые синтаксически правильные выражения, к которым снова можно применять правила из F . Так формируется множество выводимых в данной формальной системе выражений. Если имеется процедура П(F ), позволяющая определить для любого синтаксически правильного выражения является ли оно выводимым, то соответствующая формальная система называется разрешимой .

Для знаний, входящих в базу знаний, можно считать, что множество А образуют все информационные единицы, введенные в базу знаний, а с помощью правил вывода из них выводятся новые производные знания . Другими словами, формальная система представляет собой генератор новых знаний, образующих множество выводимых в данной системе знаний .

Данная модель лежит в основе построения многих дедуктивных ИИС . В таких системах база знаний описывается в виде предложений и аксиом теории, а механизм вывода реализует правила построения новых предложений из имеющихся в базе знаний. На вход системы поступает описание задачи на языке этой теории в виде запроса (предложения, теоремы), явно не представленного в БЗ. Процесс работы механизма вывода называют доказательством запроса (теоремы).

Использование логик различного типа при построении синтаксических и семантических правил порождает логические модели различных типов.

Исчисление высказываний

Исчисление высказываний изучает предложения, которые могут быть либо истинными, либо ложными. Не всякое предложение является высказыванием. Например, бессмысленно говорить об истинности вопросительных предложений. Не являются высказываниями предложения, для которых нет единого мнения о том, истинны эти предложения или ложны. По-видимому, далеко не все согласятся с утверждением «математическая логика – увлекательный предмет».

Предложение «Шел снег» также не является высказыванием, так как, чтобы судить о его истинности, нужны дополнительные сведения о том, когда и где шел снег.

Объединяя предложения с помощью связок типа «и» , «или» ,«если… то…» , можно образовывать новые предложения.

В исчислении высказываний используется пять логических связок: отрицание, конъюнкция, дизъюнкция, импликация и эквивалентность.

Конъюнкция (логическое И ) истинна только тогда, когда оба составляющих ее высказывания истинны.

Дизъюнкция (логическое ИЛИ ) ложна только тогда, когда ложны оба составляющих ее высказывания.

У импликации (соответствует связке «Если…, то… ») первый операнд называется посылкой, а второй – заключением. Импликация ложна только тогда, когда ее посылка истинна, а заключение – ложно.

Логическая операция эквивалентность соответствует связке «тогда и только тогда ». Ее результатом является истина , если оба высказывания или одновременно истинны, или одновременно ложны.

Логическое отрицание выполняется над одним высказыванием. Высказывание и его отрицание всегда имеют противоположные истинностные значения.

Символы, используемые для обозначений высказываний, называют атомами .

Правильно построенные формулы в логике высказываний рекурсивно определяются следующим образом:

1) атом есть формула;

2) если A и B – формулы, то формулами являются

и ØA , A Ù B , A Ú B , A ® B , A « B .

Здесь связки обозначены символами:

Ú - логическое ИЛИ (дизъюнкция);

Ù - логическое И (конъюнкция);

® - логическое СЛЕДУЕТ (импликация);

« - логическое ЭКВИВАЛЕНТНО (эквиваленция);

Ø - логическое отрицание.

Интерпретацией формулы называется приписывание каждому атому, входящему в формулу, истинностного значения (истина или ложь ).

Формула, состоящая из n различных атомов, имеет 2 n различных интерпретаций.

Формула, истинная при всех интерпретациях, называется общезначимой (например, A Ú ØA ).

Формула, ложная при всех интерпретациях, называется противоречивой (например, A ÙØA ).

Формула, для которой существует хотя бы одна интерпретация, при которой она истинна, называется выполнимой.

Эквивалентными называются формулы, истинностные значения которых совпадают при всех интерпретациях. С помощью эквивалентных замен формулы можно преобразовывать из одной формы в другую.

Для преобразований формул исчисления высказываний применяют следующие эквивалентности:

1) A Ú ØA = true (истина);

A Ù ØA = false (ложь);

2) правило двойного отрицания

Ø (ØA ) = A ;

3) A ® B = ØA Ú B ;

4) A « B = (A ® B ) Ù (B ® A );

5) законы коммутативности

A Ú B = B Ú A , A Ù B = B Ù A ;

6) законы ассоциативности

(A Ú B ) Ú C =A Ú (B Ú C ), (A Ù B ) ÙC = A Ù (B Ù C );

7) законы дистрибутивности

A Ú (B Ù C ) = (A Ú B ) Ù (A Ú C ), A Ù (B Ú C ) = (A Ù B ) Ú (A Ù C );

8) законы де Моргана

Ø(A Ú B ) = ØA Ù ØB , Ø(A Ù B ) = ØA Ú ØB ;

9) A ® B = ØB ® ØA .

Исчисление предикатов

Аппарат исчисления высказываний во многих случаях не позволяет удовлетворительно описать предметную область. Значительная часть предметных областей может быть описана средствами исчисления предикатов первого порядка. Для этого в рассмотрение вводятся:

а) константы, обозначающие индивидуальный объект или понятие;

б) переменные, которые в разное время могут обозначать разные объекты;

в) термы, простейшими из которых являются константы и переменные, а в более общем случае представляемые выражениями типа , где - функциональный символ, а - термы;

г) предикаты, используемые для представления отношений между объектами в некоторой предметной области;

д) кванторы – средство задания количественных характеристик предметной области.

Предикат – это логическая функция, принимающая только истинностные значения «истина » или «ложь ».

Предикат состоит из предикатного символа и соответствующего ему упорядоченного множества термов, являющихся его аргументами. Предикатный символ P используется для именования отношений между объектами. Если он имеет n аргументов, то называется n-местным предикатным символом.

Запись , являющаяся простейшей (атомарной) формулой, означает, что истинно высказывание: объекты связаны отношением P.

С помощью тех же логических связок, что и в исчислении высказываний (И, ИЛИ, НЕ, СЛЕДУЕТ, ЭКВИВАЛЕНТНО ), можно строить более сложные формулы.

Для определения областей действия переменных в формулах используются кванторы (всеобщности) и (существования). Кванторы позволяют строить высказывания о множестве объектов и формулировать утверждения, истинные для этого множества.

Формулы исчисления предикатов (ППФ – правильно построенные формулы) определяются рекурсивно следующим образом:

1. атом есть формула;

2. если A и B – формулы, то формулами являются и

ØA , A Ù B , A Ú B , A ® B , A « B ;

3. если - есть формула, то формулами являются и и .

Интерпретация формул в исчислении предикатов – это задание областей значений всем константам, функциональным и предикатным символам. Формула, интерпретируемая на области D , принимает значения истина или ложь по следующим правилам:

а) если заданы значения формул A и B , то истинностные значения формул ØA , A Ù B , A Ú B , A ® B , A « B получаются по таблицам истинности, справедливым для исчисления высказываний;

б) формула получает значение истина , если для каждого из D имеет значение истина , в противном случае ее значение – ложь .

в) формула получает значение истина , если хотя бы для одного из D имеет значение истина , в противном случае ее значение – ложь.

Формула A есть логическое следствие формул , тогда и только тогда, когда для любой интерпретации, в которой формула истинна, формула A также истинна.

Кроме формул эквивалентных преобразований, приведенных для исчисления высказываний, в исчислении предикатов справедливы следующие:

Ø($ ) = () (Ø );

Ø() = () (Ø ).

Виды фреймов

По познавательному назначению различают два типа фреймов: фрейм – прототип и фрейм – пример. Фрейм – прототип отражает знания об абстрактных стереотипных понятиях, которые являются классами каких-то конкретных объектов. Фреймы-прототипы отражают интенсиональные знания, т.е. обобщенные знания о закономерностях, присущих рассматриваемому классу объектов. Фреймы – примеры отражают знания о конкретных фактах предметной области, или так называемые экстенсиональные знания. Переход от фрейма-прототипа к фрейму-экземпляру выполняется при проведении процедуры означивания фрейма-прототипа в процессе работы механизма логического вывода.

В качестве примера рассмотрим упрощенную схему фрейма – прототипа понятия ДАТА:

<ДАТА> (<МЕСЯЦ><имя>)(<ДЕНЬ><целые числа {1,2,…, 31}>)

(<ГОД><функция>)(<ДЕНЬ НЕДЕЛИ><перечень {ПНД,ВТР,…,ВСК}>

<функция>)

Имя фрейма – прототипа – ДАТА. В слоте МЕСЯЦ на месте значения записано ИМЯ, т.е. значением слота может быть любое буквенное выражение. Значением слота ДЕНЬ являются целые числа, причем перечень их приведен в слоте. В слоте ГОД указана функция, которая может реализовать следующие действия. Если во входном предложении указан год, то он вносится в поле значения слота во фрейме – примере; если год не указан, то отсутствующее значение заполняется текущим годом. Такого рода функции называются функциями, выполняемыми по умолчанию.

В слоте ДЕНЬ НЕДЕЛИ также определена функция, которая при обработке входного сообщения будет вызываться автоматически для проверки на непро-

тиворечивость значения дня недели, указанного пользователем, либо вычисле-

ния этого значения, если пользователь его не указал.

Конкретный фрейм – пример фрейма ДАТА может выглядеть следующим образом:

<ISA ДАТА>(<МЕСЯЦ><ИЮНЬ>)(<ДЕНЬ><5>)

Метка ISA обозначает, что данный фрейм является фреймом – примером. Здесь заполнены только 2 слота. Значения остальных могут быть вычислены с помощью соответствующих процедур.

Процедуры, включаемые в слот, делят на два типа: процедуры – демоны и

процедуры – слуги.

Процедуры – демоны активизируются автоматически каждый раз, когда данные попадают в соответствующий фрейм – пример или удаляются из него. Так, процедура, встроенная в слот ДЕНЬ НЕДЕЛИ в описанном выше примере, является представителем процедуры – демона. С помощью процедур этого типа выполняются все рутинные операции, связанные с ведением баз данных и знаний.

Процедуры – слуги активизируются только по запросу. Примером такой процедуры является функция, встроенная в слот ГОД в фрейме – прототипе ДАТА, которая вызывается только в том случае, если пользователь не указал год.

Рис. 4.6 Сеть фреймов

на фрейм Ребенок. Наследование слота «любит» из фрейма Ребенок.

Запрос 2. Каков возраст учеников?

Ответ: 6-17 – значение слота «возраст» берется из фрейма Ученик. Значение из фрейма Ребенок не берется, т.к. значение указано явно в самом фрейме «ученик», относительно которого задается вопрос.

По функциональному назначению различают следующие виды фреймов:

Фреймы – объекты (пример выше);

Фреймы – операции (например, фрейм «процесс синтеза корректирующих устройств», слоты: модель, алгоритм расчета, параметры и т.д.);

Фреймы – ситуации (например, фрейм «Аварийный режим работы аналогового датчика», слоты: напряжение, сила тока и т.д.);

Фреймы – сценарии (например, фрейм «Тушение пожара», слоты: место пожара, средства тушения и т.д.).

Фреймовая модель представления знаний используется в языках FRL (Frame Representation Language ) ,KRL (Knowledge Representation Language ) и др.

Особенности логического вывода

Во фреймовых языках основной операцией является поиск по образцу . Образец представляет собой фрейм, в котором заполнены не все структурные единицы, а только те, по которым среди фреймов, хранящихся в памяти системы, будут отыскиваться нужные фреймы. Образец может, например, содержать имя фрейма, а также имя некоторого слота во фрейме с указанием значения слота. Такой образец проверяет наличие в памяти системы фрейма с данным именем и данным значением слота, указанного в образце. В образце может быть указано имя некоторого слота и его значение. Тогда процедура поиска по образцу должна обеспечить выборку всех фреймов, в которых содержится слот с таким именем и таким значением слота, как у образца. Наконец, может быть задана некоторая логическая функция от имени фрейма, каких-то имен слотов и значений слотов. Таким образом, логический вывод в сети фреймов основан на операции сопоставления.

Другими процедурами, характерными для фреймовых языков, являются процедуры наполнения слотов данными, а также процедуры введения в систему новых фреймов-прототипов (т.е. новых знаний) и введения новых связей между ними.

Рассмотрим фрагмент описания из "мира блоков" (рис. 4.7) в виде фреймов на языке FRL.

Рис. 4.7 «Мир блоков»

(frame (name (Cube )) (length (NULL )) (width (IF-DEFAULT (use length ))) (height (IF-DEFAULT (use length )))) (frame (name (B 1)) (AKO (Cube )) (color (red )) (length (80))) (frame (name (B 2)) (AKO (Cube )) (color (green )) (length (65))))

Слот AKO указывает на то, что объекты B 1 и B 2 являются подтипом объекта Cube и наследуют его свойства, а именно, length = width = height. Процедура - демон IF-DEFAULT заполняет значения слотов по умолчанию.

Допустим, роботу дается приказ «Возьми желтый предмет, который поддерживает пирамиду». На языке представления знаний вопрос записывается так:

(object X (color (yellow )) (hold Y (type (pyramid ))))

Программа сопоставления с образцом находит в базе знаний описание объектов:

(frame (name (B 3)) (type (block )) (color (yellow )) (size (20 20 20)) (coordinate (20 50 0)) (hold (P 2)))

(frame (name (P 2)) (type (pyramid )) ...)

Ответ получен: X = B 3, Y = P 2, и роботу выдается команда take (object B 3).

Достоинства фреймов как модели представления знаний – возможность структуризации базы знаний благодаря свойствам иерархичности и наследования. Недостатком является сложность организации логического вывода.

Лекция. Основы построения продукционной системы

Применение метаправил

Иногда, для того чтобы решить, какое правило следует активизировать, желательно использовать конкретные знания, а не следовать общей стратегии разрешения конфликтов. С этой целью в некоторые интерпретаторы правил включены средства, позволяющие программисту сформулировать и ввести в программу метаправила. Метаправила определяют правила, по которым выполняется отбор из списка заявок тех правил, которые следует рассматривать в первую очередь или, более того, выполнять обязательно.

Метаправила позволяют значительно сузить круг правил - кандидатов на основании какого-либо критерия или изменить порядок приоритетов правил. Метаправила часто используют знания из конкретной предметной области. Примером может служить приведенное ниже метаправило, относящееся к сис-

теме медицинской диагностики MYCIN .

МЕТАПРАВИЛО 001

ЕСЛИ (1) инфекция относится к классу pelvic-abscess , и

(2) существуют правила, в предпосылках которых упоминается

enterobacteria , и

(3) существуют правила, в предпосылках которых упоминается

грамположительная окраска,

ТО с уверенность 0.4 приоритет следует отдать первым из перечисленных правил.

Лекция. Основные понятия в области искусственного интеллекта

Область науки, получившая название «искусственный интеллект», имеет целью выявить принципиальные механизмы, лежащие в основе человеческой деятельности, чтобы применить их при решении конкретных научно-технических задач. «Разумные» системы создаются для работы в средах, где присутствие человека невозможно или опасно для жизни. Этим устройствам придется действовать в условиях большого разнообразия возможных ситуаций. Невозможно заранее описать эти ситуации с той степенью подробности и однозначности, которые позволили бы заложить в создаваемую систему жестко запрограммированные алгоритмы поведения. Поэтому системы, вооруженные искусственным интеллектом, должны располагать механизмами адаптации, которые позволили бы им строить программы целесообразной деятельности по решению поставленных перед ними задач на основании конкретной ситуации, складывающейся на данный момент в окружающей их среде.

Такая постановка проблемы выдвигает перед исследователями особые задачи, не возникавшие ранее при проектировании технических систем. К числу таких задач относятся: описание богатой внешней среды и ее отражение внутри системы (эту задачу называют задачей представления знаний); управление банком знаний, его пополнение, обнаружение противоречий и недостатка в знаниях; восприятие внешней среды с помощью различного рода рецепторов (зрительных, тактильных, слуховых и т.д.); понимание естественного языка, который служит для человека универсальным средством коммуникации; восприятие печатного текста и устной речи и преобразование содержащейся в сообщениях информации в форму представления знаний; планирование деятельности – задача, решение которой позволит системе формировать планы достижения цели с помощью имеющихся в ее распоряжении средств; адаптация и обучение на основе накопленного опыта.

Таково поле деятельности специалистов в области систем искусственного интеллекта. Оно лежит на стыке самых разнообразных дисциплин: программирования и психологии, техники и лингвистики, математики и физиологии.

Итак, теория искусственного интеллекта – это наука о знаниях, о том, как их извлекать, представлять в искусственных системах, перерабатывать внутри системы и использовать для решения практических задач. Другими словами, системы, изучаемые в рамках искусственного интеллекта и создаваемые в русле этой науки, - это системы, работа которых опирается на знания, отражающие семантику и прагматику того внешнего мира, в котором действуют интеллектуальные системы.

Таким образом, основными проблемами искусственного интеллекта являются представление и обработка знаний. Решение этих проблем состоит как в разработке эффективных моделей представления знаний, методов получения новых знаний, так и в создании программ и устройств, реализующих эти модели и методы.

Элементы искусственного интеллекта находят широкое применение для создания интеллектуальных программных средств ЭВМ, автоматизированных систем управления (АСУ), систем автоматизации проектирования (САПР), информационно-поисковых систем (ИПС), систем управления базами данных (СУБД), экспертных систем (ЭС), систем поддержки принятия решений (СППР), т.е. позволяют повысить уровень интеллектуальности создаваемых информационных систем.

Достижения в области искусственного интеллекта применяются в промышленности (открытие и разработка месторождений, космонавтика, автомобилестроение, химия, и т.д.), в экономике (финансы, страхование, и т.д.), в непромышленной сфере (транспорт, медицина, связь и т.д.), в сельском хозяйстве.

Средства искусственного интеллекта позволяют разрабатывать модели и программы решения задач, для которых неизвестны прямые и надежные методы решения. Такие задачи относятся к области творческой деятельности человека. Специалисты по искусственному интеллекту ставят такие научные проблемы, как доказательство математических теорем, диагностика заболеваний или неисправностей в оборудовании, финансовый анализ субъектов хозяйствования, синтез программ на основе спецификаций, понимание текста на естественном языке, анализ изображения и идентификация его содержимого, управление роботом и др.

Данные и знания

Приведем определения основных понятий изучаемой дисциплины и рассмотрим различия между понятиями «данные» и «знания».

Информация – совокупность сведений, воспринимаемых из окружающей среды, выдаваемых в окружающую среду либо сохраняемых внутри информационной системы (ИС).

Данные – представленная в формализованном виде конкретная информация об объектах предметной области, их свойствах и взаимосвязях, отражающая события и ситуации в этой области.

Данные представляются в виде, позволяющем автоматизировать их сбор, хранение и дальнейшую обработку. Данные – это запись информации в соответствующем виде, пригодном для хранения, передачи, обработки и получения новой информации.

Информация, с которой имеет дело ЭВМ, разделяется на процедурную и декларативную.

Процедурная информация представляется программами, которые выполняются в процессе решения задач, а декларативная – данными, которые обрабатывают эти программы.

Любая интеллектуальная деятельность опирается на знания о предметной области, в которой ставятся и решаются задачи.

Предметной областью называют совокупность взаимосвязанных сведений, необходимых и достаточных для решения определенного множества задач. Знания о предметной области включают описания объектов, явлений, фактов, а также отношений между ними.

Знания – это обобщенная и формализованная информация о свойствах и законах предметной области, с помощью которой реализуются процессы решения задач, преобразования данных и самих знаний, и которая используется в процессе логического вывода.

Логический вывод – это генерирование новых утверждений (суждений) на основе исходных фактов, аксиом и правил вывода.

Знания с точки зрения решаемых задач в некоторой предметной области делят на 2 большие категории - факты и эвристики. Под фактами обычно понимают общеизвестные в данной предметной области истины, обстоятельства. Эвристики – это эмпирические алгоритмы, основанные на неформальных соображениях, которые ограничивают число вариантов решения и обеспечивают целенаправленность поведения решающей системы, не гарантируя, однако, получения наилучшего решения. Такие знания основаны на опыте специалиста (эксперта) в данной предметной области.

Со знаниями тесто связано понятие процедуры получения решений задач (стратегии обработки знаний). В ИИС такую процедуру называют механизмом вывода , логическим выводом или машиной вывода .

Знания, с которыми работает система, хранятся в базе знаний (БЗ).

Для организации взаимодействия с ИИС в ней должны быть средства общения с пользователем, т.е. интерфейс . Интерфейс обеспечивает работу с БЗ и механизмом вывода на языке достаточно высокого уровня, приближенном к профессиональному языку специалистов в той предметной области, к которой относится ИИС. Кроме того, в функции интерфейса входит поддержка диалога пользователя с системой, позволяющего пользователю получать объяснения действий системы, участвовать в поиске решения задачи, пополнять и корректировать базу знаний. Таким образом, основными частями ИИС являются:

База знаний,

Механизм вывода,

Интерфейс с пользователем.

Особенности знаний, отличающие их от данных

Пример . Пусть в качестве предметной области выступают родственные связи. Объектами этой предметной области являются такие понятия, как мать,

отец, дочь, мужчина, женщина и т.п.

Пусть известны факты:

Виктор является отцом Тани.

Владимир является отцом Виктора.

На языке Пролог эти факты описываются следующим образом:

отец (виктор, таня).

отец (владимир, виктор).

Здесь «отец» является именем отношения или предикатом, а «виктор», «таня» и «владимир» - константами.

Пусть X , Y , Z – переменные. Используя переменные X и Z , можно в общем случае записать отношение «X является отцом Z » на языке Пролог:

отец (X , Z ).

Используя предикат «отец» и переменные X , Y , Z , сформулируем новое отношение «дед», а именно:

Если X является отцом Z и

Z является отцом Y

то X является дедом Y .

Такая форма записи отношения «Если.…То» называется продукционным правилом , продукцией или просто правилом .

На языке Пролог отношения «дед» записывается следующим образом:

дед (X , Y ): – отец (X , Z ), отец (Z , Y ).

Символ « : – » интерпретируется как «Если».

На примере отношения «дед» сформулирована общая закономерность определения понятия «дед» через понятие «отец». Имя «владимир», взятое вне зависимости от отношения, ни о чем не свидетельствует. Возможно это имя человека или наименование города. Точно так же рассматриваются числовые или другие данные, например, в файле данных. Данное, взятое вместе с отношением, определяет некоторый смысл и таким образом представляет собой знание.

Рассмотрим особенности знаний, в которых заключается их отличие от данных.

1. Интерпретируемость . Данные, хранимые в памяти ЭВМ, могут интерпретироваться только соответствующей программой. Данные без программы не несут никакой информации, в то время как знания имеют интерпретацию, так как они содержат одновременно и данные, и соответствующие им имена, описания, отношения, т.е. вместе с данными представлены информационные структуры, которые позволяют не только хранить знания, но и использовать их.

Характерным признаком интеллектуальных систем является наличие знаний, необходимых для решения задач конкретной предметной области.

Введение в инженерию знаний

Введение в инженерию знаний

2. Знания как особая форма информации. Отличие знаний от данных.

5. Подразделение знаний. Декларативная и процедурная формы представления знаний

6. Свойства знаний

7. Интенсионал и экстенсионал понятия.

8. Парадигмы представления знаний. Классификация моделей представления знаний

Теоретическими и практическими вопросами представления и обработки знаний в компьютерных системах активно занимаются исследователи, работающие в области инженерии знаний. Это понятие в 1977 г. ввел Э. Фейгенбаум, который писал: «По опыту нам известно, что большая часть знаний в конкретной предметной области остается личной собственностью эксперта. И это происходит не потому, что он не хочет разглашать своих секретов, а потому, что он не в состоянии сделать этого - ведь эксперт знает гораздо больше, чем сам осознает». Инженерия знаний - направление ИИ, которое связано с развитием теоретических и прикладных аспектов приобретения и формализации знаний специалистов, с проектированием и разработкой баз знаний.

Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства. В процессах компьютерной обработки данные проходят следующие этапы преобразований:

исходная форма существования данных (результаты наблюдений и измерений, таблицы, справочники, диаграммы, графикии т.д.);

представление на специальных языках описания данных предназначенных для ввода и обработки исходных данных в ЭВМ;

базы данных на машинных носителях информации.

Знания являются более сложной категорией информации по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания могут быть получены на основе обработки эмпирических данных. Они представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

3. Способы наделения знаниями программных систем

Для того чтобы наделить ИИС знаниями, их необходимо представить в определенной форме. Существуют два основных способа наделения знаниями программных систем .

Первый - поместить знания в программу, написанную на обычном языке программирования. Такая система будет представлять собой единый программный код, в котором знания не вынесены в отдельную категорию. Несмотря на то, что основная задача будет решена, в этом случае трудно оценить роль знаний и понять, каким образом они используются в процессе решения задач. Нелегким делом являются модификация и сопровождение подобных программ, а проблема пополнения знаний может стать неразрешимой.



Второй способ базируется на концепции баз данных и заключается в вынесении знаний в отдельную категорию, т.е. знания представляются в определенном формате и помещаются в БЗ. База знаний легко пополняется и модифицируется. Она является автономной частью интеллектуальной системы, хотя механизм логического вывода, реализованный в логическом блоке, а также средства ведения диалога накладывают определенные ограничения на структуру БЗ и операции с нею. В современных ИИС принят этот способ.

Задача представления знаний в информационных системах

Для того, чтобы поместить знания в компьютер, их необходимо представить определенными структурами данных, соответствующих выбранной среде разработки интеллектуальной системы. Следовательно, при разработке ИИС сначала осуществляются накопление и представление знаний, причем на этом этапе обязательно участие человека, а затем знания представляются определенными структурами данных, удобными для хранения и обработки в ЭВМ.

Знания в ИИС существуют в следующих формах:

исходные знания (правила, выведенные на основе практического опыта, математические и эмпирические зависимости, отражающие взаимные связи между фактами; закономерности и тенденции, описывающие изменение фактов с течением времени; функции, диаграммы, графы и т. д.);

описание исходных знаний средствами выбранной модели представления знаний (множество логических формул или продукционных правил, семантическая сеть, иерархии фреймов и т. п.);

представление знаний структурами данных, которые предназначены для хранения и обработки в ЭВМ;

базы знаний на машинных носителях информации.

4. Определение понятия знание

Из толкового словаря С. И. Ожегова: 1) «Знание - постижение действительности сознанием, наука»; 2) «Знание - это совокупность сведений, познаний в какой-либо области».

Из японского толкового словаря: «Знания - это результат, полученный познанием», или, более подробно, «система суждений с принципиальной и единой организацией, основанная на объективной закономерности».

Исследователями в области ИИ даются более конкретные определения знаний.

«Знания - это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области

«Знания - это хорошо структурированные данные или данные о данных, или метаданные»

«Знания - формализованная информация, на которую ссылаются или используют в процессе логического вывода»

Знание о предметной области - это описание объектов, их окружения, необходимых явлений, фактов, а также отношений между ними.

5. Подразделение знаний

Существует множество классификаций знаний. Вместе с тем, с помощью классификаций, как правило, систематизируют знания конкретных предметных областей. На абстрактном уровне рассмотрения можно говорить о признаках, по которым подразделяются знания, а не о классификациях.

По своей природе знания можно делятся на декларативные и процедурные.

Декларативны е знания представляют собой описания фактов и явлений, фиксируют наличие или отсутствие таких фактов, а также включают описания основных связей и закономерностей, в которые эти факты и явления входят.

Процедурные знания - это описания действий, которые возможны при манипулировании фактами и явлениями для достижения намеченных целей.

По способу приобретения знания можно разделить на факты и эвристики (правила, которые позволяют сделать выбор при отсутствии точных теоретических обоснований). Первая категория знаний обычно указывает на хорошо известные в данной предметной области обстоятельства. Вторая категория знаний основана на собственном опыте эксперта, работающего в конкретной предметной области, накопленном в результате многолетней практики.

По типу представления знания делятся на факты и правила . Факты - это знания типа «А - это А», такие знания характерны для баз данных и сетевых моделей. Правила, или продукции - это знания типа «ЕСЛИ А, ТО В».

Фактические и стратегические знания . Фактические знания - основные закономерности предметной области, позволяющие решать конкретные производственные, научные и другие задачи, то есть факты, понятия, взаимосвязи, оценки, правила, эвристики. Стратегические знания - стратегии принятия решений в предметной области;

Кроме фактов и правил существуют еще метазнания - знания о знаниях. Они необходимы для управления БЗ и для эффективной организации процедур логического вывода. Классическими примерами метазнаний являются народные пословицы и поговорки, каждая из которых характеризует знания (рекомендации по деятельности) в широком классе конкретных ситуаций (например, пословица "Семь раз отмерь, один - отрежь" применима не только в среде хирургов или портных. «Не зная броду не суйся в воду»).

Глубинные и поверхностные знания . В глубинных знаниях отражается понимание структуры предметной области, назначение и взаимосвязь отдельных понятий (глубинные знания в фундаментальных науках - это законы и теоретические основания). Глубинные знания образуются как результат обобщения первичных понятий в некоторые абстрактные структуры, которые могут и не иметь вербального описания Глубинные знания обладают такими важными особенностями, как гибкость и аддитивность (лат. additio - прибавление; получаемый путем сложенияПоверхностные знания представляют собой совокупность эмпирических ассоциаций и отношений между понятиями предметной области для стандартных рассуждений и ситуаций

Жесткие и мягкие знания . Жесткие знания позволяют получать однозначные рекомендации при заданных начальных условиях. Мягкие знания допускают множественные, «размытые» решения и различные варианты рекомендаций.

В практике разработки СИИ обозначилась тенденция перехода от использования поверхностных знаний к глубинным и мягким. Использование глубинных и мягких знаний позволяет создать БЗ большой мощности.).

Прежде чем продолжить рассмотрение проблематики управления знаниями важно определиться с ключевыми понятиями этой области: «данные», «информация», «знания».

В литературе, посвященной управлению знаниями, представлены различные подходы к их трактовке. Не претендуя на полномасштабный анализ, попробуем обозначить некоторые важные моменты.

Под данными понимаются неупорядоченные наблюдения, числа, слова, звуки, изображения. Это – набор дискретных, объективных факторов о событиях. При этом в организационном контексте данные трактуются как структурированные записи об актах деятельности. Организации обычно хранят данные в информационных системах, в которые они поступают из различных подразделений и служб.

Когда данные организованы, упорядочены, сгруппированы категоризированы, они становятся информацией . Она трактуется как совокупность данных, упорядоченная с определенной целью, придающей им смысл.

Сообщение - это текст, цифровые данные, изображения, звук, графика, таблицы и др

Сведения – практически синоним понятия “Сообщения”. Они чаще всего носят бытовой характер.

Знание же трактуется как информация, готовая к продуктивному применению, действенная, снабженная смыслом. Оно представляет собой совокупность оформленного опыта, ценностей, контекстуальной информации, экспертного понимания, составляющих основу для оценки и интеграции нового опыта и информации. Оно формируется и применяется в умах людей, а в организациях зачастую оказывается закрепленным не только в документах и в хранилищах, но также в организационных процедурах, процессах, способах выполнения работы и нормах.

В таблице на основе обзора литературных источников приводятся различные определения знания.

В большинстве рассмотренных определений подчеркивается, что знания – понятие более широкое, глубокое и богатое по сравнению с информацией. Они представляют собой подвижное соединение разных элементов – опыта, ценностей, информации и экспертного понимания - и постоянно меняются; они интуитивны; характерны для людей и являются неотъемлемой частью человеческой сущности с ее непредсказуемостью.

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.