ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК, 1999, том 69, М 2, с. 106-119
Для того чтобы в какой-либо области пройти путь от новичка до эксперта, человеку необходимы многие годы интенсивной практики. Поэтому чрезвычайно важен поиск средств эффективного обучения. Опыт эксперта, приобретенный при решении тысяч реальных задач, может быть формализован в базе знаний, на основе которой возможно создание обучающей системы, помогающей новичкам за короткий срок приобрести навыки, близкие к навыкам эксперта. Эта проблема уже несколько лет успешно разрабатывается в отделе теории и методов принятия решений Института системного анализа РАН под руководством академика О.И. Ларичева. О последних достижениях в этой области он рассказывал на одном из заседаний Президиума РАН. Его выступление положено в основу публикуемой ниже статьи.
НОВЫЕ ВОЗМОЖНОСТИ КОМПЬЮТЕРНОГО ОБУЧЕНИЯ
О. И. Ларичев, Е. В. Нарыжный, В. П. Кузнецова, Э. И. Брук
Развитие информатики открывает новые, эффективные пути решения теоретических и практических задач в различных областях человеческой деятельности. Одной из таких задач является передача знаний от профессионала молодому специалисту, осуществляемая с помощью компьютера.
Прежде всего уточним, о каких знаниях идет речь. Принято различать декларативные знания, то есть знания о фактах, явлениях и закономерностях, и процедуралъные знания, представляющие собой умение решать задачи. Процедуральные знания возникают на основе декларативных исключительно путем интенсивной практики. Обладание ими отличает квалифицированных специалистов (экспертов) от новичков.
Компьютерные системы обучения декларативным знаниям появились достаточно давно и достигли высокого уровня совершенства благо-
даря современным технологиям гипертекста и мультимедиа. Существенно большие трудности связаны с передачей второго вида знаний, так как для этого необходима среда, в которой можно научить решению задач, основываясь на процеду-ральных знаниях эксперта. То есть должна быть построена модель процесса решения задач рассматриваемой предметной области. Создание подобных моделей для таких областей, как типовые задачи алгебры или геометрии, - не проблема, поскольку в данном случае эксперт-математик может явно сформулировать идеальную стратегию, следуя которой новичок придет к корректному решению [1]. Иначе обстоит дело со многими недостаточно определенными областями знаний, например медицинской диагностикой.
Парадокс заключается в том, что опытный врач, ставя верный диагноз во многих сложных случаях, не способен сформулировать правила
НОВЫЕ ВОЗМОЖНОСТИ КОМПЬЮТЕРНОГО ОБУЧЕНИЯ
107
своего поведения. Он может продемонстрировать пример готового решения, может его аргументировать, может повторить решение, но не рассказать, как он это делает. Исследования показывают, что по крайней мере часть знаний эксперта хранится на подсознательном уровне и не может быть вербализована [2]. Стратегия принятия решений, которую врач-эксперт может сформулировать в явном виде, представляет лишь наиболее простую и очевидную составляющую его знаний. Поэтому модели принятия диагностических решений, построенные на основе вопросов типа "Как вы это делаете?" имеют мало общего с тем, как на самом деле врач-эксперт принимает решения.
Очевидно, что экспертом становятся не сразу. Согласно исследованиям в области когнитивной психологии, человек достигает высот профессионального мастерства не ранее, чем спустя 10 лет интенсивной практики [3]. За это время не только увеличивается объем его знаний, но и меняется их структура, стратегия мышления [4]. Можно ли сократить этот срок, используя эффективные системы обучения? Как без искажений передать знания эксперта сначала этим системам, а затем и обучаемым? Как организованы эти знания? Эти проблемы и были предметом проводимых нами исследований.
Основными этапами нашей работы стали:
• построение базы знаний, которая позволила бы формальным образом с высокой точностью имитировать решения эксперта;
• создание на основе этой базы знаний интерактивной среды обучения, помогающей новичку приобрести устойчивые навыки решения задач, близкие к навыкам эксперта.
Как отмечают многие исследователи в области искусственного интеллекта, построение базы знаний - наиболее трудоемкий этап разработки экспертных систем. Сложность и ответственность этой задачи даже обусловили возникновение новой специальности - инженера-когнитоло-га, работающего в контакте с экспертами и профессионально занимающегося построением баз знаний. Перечислим основные трудности этого этапа.
Во-первых, в большинстве случаев эксперт не может сообщить общих правил, которыми руководствуется, решая ту или иную конкретную задачу. Те же правила, которые все-таки удается от него получить, применимы для решения лишь простых задач.
Во-вторых, реальные задачи могут охватывать большое количество (десятки тысяч) возможных практических ситуаций. Поэтому пост-
роение баз знаний требует значительных затрат труда и времени (до нескольких месяцев).
В-третьих, люди, передающие компьютеру в том или ином виде свои знания и умения, неизбежно ошибаются. Чем бы ни была вызвана конкретная ошибка - усталостью, невнимательностью, трудностью ситуации, - абсолютно безошибочных экспертов, к сожалению, не бывает.
Следовательно, мы должны так построить процесс извлечения знаний, чтобы от эксперта не требовалась формулировка эвристических правил, была возможна проверка полученных знаний на непротиворечивость, а сам процесс укладывался в разумные временные рамки. Разработанный специалистами Института системного анализа РАН метод экспертной классификации, предназначенный для построения полных и непротиворечивых баз экспертных знаний, вполне удовлетворяет этим требованиям [5]. Изложим его основные идеи.
Каждый рассматриваемый объект (пациента) необходимо отнести к одному или нескольким классам решений (диагнозам). Эксперт совместно с инженером-когнитологом определяет набор признаков, описывающих классифицируемые объекты, которые следует принимать во внимание при установлении класса решения. В задаче медицинской дифференциальной диагностики, когда классами решений являются два похожих по клинической картине заболевания, в качестве признаков могут быть выбраны те из них, по которым данные заболевания имеют наибольшие отличия. При дифференциальной диагностике тромбоэмболии легочной артерии (ТЭЛА) и острого инфаркта миокарда (ОИМ) такими признаками могут служить изменения цвета кожи, дыхания, артериального давления, эхокардиограммы и т.д.
Далее для каждого признака определяется множество возможных значений. В частности, признак "цвет кожи" может принимать одно из следующих значений: "резкий цианоз лица, шеи, верхней половины туловища", "бледность кожных покровов, акроцианоз", "цвет кожи нормальный". Данное множество формируется таким образом, чтобы, с одной стороны, учесть все семантически важные для данной задачи значения, а с другой - минимизировать размер этого множества, обычно до четырех-пяти значений.
Как известно, декартово произведение шкал признаков образует все множество объектов (описаний гипотетических пациентов), подлежащих классификации (нуждающихся в диагностике). В реальных задачах это множество достаточно велико, например при дифференциальной диагностике ТЭЛА-ОИМ число элементов превышает 20 тыс. Очевидно, что на практике невозможно классифицировать все эти состояния путем непосредственного предъявления их эксперту. Поэто-
ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК том 69 № 2 1999
108 ЛАРИЧЕВ и др.
му используется условие доминирования по характерности. Значения на шкале каждого признака упорядочиваются по характерности для каждого класса решений.
Для класса решений ТЭЛА наиболее характерное значение признака "цвет кожи" - "резкий цианоз лица, шеи, верхней половины туловища", менее характерное - "бледность кожных покровов, акроцианоз" и еще менее характерное -"цвет кожи нормальный". Если эксперт поставил диагноз ТЭЛА некоторому гипотетическому пациенту с нормальным цветом кожи, то автоматически тот же диагноз можно поставить и другим гипотетическим пациентам, у которых значения по признаку "цвет кожи" и иным признакам более характерны для ТЭЛА, чем у данного пациента. Таким образом, использование условия доминирования по характерности позволяет существенно сократить число предъявляемых объектов и, следовательно, время работы эксперта, необходимое для построения полной классификации.
Эксперту предъявляются лишь наиболее информативные объекты, генерируемые с помощью специального алгоритма. Их классификация позволяет автоматически определять класс решения для наибольшего числа оставшихся объектов на каждом шаге опроса эксперта. При использовании условия доминирования многие объекты классифицируются неоднократно, что помогает выявлять противоречивые решения и повторно предъявлять их эксперту.
В некоторых задачах удается сократить множество рассматриваемых объектов. Например, число гипотетических пациентов в задаче дифференциальной диагностики ТЭЛА-ОИМ сокращается с 20 тыс. до 2 тыс., поскольку многие сочетания значений различных диагностических признаков невозможны на практике. В частности, не
может быть нормальный цвет кожи у больного с резко сниженным артериальным давлением.
Таким образом, метод экспертной классификации позволяет строить базы знаний за приемлемое время и в привычном для эксперта стиле работы, не требующем от него формулировок явных правил классификации. Для построения полной классификации в задаче дифференциальной диагностики ТЭЛА-ОИМ потребовалось всего 600 вопросов из исходного множества, содержащего 20 тыс. ситуаций. Созданная база знаний является полной в том смысле, что с ее помощью для любого сочетания значений диагностических признаков может быть определен некоторый класс решения.
При построении полных баз экспертных знаний исследовались модели внутренней организации знаний эксперта [6]. Оказалось, что эти знания могут быть представлены компактным образом.
Назовем граничными такие объекты, которые являются наименее характерными для своего класса решений и не сравнимы между собой (рис. 1). Граничные объекты каждого из классов решений охватывают все множество объектов данного класса.
Анализ множества граничных объектов для различных классификаций, созданных разными экспертами, показал, что можно построить семейство решающих правил определенного вида, описывающих границы классов. Каждое такое правило может быть представлено в виде дерева, в корне которого находятся наиболее существенные для данного класса решений значения признаков. К ним добавляется определенное число
ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК том 69 № 2 1999
НОВЫЕ ВОЗМОЖНОСТИ КОМПЬЮТЕРНОГО ОБУЧЕНИЯ 109
значений менее важных признаков. Представляется важным их аддитивный характер, поскольку подсознательный подсчет типичных значений маловажных признаков - это распространенная операция, выполняемая человеческой системой переработки информации [7].
Исследовав поведение эксперта, мы установили, что его база знаний в задачах классификации может быть с высокой точностью смоделирована с помощью небольшого числа достаточно простых по структуре решающих правил. Это позволило выдвинуть гипотезу о том, что в результате многолетней интенсивной практики у эксперта формируются подсознательные правила распознавания, которые используются им при решении диагностических задач. Однако эти правила не могут быть вербализованы.
Итак, построение полной классификации позволяет получить целостное представление о том, как организовано экспертное знание. Мы можем как бы заглянуть в память эксперта, понять структуру экспертных знаний. Тут уместно вспомнить индийскую сказку, в которой группа слепых пыталась определить, что такое слон, ощупывая его ноги, хобот, хвост. Точно так же из отдельных компонентов экспертного знания не следует понимание его общей организации.
Наши результаты вполне правдоподобны с точки зрения имеющихся сведений о человеческой системе переработки информации. Решающие правила служат "индексами" для "энциклопедии знаний" эксперта, помогающими быстро осуществлять поиск. Без сомнения, такие "индексы" формируются в памяти в процессе многолетней интенсивной практики.
После того как был найден способ компактного представления знаний эксперта, мы приступили к исследованию проблемы эффективного обучения искусству диагностики. Цель обучения -создание в долговременной памяти новичка подсознательных решающих правил, позволяющих ему действовать так же, как действует эксперт. Как показали наши исследования, непосредственное предъявление новичку решающих правил эксперта неэффективно. Поэтому было выбрано другое направление исследований: создание для обучаемого условий, в которых могут сформироваться подсознательные правила принятия решений, близкие к правилам эксперта.
Обучение подсознательным решающим правилам - одно из направлений исследований в когнитивной психологии. В его рамках на простом экспериментальном материале изучается, как возникают и закрепляются подсознательные на-
ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК том
выки, способствующие решению следующих задач: совмещение метки с одной из числовых таблиц, предъявляемых на экране дисплея; обучение искусственной грамматике на сочетаниях формальных символов и т.д. Были получены объективные доказательства (изменение времени реакции, число ошибок) того, что люди способны овладевать определенными правилами. Интересно, что после такого обучения испытуемые не могут сообщить полную систему правил даже при обещании вознаграждения.
Учитывая результаты психологических исследований, мы предъявляли испытуемым задачи, не раскрывая правил их решения, а лишь сообщая, правилен ли ответ. Иначе говоря, мы надеялись, что обучаемые смогут выработать устойчивые подсознательные правила принятия решений. И эта надежда оправдалась.
Прежде чем изложить основные идеи построения обучающей системы, введем понятие сложности классификации объектов.
Очевидно, что классификация объектов, обладающих наиболее характерными для какого-то класса объектов значениями всех признаков, не представляет трудности как для эксперта, так и для новичка. В многомерном пространстве значений признаков можно определить наиболее характерные объекты как центры классов. Чем ближе некоторый объект к центру, тем он проще для классификации. Гораздо сложнее классифицировать объекты, близкие к границе классов, когда рассматриваемый объект при изменении значения лишь одного из признаков переходит в другой класс решения. Обозначим множество таких объектов, принадлежащих классу А, как Du (рис. 2). Множество объектов, обладающих тем же свойством, но не принадлежащих классу А, обозначим D2\. Будем называть множества Du и D2\ слоями максимальной сложности классификации. Действуя аналогичным образом, все множество объектов можно разбить на подмножества (слои), имеющие различную удаленность от слоя максимальной сложности Опи, следовательно, различной сложности для классификации.
Перед началом обучения мы проверяли знание признаков и их характерных значений. И только в том случае, если они были хорошо известны испытуемым, мы проводили обучение процедураль-ному знанию эксперта. Испытуемому случайным образом предъявлялись для классификации объекты определенной сложности, принадлежащие (и не принадлежащие) данному классу решений.
Например:
В анамнезе недавно перенесенная полостная операция.
Жалобы на боль в грудной клетке. 69 № 2 1999
110 ЛАРИЧЕВ и др.
Рис. 2. Слои объектов различной сложности в задаче классификации объектов, описывающихся четырьмя двоичными признаками
В момент осмотра резкий цианоз лица, шеи, верхней половины туловища.
Резкая одышка, которая появилась внезапно.
АД низкое. Слабость нарастала постепенно.
На ЭКГ синусовая тахикардия, неполная блокада правой ветви пучка Тиса, глубокий SV5-V6, STIII слегка приподнят, дугообразен, Т III, AVF, VI-V4 отрицательный.
На рентгенограмме грудной клетки расширение главных ветвей легочной артерии, обрубленный корень легкого.
На эхокардиограмме значительное повышение давления в легочной артерии, дилатация правых камер сердца, есть зоны акинезии в левом желудочке.
Существенно повышена концентрация ACT, АЛТ, КФК, MB КФК, ЛДГ в плазме.
Далее предлагалось выбрать один из следующих вариантов ответа:
1. Предварительный диагноз ТЭЛА и ОИМ одновременно;
2. Предварительный диагноз ОИМ, а для ТЭЛА необходимо дообследование;
3. Предварительный диагноз ОИМ. ТЭЛА нет
(ответ 1 соответствует выбору класса решений А, а 2 и 3 - выбору класса решений "не А").
Обучение начинается с задач наименьшей сложности и заключается в самостоятельном решении большого количества задач методом проб и ошибок. Решающие правила эксперта, используемые в качестве эталона классификации, в явном виде обучаемому не сообщаются. Вместо этого при неправильном ответе предоставляются
объяснения, аналогичные объяснениям эксперта своих действий.
Если испытуемый безошибочно решает достаточно длинную последовательность задач, то система повышает их сложность, предъявляя объекты следующего слоя. Если он допускает слишком много ошибок, система уменьшает сложность задач, возвращаясь к предыдущему слою. На основе данных о правильно и неправильно решенных задачах система строит прогноз решения для тех задач, которые еще не предъявлялись. При этом последующие задачи выбираются таким образом, чтобы как можно быстрее ликвидировать пробелы в знаниях обучаемого. Процесс обучения завершается, когда новичок способен уверенно решать задачи наивысшего уровня сложности, включая граничные объекты.
Разработанная система передачи процеду-ральных знаний прошла практическую проверку. В экспериментах по обучению дифференциальной диагностике тромбоэмболии легочной артерии и острого инфаркта миокарда принимали участие ординаторы Российской государственной медицинской академии постдипломного образования и молодые врачи Городской клинической больницы им. СП. Боткина. Перед началом курса и после его окончания испытуемые проходили тест на решение 20 задач наибольшей категории сложности. Курс состоял из двух сеансов по четыре часа. За это время каждый из испытуемых решал в среднем 500 задач. Если на предварительном тесте процент правильных ответов, как правило, совпадал с показателями случайного выбора, то после окончания курса обучения испытуемые демонстрировали на контрольном тесте 90-100% совпадений с ответами эксперта. При этом они не могли сформулировать правила, которые использовали в ходе принятия решений. Некоторые проходили повторный тест через неделю, демонстрируя те же показатели, что говорит о закреплении навыка.
На наш взгляд, полученные результаты свидетельствуют о принципиально новых возможностях подготовки специалистов в тех областях, где от них требуются практические умения. Начинающие врачи смогут за более короткий срок и ценой меньшего числа роковых ошибок овладеть навыками диагностики, близкими к умению опытных врачей. Эти навыки молодые специалисты могут дальше развивать и совершенствовать в ходе своей практики.
1. Anderson J.R., Corbett AT., Koedinger K.R., Pelle-tier R. Cognitive Tutors: Lessons Learned // The Journal of the Learning Sciences. 1995. V. 4. № 2. P. 167-207.
2. Ericsson K.A. The Acquisition of Expert Perfomance: An Introduction to Some of the Issues, The Road to Ex-
ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК том 69 № 2 1999
ГЕОДИНАМИЧЕСКИЕ ИССЛЕДОВАНИЯ В ЗАПАДНОЙ АНТАРКТИКЕ
111
сellence: The Acquisition of Expert Perfomance in the Arts and Sciences, Sports and Games. Hillsdale, N.J.: Lawrence Erlbaum Associates, 1996.
3. Simon HA. Reason in Human Affairs. Stanford: Stanford Univ. Press, 1983.
4. Ericsson К A., Lehnmann Л.С. Expert and Exceptional Perfomance: Evidence of Maximal Adaptation to Task Constraints // Annual Review of Psychology. 1996. V. 47. P. 273-305.
5. Ларичев О.И., Мечитов А.И., Мошкович Е.М., Фу реме ЕМ. Выявление экспертных знаний. М.: Наука, 1989.
6. Ларичев О.И. Структура экспертных знаний в задачах классификации // Доклады Академии наук. 1994. Т. 336. № 6. С. 750-752.
7. Eing С, Marinov M. A. Symbolic Model of Noncon-scious Acquisition of Information // Cognitive Science. 1994. V. 18. P. 595-621.
8. Кузнецова В.П., Брук Э.И. Тромбоэмболия легочной артерии. М.: Российская государственная медицинская академия постдипломного образования, 1997.
ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК том 69 № 2 1999