ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК, 1999, том 69, М 2, с. 106-119

 

 

 

Для того чтобы в какой-либо области пройти путь от новичка до эксперта, человеку необходимы многие годы интенсивной практики. Поэтому чрезвычайно важен поиск средств эффективного обучения. Опыт эксперта, приобретенный при решении тысяч реальных задач, может быть форма­лизован в базе знаний, на основе которой возможно создание обучающей системы, помогающей но­вичкам за короткий срок приобрести навыки, близкие к навыкам эксперта. Эта проблема уже не­сколько лет успешно разрабатывается в отделе теории и методов принятия решений Института си­стемного анализа РАН под руководством академика О.И. Ларичева. О последних достижениях в этой области он рассказывал на одном из заседаний Президиума РАН. Его выступление положено в основу публикуемой ниже статьи.

 

НОВЫЕ ВОЗМОЖНОСТИ КОМПЬЮТЕРНОГО ОБУЧЕНИЯ

О. И. Ларичев, Е. В. Нарыжный, В. П. Кузнецова, Э. И. Брук

Развитие информатики открывает новые, эф­фективные пути решения теоретических и прак­тических задач в различных областях человечес­кой деятельности. Одной из таких задач является передача знаний от профессионала молодому специалисту, осуществляемая с помощью ком­пьютера.

Прежде всего уточним, о каких знаниях идет речь. Принято различать декларативные знания, то есть знания о фактах, явлениях и закономерно­стях, и процедуралъные знания, представляющие собой умение решать задачи. Процедуральные знания возникают на основе декларативных ис­ключительно путем интенсивной практики. Обла­дание ими отличает квалифицированных специа­листов (экспертов) от новичков.

Компьютерные системы обучения деклара­тивным знаниям появились достаточно давно и достигли высокого уровня совершенства благо-

даря современным технологиям гипертекста и мультимедиа. Существенно большие трудности связаны с передачей второго вида знаний, так как для этого необходима среда, в которой можно на­учить решению задач, основываясь на процеду-ральных знаниях эксперта. То есть должна быть построена модель процесса решения задач рас­сматриваемой предметной области. Создание по­добных моделей для таких областей, как типовые задачи алгебры или геометрии, - не проблема, поскольку в данном случае эксперт-математик может явно сформулировать идеальную страте­гию, следуя которой новичок придет к коррект­ному решению [1]. Иначе обстоит дело со многи­ми недостаточно определенными областями зна­ний, например медицинской диагностикой.

Парадокс заключается в том, что опытный врач, ставя верный диагноз во многих сложных случаях, не способен сформулировать правила

НОВЫЕ ВОЗМОЖНОСТИ КОМПЬЮТЕРНОГО ОБУЧЕНИЯ

107

 

своего поведения. Он может продемонстрировать пример готового решения, может его аргументи­ровать, может повторить решение, но не расска­зать, как он это делает. Исследования показыва­ют, что по крайней мере часть знаний эксперта хранится на подсознательном уровне и не может быть вербализована [2]. Стратегия принятия ре­шений, которую врач-эксперт может сформули­ровать в явном виде, представляет лишь наиболее простую и очевидную составляющую его знаний. Поэтому модели принятия диагностических реше­ний, построенные на основе вопросов типа "Как вы это делаете?" имеют мало общего с тем, как на самом деле врач-эксперт принимает решения.

Очевидно, что экспертом становятся не сразу. Согласно исследованиям в области когнитивной психологии, человек достигает высот профессио­нального мастерства не ранее, чем спустя 10 лет интенсивной практики [3]. За это время не только увеличивается объем его знаний, но и меняется их структура, стратегия мышления [4]. Можно ли сократить этот срок, используя эффективные си­стемы обучения? Как без искажений передать знания эксперта сначала этим системам, а затем и обучаемым? Как организованы эти знания? Эти проблемы и были предметом проводимых нами исследований.

Основными этапами нашей работы стали:

•   построение базы знаний, которая позволила бы формальным образом с высокой точностью имитировать решения эксперта;

•   создание на основе этой базы знаний интер­активной среды обучения, помогающей новичку приобрести устойчивые навыки решения задач, близкие к навыкам эксперта.

ПОСТРОЕНИЕ БАЗЫ ЭКСПЕРТНЫХ ЗНАНИЙ

Как отмечают многие исследователи в облас­ти искусственного интеллекта, построение базы знаний - наиболее трудоемкий этап разработки экспертных систем. Сложность и ответствен­ность этой задачи даже обусловили возникнове­ние новой специальности - инженера-когнитоло-га, работающего в контакте с экспертами и про­фессионально занимающегося построением баз знаний. Перечислим основные трудности этого этапа.

Во-первых, в большинстве случаев эксперт не может сообщить общих правил, которыми руко­водствуется, решая ту или иную конкретную за­дачу. Те же правила, которые все-таки удается от него получить, применимы для решения лишь простых задач.

Во-вторых, реальные задачи могут охваты­вать большое количество (десятки тысяч) воз­можных практических ситуаций. Поэтому пост-

роение баз знаний требует значительных затрат труда и времени (до нескольких месяцев).

В-третьих, люди, передающие компьютеру в том или ином виде свои знания и умения, неиз­бежно ошибаются. Чем бы ни была вызвана кон­кретная ошибка - усталостью, невнимательнос­тью, трудностью ситуации, - абсолютно безоши­бочных экспертов, к сожалению, не бывает.

Следовательно, мы должны так построить процесс извлечения знаний, чтобы от эксперта не требовалась формулировка эвристических пра­вил, была возможна проверка полученных зна­ний на непротиворечивость, а сам процесс укла­дывался в разумные временные рамки. Разрабо­танный специалистами Института системного анализа РАН метод экспертной классификации, предназначенный для построения полных и не­противоречивых баз экспертных знаний, вполне удовлетворяет этим требованиям [5]. Изложим его основные идеи.

Каждый рассматриваемый объект (пациента) необходимо отнести к одному или нескольким классам решений (диагнозам). Эксперт совместно с инженером-когнитологом определяет набор при­знаков, описывающих классифицируемые объек­ты, которые следует принимать во внимание при установлении класса решения. В задаче медицин­ской дифференциальной диагностики, когда клас­сами решений являются два похожих по клиничес­кой картине заболевания, в качестве признаков могут быть выбраны те из них, по которым данные заболевания имеют наибольшие отличия. При дифференциальной диагностике тромбоэмболии легочной артерии (ТЭЛА) и острого инфаркта ми­окарда (ОИМ) такими признаками могут служить изменения цвета кожи, дыхания, артериального давления, эхокардиограммы и т.д.

Далее для каждого признака определяется множество возможных значений. В частности, признак "цвет кожи" может принимать одно из следующих значений: "резкий цианоз лица, шеи, верхней половины туловища", "бледность кож­ных покровов, акроцианоз", "цвет кожи нормаль­ный". Данное множество формируется таким об­разом, чтобы, с одной стороны, учесть все семан­тически важные для данной задачи значения, а с другой - минимизировать размер этого множест­ва, обычно до четырех-пяти значений.

Как известно, декартово произведение шкал признаков образует все множество объектов (опи­саний гипотетических пациентов), подлежащих классификации (нуждающихся в диагностике). В реальных задачах это множество достаточно ве­лико, например при дифференциальной диагнос­тике ТЭЛА-ОИМ число элементов превышает 20 тыс. Очевидно, что на практике невозможно классифицировать все эти состояния путем непо­средственного предъявления их эксперту. Поэто-

ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК      том 69      № 2      1999

108                                                                                       ЛАРИЧЕВ и др.

 

 

 

 

му используется условие доминирования по ха­рактерности. Значения на шкале каждого при­знака упорядочиваются по характерности для каждого класса решений.

Для класса решений ТЭЛА наиболее харак­терное значение признака "цвет кожи" - "резкий цианоз лица, шеи, верхней половины туловища", менее характерное - "бледность кожных покро­вов, акроцианоз" и еще менее характерное -"цвет кожи нормальный". Если эксперт поставил диагноз ТЭЛА некоторому гипотетическому па­циенту с нормальным цветом кожи, то автомати­чески тот же диагноз можно поставить и другим гипотетическим пациентам, у которых значения по признаку "цвет кожи" и иным признакам бо­лее характерны для ТЭЛА, чем у данного пациен­та. Таким образом, использование условия доми­нирования по характерности позволяет сущест­венно сократить число предъявляемых объектов и, следовательно, время работы эксперта, необ­ходимое для построения полной классификации.

Эксперту предъявляются лишь наиболее ин­формативные объекты, генерируемые с помо­щью специального алгоритма. Их классификация позволяет автоматически определять класс ре­шения для наибольшего числа оставшихся объек­тов на каждом шаге опроса эксперта. При ис­пользовании условия доминирования многие объ­екты классифицируются неоднократно, что помогает выявлять противоречивые решения и повторно предъявлять их эксперту.

В некоторых задачах удается сократить мно­жество рассматриваемых объектов. Например, число гипотетических пациентов в задаче диффе­ренциальной диагностики ТЭЛА-ОИМ сокраща­ется с 20 тыс. до 2 тыс., поскольку многие сочета­ния значений различных диагностических при­знаков невозможны на практике. В частности, не

может быть нормальный цвет кожи у больного с резко сниженным артериальным давлением.

Таким образом, метод экспертной классифи­кации позволяет строить базы знаний за прием­лемое время и в привычном для эксперта стиле работы, не требующем от него формулировок яв­ных правил классификации. Для построения пол­ной классификации в задаче дифференциальной диагностики ТЭЛА-ОИМ потребовалось всего 600 вопросов из исходного множества, содержа­щего 20 тыс. ситуаций. Созданная база знаний яв­ляется полной в том смысле, что с ее помощью для любого сочетания значений диагностических признаков может быть определен некоторый класс решения.

СТРУКТУРА ЭКСПЕРТНЫХ ЗНАНИЙ

При построении полных баз экспертных зна­ний исследовались модели внутренней организа­ции знаний эксперта [6]. Оказалось, что эти знания могут быть представлены компактным образом.

Назовем граничными такие объекты, которые являются наименее характерными для своего клас­са решений и не сравнимы между собой (рис. 1). Граничные объекты каждого из классов решений охватывают все множество объектов данного класса.

Анализ множества граничных объектов для различных классификаций, созданных разными экспертами, показал, что можно построить се­мейство решающих правил определенного вида, описывающих границы классов. Каждое такое правило может быть представлено в виде дерева, в корне которого находятся наиболее существен­ные для данного класса решений значения при­знаков. К ним добавляется определенное число

ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК     том 69     № 2      1999

 

НОВЫЕ ВОЗМОЖНОСТИ КОМПЬЮТЕРНОГО ОБУЧЕНИЯ                              109

значений менее важных признаков. Представля­ется важным их аддитивный характер, поскольку подсознательный подсчет типичных значений ма­ловажных признаков - это распространенная операция, выполняемая человеческой системой переработки информации [7].

Исследовав поведение эксперта, мы установи­ли, что его база знаний в задачах классификации может быть с высокой точностью смоделирована с помощью небольшого числа достаточно про­стых по структуре решающих правил. Это позво­лило выдвинуть гипотезу о том, что в результате многолетней интенсивной практики у эксперта формируются подсознательные правила распоз­навания, которые используются им при решении диагностических задач. Однако эти правила не могут быть вербализованы.

Итак, построение полной классификации поз­воляет получить целостное представление о том, как организовано экспертное знание. Мы можем как бы заглянуть в память эксперта, понять структуру экспертных знаний. Тут уместно вспомнить индийскую сказку, в которой группа слепых пыталась определить, что такое слон, ощупывая его ноги, хобот, хвост. Точно так же из отдельных компонентов экспертного знания не следует понимание его общей организации.

Наши результаты вполне правдоподобны с точки зрения имеющихся сведений о человечес­кой системе переработки информации. Решаю­щие правила служат "индексами" для "энцикло­педии знаний" эксперта, помогающими быстро осуществлять поиск. Без сомнения, такие "индек­сы" формируются в памяти в процессе многолет­ней интенсивной практики.

ОБУЧЕНИЕ ЭКСПЕРТНЫМ ЗНАНИЯМ

После того как был найден способ компактно­го представления знаний эксперта, мы приступи­ли к исследованию проблемы эффективного обу­чения искусству диагностики. Цель обучения -создание в долговременной памяти новичка под­сознательных решающих правил, позволяющих ему действовать так же, как действует эксперт. Как показали наши исследования, непосредствен­ное предъявление новичку решающих правил эксперта неэффективно. Поэтому было выбрано другое направление исследований: создание для обучаемого условий, в которых могут сформиро­ваться подсознательные правила принятия реше­ний, близкие к правилам эксперта.

Обучение подсознательным решающим пра­вилам - одно из направлений исследований в ког­нитивной психологии. В его рамках на простом экспериментальном материале изучается, как возникают и закрепляются подсознательные на-

ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК      том

выки, способствующие решению следующих за­дач: совмещение метки с одной из числовых таб­лиц, предъявляемых на экране дисплея; обучение искусственной грамматике на сочетаниях фор­мальных символов и т.д. Были получены объек­тивные доказательства (изменение времени реак­ции, число ошибок) того, что люди способны ов­ладевать определенными правилами. Интересно, что после такого обучения испытуемые не могут сообщить полную систему правил даже при обе­щании вознаграждения.

Учитывая результаты психологических иссле­дований, мы предъявляли испытуемым задачи, не раскрывая правил их решения, а лишь сооб­щая, правилен ли ответ. Иначе говоря, мы надея­лись, что обучаемые смогут выработать устойчи­вые подсознательные правила принятия реше­ний. И эта надежда оправдалась.

Прежде чем изложить основные идеи постро­ения обучающей системы, введем понятие слож­ности классификации объектов.

Очевидно, что классификация объектов, обла­дающих наиболее характерными для какого-то класса объектов значениями всех признаков, не представляет трудности как для эксперта, так и для новичка. В многомерном пространстве значе­ний признаков можно определить наиболее ха­рактерные объекты как центры классов. Чем ближе некоторый объект к центру, тем он проще для классификации. Гораздо сложнее классифи­цировать объекты, близкие к границе классов, когда рассматриваемый объект при изменении значения лишь одного из признаков переходит в другой класс решения. Обозначим множество та­ких объектов, принадлежащих классу А, как Du (рис. 2). Множество объектов, обладающих тем же свойством, но не принадлежащих классу А, обозначим D2\. Будем называть множества Du и D2\ слоями максимальной сложности классифи­кации. Действуя аналогичным образом, все мно­жество объектов можно разбить на подмножест­ва (слои), имеющие различную удаленность от слоя максимальной сложности Опи, следователь­но, различной сложности для классификации.

Перед началом обучения мы проверяли знание признаков и их характерных значений. И только в том случае, если они были хорошо известны ис­пытуемым, мы проводили обучение процедураль-ному знанию эксперта. Испытуемому случайным образом предъявлялись для классификации объ­екты определенной сложности, принадлежащие (и не принадлежащие) данному классу решений.

Например:

В анамнезе недавно перенесенная полостная операция.

Жалобы на боль в грудной клетке. 69     № 2     1999

 

110                                                                 ЛАРИЧЕВ и др.

 

 

Рис. 2. Слои объектов различной сложности в задаче классификации объектов, описывающихся четырьмя двоичными признаками

В момент осмотра резкий цианоз лица, шеи, верхней половины туловища.

Резкая одышка, которая появилась внезапно.

АД низкое. Слабость нарастала постепенно.

На ЭКГ синусовая тахикардия, неполная бло­када правой ветви пучка Тиса, глубокий SV5-V6, STIII слегка приподнят, дугообразен, Т III, AVF, VI-V4 отрицательный.

На рентгенограмме грудной клетки расшире­ние главных ветвей легочной артерии, обрублен­ный корень легкого.

На эхокардиограмме значительное повыше­ние давления в легочной артерии, дилатация правых камер сердца, есть зоны акинезии в левом желудочке.

Существенно повышена концентрация ACT, АЛТ, КФК, MB КФК, ЛДГ в плазме.

Далее предлагалось выбрать один из следую­щих вариантов ответа:

1.     Предварительный диагноз ТЭЛА и ОИМ одновременно;

2.   Предварительный диагноз ОИМ, а для ТЭЛА необходимо дообследование;

3.    Предварительный диагноз ОИМ. ТЭЛА нет

(ответ 1 соответствует выбору класса решений А, а 2 и 3 - выбору класса решений "не А").

Обучение начинается с задач наименьшей сложности и заключается в самостоятельном ре­шении большого количества задач методом проб и ошибок. Решающие правила эксперта, исполь­зуемые в качестве эталона классификации, в яв­ном виде обучаемому не сообщаются. Вместо этого при неправильном ответе предоставляются

объяснения, аналогичные объяснениям эксперта своих действий.

Если испытуемый безошибочно решает доста­точно длинную последовательность задач, то сис­тема повышает их сложность, предъявляя объек­ты следующего слоя. Если он допускает слишком много ошибок, система уменьшает сложность за­дач, возвращаясь к предыдущему слою. На осно­ве данных о правильно и неправильно решенных задачах система строит прогноз решения для тех задач, которые еще не предъявлялись. При этом последующие задачи выбираются таким образом, чтобы как можно быстрее ликвидировать пробе­лы в знаниях обучаемого. Процесс обучения за­вершается, когда новичок способен уверенно ре­шать задачи наивысшего уровня сложности, включая граничные объекты.

Разработанная система передачи процеду-ральных знаний прошла практическую проверку. В экспериментах по обучению дифференциальной диагностике тромбоэмболии легочной артерии и острого инфаркта миокарда принимали участие ординаторы Российской государственной меди­цинской академии постдипломного образования и молодые врачи Городской клинической больницы им. СП. Боткина. Перед началом курса и после его окончания испытуемые проходили тест на ре­шение 20 задач наибольшей категории сложности. Курс состоял из двух сеансов по четыре часа. За это время каждый из испытуемых решал в среднем 500 задач. Если на предварительном тесте процент правильных ответов, как правило, совпа­дал с показателями случайного выбора, то после окончания курса обучения испытуемые демонст­рировали на контрольном тесте 90-100% совпа­дений с ответами эксперта. При этом они не мог­ли сформулировать правила, которые использо­вали в ходе принятия решений. Некоторые проходили повторный тест через неделю, демон­стрируя те же показатели, что говорит о закреп­лении навыка.

На наш взгляд, полученные результаты свиде­тельствуют о принципиально новых возможнос­тях подготовки специалистов в тех областях, где от них требуются практические умения. Начинаю­щие врачи смогут за более короткий срок и ценой меньшего числа роковых ошибок овладеть навы­ками диагностики, близкими к умению опытных врачей. Эти навыки молодые специалисты могут дальше развивать и совершенствовать в ходе сво­ей практики.

ЛИТЕРАТУРА

1.        Anderson J.R., Corbett AT., Koedinger K.R., Pelle-tier R. Cognitive Tutors: Lessons Learned // The Journal of the Learning Sciences. 1995. V. 4. № 2. P. 167-207.

2.       Ericsson K.A. The Acquisition of Expert Perfomance: An Introduction to Some of the Issues, The Road to Ex-

ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК     том 69     № 2      1999

ГЕОДИНАМИЧЕСКИЕ ИССЛЕДОВАНИЯ В ЗАПАДНОЙ АНТАРКТИКЕ

111

 

сellence: The Acquisition of Expert Perfomance in the Arts and Sciences, Sports and Games. Hillsdale, N.J.: Lawrence Erlbaum Associates, 1996.

3. Simon HA. Reason in Human Affairs. Stanford: Stan­ford Univ. Press, 1983.

4.        Ericsson К A., Lehnmann Л.С. Expert and Exceptional Perfomance: Evidence of Maximal Adaptation to Task Constraints // Annual Review of Psychology. 1996. V. 47. P. 273-305.

5.        Ларичев О.И., Мечитов А.И., Мошкович Е.М., Фу реме ЕМ. Выявление экспертных знаний. М.: Наука, 1989.

6.        Ларичев О.И. Структура экспертных знаний в за­дачах классификации // Доклады Академии наук. 1994. Т. 336. № 6. С. 750-752.

7.       Eing С, Marinov M. A. Symbolic Model of Noncon-scious Acquisition of Information // Cognitive Science. 1994. V. 18. P. 595-621.

8.        Кузнецова В.П., Брук Э.И. Тромбоэмболия легоч­ной артерии. М.: Российская государственная ме­дицинская академия постдипломного образования, 1997.

 

ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК     том 69     № 2      1999