Теория фреймов
Теория фреймов
- это парадигма для
представления знаний с целью использования этих знаний компьютером . Впервые была представлена Минским как попытка построить фреймовую сеть , или парадигму с целью достижения большего эффекта
понимания . С одной стороны Минский пытался сконструировать базу
данных ,
содержащую энциклопедические знания , но с другой стороны , он хотел создать наиболее описывающую базу , содержащую информацию в структурированной и
упорядоченной форме .
Эта структура позволила бы компьютеру
вводить информацию в более гибкой форме , имея доступ к тому разделу , который требуется в данный момент . Минский разработал такую схему , в
которой информация содержится в специальных ячейках , называемых фреймами , объединенными в сеть , называемую системой фреймов . Новый фрейм активизируется с наступлением новой ситуации
. Отличительной
его чертой является то , что он одновременно содержит большой объем знаний и в то
же время является достаточно гибким для того , чтобы быть использованным как отдельный элемент БД . Термин «фрейм» был наиболее популярен в середине семидесятых годов , когда существовало много его толкований , отличных от интерпретации Минского
.
Чтобы
лучше понять эту теорию , рассмотрим один из примеров Минского , основанный на
связи между ожиданием , ощущением и
чувством человека ,
когда он открывает дверь и входит в комнату . Предположим , что вы собираетесь открыть дверь и зайти в комнату
незнакомого вам дома . Находясь в доме , перед тем как открыть дверь , у вас имеются
определенные представления о том , что вы увидите , войдя в комнату . Например , если вы увидите к-л пейзаж или морской берег , поначалу вы с трудом узнаете их . Затем вы будете удивлены , и в конце концов дезориентированы ,
так как вы не сможете объяснить
поступившую информацию и связать ее с теми представлениями , которые у вас имелись до того .
Также у вас возникнут затруднения с тем , чтобы предсказать дальнейший ход событий. С аналитической точки зрения это можно объяснить как
активизацию фрейма комнаты в момент открывания двери и его ведущую роль в
интерпретации поступающей информации . Если бы вы увидели за дверью кровать , то фрейм комнаты приобрел бы более узкую форму и
превратился бы во фрей кровати . Другими словами , вы бы имели доступ к наиболее специфичному фрейму из
всех доступных .Возможно
,б
что вы используете информацию , содержащуюся в вашем фрейме комнаты для того чтобы распознать мебель , что называется процессом сверху-вниз
, или в контексте теории фреймов
фреймодвижущим распознаванием . Если бы вы увидели пожарный гидрант , то ваши ощущения были бы аналогичны первому случаю. Психологи подметили , что распознавание объектов легче проходит в обычном
контексте,
чем в нестандартной обстановке . Из этого примера мы видим , что фрейм - это модель знаний , которая активизируется в определенной ситуации и служит
для ее объяснения и предсказания . У Минского
имелись достаточно расплывчатые идеи о самой структуре такой БД , которая могла бы выполнять подобные вещи . Он предложил систему , состоящую из связанных между собой фреймов , многие из которых состоят из одинаковых подкомпонентов ,
объединенных в сеть . Таким образом , в случае ,
когда к-л входит в дом , его ожидания контролируются операциями , входящими в сеть системы фреймов . В рассмотренном выше случае мы имеем дело с фреймовой
системой для дома ,
и с подсистемами для двери и комнаты . Активизированные фреймы с дополнительной информацией в
БД о том ,
что вы открываете дверь , будут служить переходом от активизированного фрейма
двери к фрейму комнаты . При этом фреймы двери и комнаты будут иметь одинаковую
подструктуру .
Минский назвал это явление разделом терминалов и считал его важной частью теории фреймов .
Минский
также ввел терминологию , которая могла бы использоваться при изучении этой теории
( фреймы
,
слоты ,
терминалы и т.
д.)
.
Хотя примеры этой теории были разделены на языковые и перцептуальные , и Минский рассматривал их как имеющих общую природу , в языке имеется более широкая сфера ее применения .
В основном большинство исследований
было сделано в контексте общеупотребительной лексики и литературного языка .
Как
наиболее доступную иллюстрацию распознаванию , интерпретации и предположению можно рассмотреть две
последовательности предложений , взятых из Шранка и Абельсона . На глобальном уровне последовательность А явно
отличается от В .
A John went to a restaurant
He asked the waitress for a hamburger
He paid the tip & left
B John went to a park
He asked the midget for a mouse
He picked up the box & left
Хотя
все эти предложения имеют одинаковую синтаксическую структуру и тип семантической информации , понимание их кардинально различается . Последовательность А имеет доступ к некоторому виду
структуры знаний высшего уровня , а В не имеет . Если бы А не имело такой доступ , то ее понимание сводилось бы к уровню В и
характеризовалось бы как
дезориентированное . Этот контраст является наглядным примером мгновенной
работы высшего уровня структуры знаний .
Была
предложена программа под названием SAM , которая отвечает на вопросы и выдает содержание таких
рассказов .
Например , SAM может ответить на следующие вопросы ,
ответы на которые не даны в тексте , с помощью доступа к записи предполагаемых событий , предшествующих обеду в ресторане .
Did
John sit down in the restaurant ?
Did
John eat the hamburger ?
Таким
образом , SAM может распознать описанную ситуацию как обед в ресторане
и затем предсказать оптимальное развитие событий . В нашем случае распознавание не представляло трудностей , но в большинстве
случаев оно довольно непростое и является самой важной частью теории .
Рассмотрим
другой пример :
C He plunked down $5 at the window .
She tried to give him $ 2.50 , but he
wouldn't take it .
So when they got inside , she bought
him a large bag of
popcorn .
Он
интересен тем , что у большинства людей он вызывает цикл повторяющихся
неправильных или
незаконченных распознаваний и
реинтерпретаций .
В
случаях с многозначными словами
многозначность разрешается с помощью активизированного ранее фрейма . Для этих целей необходимо создать лексикон к каждому
фрейму . Когда
фрейм активизируется , соответствующему
лексикону отдается предпочтение при поиске соответствующего значения слова
.
В контексте ТФ это распознавание процессов , контролируемых фреймами , которые , в свою очередь , контролируют распознавание входящей информации . Иногда это называется процессом сверху - вниз
фреймодвижущего распознавания .
Применение
этих процессов нашло свое отражение в программе FRAMP
, которая может суммировать газетные
сводки и классифицировать их в соответствие с классом событий , например терроризм или землетрясения . Эта программа хранит набор объектов , которые должны быть описаны в каждой разновидности
текстов ,
и этот набор помогает процессу распознавания
описываемых событий .
Манипуляция фреймами
Детали
спецификации Ф и их репрезентации могут быть опущены ,
так
же как и алгоритмы их манипуляции , потому что они не играют большой роли в ТФ .
Такие
вопросы , как размер Ф или доступ к нему ,
связаны с организацией памяти и не требуют специального рассмотрения .
Распознавание
В
литературе имеется много рассуждений по поводу процессов , касающихся
распознавания фреймов и доступа к структуре знаний высшего уровня . Несмотря на то , что люди могут распознать фрейм без особых усилий , для компьютера в большинстве случаев это довольно
сложная задача .
Поэтому вопросы распознавания фреймов остаются открытыми и трудными для решения
с помощью ИИ .
Размер
фрейма
Размер
фрейма гораздо более тесно связан с
организацией памяти ,
чем это кажется на первый взгляд . Это происходит потому , что в понимании человека размер фрейма определяется не столько семантическим контекстом , но и многими другими факторами . Рассмотрим фрейм визита к доктору , который складывается из подфреймов , одним из которых является комната ожидания . Таким образом мы
можем сказать ,
что размер фрейма не зависит от семантического содержания представленного
фрейма / такого , как , например , визит к врачу / , но зависит от
того , какие компоненты описывающей информации во фрейме /
таком , как комната ожидания / используются в памяти . Это означает , что когда определенный набор знаний используется памятью
более чем в одной ситуации , система памяти определяет это , затем модифицирует эту информацию во фрейм , и реструктурирует
исходный фрейм так , чтобы новый фрей использовался как его подкомпонент .
Вышеперечисленные
операции также остаются открытыми вопросами в ТФ .
Инициализационные
категории
Рош
предложил три уровня категорий представления знаний : базовую
, субординатную
и суперординационную . Например в сфере меблировки концепция кресла является
примером категории основного уровня , а концепция мебели - это пример суперординационной категории . Язык представления знаний подвержен влиянию этой
таксономии и включает их как различные типы данных . В сфере человеческого общения категории основного уровня
являются первейшими категориями , которые узнают человек , другие же категории вытекают из них . То есть суперординационная категория - это обобщение
базовой , а субординатная
- это подраздел базовой категории .
пример
суперординатная идеи события
базовая события действия
субординатная действия прогулка
Каждый фрейм имеет свой определенный так
называемый слот .
Так ,
для фрейма действие слот может быть
заполнен только к-л исполнителем этого действия , а соседние фреймы могут наследовать этот слот .
Некоторые
исследователи предположили , что случаи грамматики падежей совпадают со слотами в ТФ , и эта теория была названа теорией идентичности слота и
падежа .
Было предложено число таких падежей , от 8 до 20 , но точное число не определено . Но если агентив полностью совпадает со своим слотом , то остальные падежи вызвали споры . И до сих пор точно не установлено , сколько всего существует падежей .
Также
вызвал трудность тот факт , что слоты не всегда могут быть переходными . Например , в соответствие с ТФ можно сказать , что фрейм одушевленный
предмет может иметь слот живой , фрейм человек может иметь слот честный
,
а фрейм блоха не может иметь такой слот , и он к нему никогда не перейдет .
Другими
словами ,
связи между слотами в ТФ не являются исследованными до конца . Слоты могут передаваться , могут быть многофункциональны , но в то же время не рассматриваются как функции . Гибридные системы
СФ
иногда адаптируются для построения описаний или определений . Был создан смешанный язык , названный KRYPTON , состоящий из фреймовых компонентов и компонентов предикатных исчислений , помогающих
делать к-л выводы с помощью терминов и предикатов . Когда активизируется фрейм , факты становятся доступными пользователю . Также существует язык Loops
, который объединяет объекты , логическое программирование и процедуры .
Существуют
также фреймоподобные языки , которые за исходную позицию принимают один тип данных в
памяти ,
к-л концепцию , а
не две / напр
фрейм и слот / , и представление этой концепции в памяти должно быть
цельным .
Объектно
- ориентированные языки
Параллельно
с языками фреймов существуют объектно - ориентированные программные языки , которые используются для составления программ , но имеют некоторые св-ва языков фреймов , такие , как использование слотов для детальной , доскональной классификации объектов . Отличие их от языков фреймов в том , что фреймовые языки направлены на более обобщенное
представление информации об объекте .
Одной из трудностей
представления знаний и языка фреймов является отсутствие формальной семантики . Это затрудняет сравнение свойств представления знаний
различных языков фреймов , а также полное логическое объяснение языка фреймов .
|