Зарегистрироваться

Теория интеллектуальных систем

Категории Математическая кибернетика | Под редакцией сообщества: Математика

Теория интеллектуальных систем (т.и.с.) – фундаментальный раздел научного знания, занимающийся созданием математической теории и моделированием систем, обладающих интеллектуальным поведением.

Происхождение слова «интеллектуальный» в русском языке связано с латинским словом «intellego» (воспринимать, понимать, мыслить), достаточно точно передающим смысл термина, упомянутого в заголовке настоящей статьи. На содержательном уровне т.и.с. занимается исследованием объектов, имеющих естественное и искусственное происхождение, которые обладают свойствами разумного поведения.

Главной целью исследований в области теории интеллектуальных систем выступают задачи исследования феномена человека и моделирования его интеллектуальных функций. Отсюда вытекает ряд сложнейших научно-исследовательских и задач стоящих перед т.и.с.:

  1. Исследование механизмов и процессов восприятия, хранения и переработки входной информации имеющей различную природу и происхождение (зрение, слух, тактильная, сенсорная и пр. информация,). Эти задачи требуют исследования развития различных способов кодирования входной информации, создания формализованных языков описания соответствующих образов и работы с ними (например, зрительных, звуковых образов), разработки быстрых и сверхбыстрых алгоритмов обработки больших информационных потоков, имеющих динамическую природу и т.д.
  2. Исследование внутренних механизмов обработки информации, языков ее представления, создание моделей и быстрых алгоритмов ее поиска и хранения, различных блоков обработки информации основанных на логических, вероятностных, нечетких методах, в том числе блоков и приемов обработки неполной, неточной и противоречивой информации о предметной области, разработка различных видов моделей памяти и доступа к ней, развития теории принятия решений и поведения в сложных средах.
  3. Исследование внешних реакций и поведения взаимодействующих интеллектуальных систем, моделирование свойств научения, обучаемости, исследование механизмов целесообразного поведения в различных средах и процедур выбора оптимальных решений, в том числе в условиях неполной, неточной информации и/или ограничениях по времени принятия решения.
  4. Исследование вопросов, связанных с логическими процедурами обработки информации человеком, создание решателей задач в различных предметных областях на основе новых принципов представления и обработки информации.
  5. Прямое моделирование логики действий человека на основе экспертных знаний, разработка эвристических методов и приемов обработки информации в различных предметных областях. Создание экспертных систем.

Обозначенные направления очерчивают лишь контуры исследований, которые при их подробном рассмотрении распадаются на более мелкие направления, имеющие постоянную тенденцию к обособлению, что собственно является нормальным явлением в научных исследованиях, однако т.и.с. с необходимостью реализует синтетический подход к изучаемым явлениям из-за их сложности и комплексности проявляемых реальными объектами свойств, вследствие чего т.и.с. выступает, образно говоря, в роли «несущего каркаса» исследований по обозначенным выше направлениям, не давая уйти исследователям в сторону решения менее важных для т.и.с. задач. В тоже время т.и.с. выступает в роли дисциплины, которая обобщая полученные научные результаты, выводит исследования на новый математический и методологический уровни.

Помимо исследования феномена человека т.и.с. изучает свойства иных интеллектуальных систем биологического и технического происхождения (человеко-машинные системы, глобальные компьютерные сети, общественно-политические процессы и т.д.) – эти комплексные исследовательские задачи диктуют необходимость проведения междисциплинарных исследований и установления естественных межпредметных связей по соответствующим направлениям работ, что показывает суть т.и.с. как синтетической междисциплинарной науки, базирующейся на методах точного естествознания (и главным образом на математическом аппарате как инструменте моделирования и познания явления «интеллектуальные системы»). Кроме того, необходимо отметить, что при моделировании живых и технических систем приходится учитывать не сводимость их только к механической сумме своих компонент (а значит, в этой ситуации может не срабатывать принцип суперпозиции взаимодействий). Отсюда возникает необходимость учета функциональных и иных связей между ее компонентами, что требует развития как новых математических моделей и методов, так и прямого аналого-цифрового моделирования свойств системы с целью выработки исходных гипотез для построения адекватной изучаемой системе модели. Сказанное означает, что теория интеллектуальных систем вырабатывает собственные приемы и методы, позволяющие сочетать математическое моделирование сложных систем и процессов с их компьютерными моделями.

В рамках т.и.с., также как и ранее в кибернетике, был принят за основу такой математический и методологический прием исследований объектов, обладающих интеллектуальным поведением, каким является универсальный теоретико-множественный подход, основанный на изучении свойств тернарного отношения , в котором алфавит X описывает множество входных сигналов системы, алфавит Q задает множество ее возможных внутренних состояний (параметров), а Y является множеством выходных сигналов (реакций) системы на входное воздействие. Как правило, функционирование таких систем исследуется во времени, которое представляется в виде набора дискретных значений параметра t = 1,2,3, …, что позволяет говорить о траектории исследуемой модели как динамической системы {x(t),q(t), y(t)} в фазовом пространстве соответствующих координат X,Q,Y, саму последовательность троек {x(t),q(t), y(t)},t = 1,2,3, … называют поведением системы.

Иными словами структурно такую систему можно изобразить в следующем виде:

рис.1.

В зависимости от того, известно нам что-либо об устройстве системы или нет (схематически она изображена на рис.1 прямоугольником) мы говорим о «черном ящике» (если можем наблюдать только вход-выходные параметры ), «белом ящике» (если нам известна внутренняя или структурная схема системы) и, соответственно «сером ящике» (если нам доступна частично информация о внутреннем строении системы).

Тем самым отсюда возникают два главных подхода к исследованию интеллектуальных систем:

  1. Макроподход – когда нас интересует реализация вход-выходного соответствия как некоторого словарного оператора T:X→Y и соответственно ставится задача исследования операторов, реализуемых соответствующими системами, изучением областей их определения и значения и т.д.
  2. Микроподход – когда мы определяем набор входных, внутренних и выходных структурных (элементарных) элементов и изучаем строение, поведение, сложность и т.д. объектов полученных их композицией из элементарных объектов с помощью операций из заранее заданного класса. Для входных и выходных сигналов в качестве таких элементарных структурных единиц часто выступают декартовы произведения двоичного алфавита {0,1} соответствующей арности, а в качестве структурных (базовых) элементов описывающих внутреннее функционирование системы могут выступать элементы, реализующие булевы функции, элементы, моделирующие свойство запоминания (задержки элементарных сигналов на определенное число тактов времени), и т.д. – класс таких элементарных объектов является весьма широким и определяется физическими и иными свойствами моделируемой интеллектуальной системы.

Упомянутое выше определение поведения динамической системы является слишком широким для построения содержательных математических моделей реальных интеллектуальных систем . Поэтому в 50-60-х годах ХХ века делались попытки выработки в рамках общекибернетического подхода иных моделей для содержательного математического исследования реальных систем.

Одним из таких понятий стала модель конечного автомата, легшая в основу соответствующего научного направления и доказавшая в дальнейшем свою фундаментальную роль. В 1989 г. на механико-математическом факультете МГУ имени М.В.Ломоносова была создана первая в России кафедра математической теории интеллектуальных систем (зав. кафедрой академик В.Б.Кудрявцев). Теория конечных автоматов, стала главной математической и методологической базой в исследованиях сотрудников кафедры по теории интеллектуальных систем и позволила сделать ряд научных прорывов в решении задач моделирования интеллектуальной деятельности человека (моделирование математической интуиции и создание технологии разработки решателей задач нового поколения, создание моделей распределенной памяти и выяснение границ алгоритмически разрешимых задач о полноте автоматных систем, быстрые и сверхбыстрые алгоритмы поиска в базах данных информационно-графового типа, находки новых инвариантов при аффинных преобразованиях дискретных образов и т.д.).

Существуют различные подходы к определению абстрактного автомата, однако если рассматривать наиболее общее определение конечного автомата, согласованное с приведенным выше понятием динамической системы, то удобнее это понятие определить в следующем виде.

Определение 1. Абстрактным автоматом называется отношение AxQxBxQ, где А, В и Q конечные алфавиты (входной, выходной и, соответственно, состояний).

Автомат называется конечным, если конечны мощности множеств A, B, и Q. В общем случае, если отношение ρ не функционально по паре (a,q), оно задает так называемый недетерминированный конечный автомат. Если это отношение по паре (a,q) является функциональным, т.е. любой такой паре соответствует не более одной пары вида (b,q) , то отношение задает обычный конечный автомат. Отметим, что функциональные возможности этих двух абстрактных моделей совпадают, если рассматривать их поведение с точки зрения «черного ящика», или вход-выходного поведения.

В зависимости от того, является отношение ρ всюду определенным или нет, различают всюду определенные автоматы или нет (частичные автоматы). Вводя соответствующие вероятностные распределения на множествах пар (a,q) мы можем трансформировать автоматную модель в вероятностную с возможностями изучения ее как собственно дискретными методами, так и аналитическим аппаратом теории вероятностей (например, аппаратом теории марковских цепей). Задавая отношение ρ нечетким (см. Нечеткие множества) получаем соответствующую проекцию автоматной теории в область нечетких множеств, как для ее приложений, так и исследований ее с помощью соответствующего формального аппарата этой предметной области. Не следует, однако думать, что задание соответствующих абстрактных множеств и манипулирование с ними автоматически приводит к содержательным результатам в проекциях на предметные области. Ситуация скорее обратная — во многих случаях содержательная модель вкладывается в соответствующую автоматную модель исследуемую далее математическими методами. Отметим, что именно в этом была определенная неудача сделать общую теорию систем краеугольным камнем в исследованиях по кибернетике и теории управления системами с обратной связью: слишком большая общность модели не позволила получить значимые для конкретных предметных областей математические результаты.

Необходимо отметить важный класс автоматных моделей, активно внедряющийся в последнее десятилетие ХХ века в практику исследований в области т.и.с. – класс так называемых гибридных автоматов. Модель такого типа возникает, в случае, когда множества A, Q, B (одно или несколько) являются континуальными и при описании функционирования автомата возникает набор дискретно-непрерывных функций, что с одной стороны затрудняет исследование модели традиционными методами, а с другой стороны позволяют естественным образом привлечь к работе с ней аналитический аппарат классической непрерывной математики. Применение таких моделей оправдано в случае необходимости работы с аналогово-цифровыми устройствами, либо с гибридными устройствами, часть параметров которого является непрерывными величинами, а требуемая точность к дискретизации приводит модельных параметров к неоправданному росту сложности описания функционирования объекта.

Мы используем термины «поведение», «среда», «сложность» в данной статье на содержательном уровне и трактуем их достаточно широко: например, в качестве «поведения» может выступать пониматься процесс решения задачи в заданной предметной области, распознавание зрительных образов, поведение абстрактного конечного автомата, движение робота в реальной среде или в абстрактном планарном лабиринте, взаимодействие коллективов роботов между собой и т.д. Соответственно в качестве «сред» могут выступать, абстрактные модели реальных сред, различные предметные области (математика, физика, экономика и т.д.), геометрические среды (планарные и, например, трехмерные шахматные лабиринты и т.д.), а сложность объектов может быть числовым функционалом, зависящим от числа элементарных объектов и связей, использованных при построении сложного объекта, или его кратчайшее описание на одном из формальных языков описания таких объектов. При необходимости ряд этих понятий можно уточнить в соответствии с решаемыми задачами в рамках формализованных представлений. Естественно также то, что при исследовании конкретных интеллектуальных систем или их классов перечисленные выше понятия уточняются и сужаются сообразно требованиям точности моделирования (математического, программного и т.п.). Кроме того для построения моделей в области т.и.с. часто привлекаются результаты исследований , полученные в различных смежных математических и других естественно-научных дисциплинах (экспертные оценки, знания о предметной области и т.д.). Существуют так же разнообразный набор методов и приемов построения моделей, основанных на различных эвристических соображениях, позволяющих моделировать реальные процессы и системы с требуемой точностью к решению исходной задачи. Примерами таких эвристик могут служить, например, модели, основанные на нечеткой логике, процедуры обучения решению задач для нейросетей и т.д.

Заметим, что попытки моделирования интеллектуальных функций человека предпринимались достаточно давно и в качестве первых опытов в этой области необходимо вспомнить первые опыты механизации (или, как мы сейчас говорим, алгоритмизации) вычислительной стороны математических исследований и в этой связи уместно вспомнить имена Б.Паскаля (1623-1662) с его первым в мире механическим арифмометром, построенным в 1642 г. и выполнявшим два арифметических действия (сложение и вычитание), Г.Ф.В.Лейбница (1646-1716), сконструировавшем 1673 г. счетную машину, которая выполняла помимо четырех арифметических действий также возведение в степень и извлечение квадратных и кубических корней. Кстати, помимо этой машины, которую он совершенствовал практически всю оставшуюся жизнь, Г.Ф.В. Лейбниц пытался строить различные формальные исчисления для механических (или, как мы сейчас говорим, автоматических) процедур построения и проверки доказательств математических утверждений (собственно к его работам восходят основы современного аппарата символической логики и исчисления высказываний в алгебраической форме). Именно из работ Г.Ф.В. Лейбницу возник основной аппарат современного анализа, особенно его операционная часть, позволивший эффективно решить проблему передачи знаний в науке начиная с XVII века и по настоящее время и обучать приемам научных исследований с его помощью людей, не знакомых с тонкостями работы собственно самого математического аппарата, особенно в части его применимости в конкретных моделях. Более близким к нам примером такого рода деятельности является аналитическая машина Ч. Беббиджа (1792-1871), разработанная в 1834 г. и являющаяся праобразом современных программируемых вычислительных машин, или более точно элементы организации процесса сложных вычислений, предложенные Ч. Беббиджем, в последующем были учтены при создании современных компьютерных средств вычисления. Следует сказать, что параллельно с механическим моделированием процессов вычисления, проводились фундаментальные исследования по математической логике, которую можно считать одним из важных научных направлений, позволяющим формализовать в его рамках процесс распознавания стандартных форм в мыслительных процедурах человека. Собственно своими корнями эти работы восходят к Аристотелю и обретают новое содержание, начиная с трудов выдающихся логиков Дж. Буля, С. Милля, Н. Васильева и др.

Принципиальное продвижение в изучении “думающих” систем, а также подходы к созданию соответствующей теории были получены в конце 30-х и начале 40-х годов А. Тьюрингом, К. Шенноном, Н. Винером, Дж. Фон Нейманом, У. Мак-Каллоком, У.Питсом, С.Клини, Э.Муром, Ф. Розенблаттом и др., когда возникла необходимость в решении важных прикладных задач, таких как расшифровка сообщений, отслеживание быстро движущихся целей, быстрых расчетов и т.п. Задачи, которые ставила перед учеными жизнь, не могли быть решены только в рамках классической (непрерывной) математики, но требовали принципиально иных подходов (дискретного и дискретно-непрерывного, а позже, например, лингвистического и нечеткого моделирования) и взглядов на моделируемые процессы. В частности, понятие обратной связи позволило создать модельный класс управляющих систем в виде теории конечных автоматов, являющихся до настоящего времени наиболее адекватной формальной моделью служащей для исследования в области т.и.с. Особенно бурно эти исследования получили признание и развитие в 50 - 60-е годы XX века, когда многие ключевые разделы этого направления обретали свои контуры. Среди них: формальные языки, распознавание образов, организация памяти, принятие решений, обучение, целесообразное поведение, воспроизведение, оптимальная структурная организация систем и т.п. На этот период приходится становление «молодой» в то время науки, которая получила название «кибернетика» (от греческого, букв. «кормчий», в переносном смысле «искусство управления», в частности людьми. Именно в этом смысле знаменитый французский физик А.М. Ампер (1775-1836) в рамках задачи классификации наук назвал кибернетикой (cybernetique) науку об управлении государством, воздавая должное трудам античных философов, например Платона, использовавшего это слово для обозначения умения (искусства) управлять). В рамках этого нового (в смысле постановок и решения задач) направления было выработано важное понятие управляющей системы и наборов операций, связанных с этим понятием (А.А.Ляпунов, С.В.Яблонский, О.Б.Лупанов). Были поставлены задачи, которые требовали создания нового математического аппарата для их решения и намечены пути продвижения в новых научных направлениях.

Здесь было бы уместно вспомнить одного из выдающихся и оригинальных русских мыслителей XX века – А.А.Богданова (наст. Фамилия Малиновский А.А. (1873-1928)), имя которого незаслуженно было забыто, чья работа «Тектология: Всеобщая организационная наука», выходившая несколькими изданиями с 1911 г. по 1928 г. (последнее издание с авторской правкой) явилась предтечей в исследовании сложных систем и процессов, необходимость изучения которых позднее была обозначена в работах Н.Винера, Л. Берталанфи, и др.). Отметим мнение ряда исследователей считающих, что работа А.Богданова является исторически первым вариантом общей теории систем и предшественником кибернетики, основанной на чисто качественных методах исследований.

Именно на 50-60-е годы XX века приходится очередная попытка организации научных исследований, главным направлением в которых было моделирование мыслительной деятельности человека, и именно с этим связан был успех нового тогда научного направления под названием «кибернетика». В эти годы были введены основные понятия и получены очень важные математические результаты и созданы новые математические модели (обратная связь, автоматные модели, модели нейрона, структурные схемы, теория сложности и т.д.) по моделированию интеллектуальных функций живых систем. Достижения в области математической логики (в частности анализ алгоритмической деятельности человека, проведенный А. Тьюрингом, работы Э. Поста, Д. Гильберта, С.Клини, А.Маркова, П.С.Новикова, Д. Патнема, Дж. Робертсон и др.) и значительный прогресс в компьютеростроении (особенно прогресс в области создания и развития алгоритмических языков) породил волну прикладных исследований по созданию компьютерных моделей мыслительной деятельности в области математики. Из довольно обширного списка работ на эту тему следует выделить как одну из пионерских работ в этой области – программу А. Ньюэлла и Г. Саймона под названием General Problem Solver (GPS – общий решатель задач), которая послужила источником идей для создания различных решателей задач, базирующихся на методе резолюций или его модификациях в других предметных областях.

Активно развивались направления, связанные с исследованием дискретных преобразователей информации. Одной из наиболее изученных моделей такого рода преобразователей является булева функция, т.е. отображение f вида f : E2n→E2, где E2 = {0,1} (см. Булева функция, а также алгебра логики). С булевскими функциями тесно связан раздел дискретной математики, называемый "алгебра логики ", занимающийся изучением высказываний с точки зрения их логических значений (истинности или ложности) и логических операций над ними. Это направление развивалось в трудах Дж. Буля, Ч.Пирса, П.Порецкого, Э.Поста, А.В.Кузнецова, С.В.Яблонского и др. Новое осмысление и понимание, как в плане теоретического развития, так и в области приложений, этой модели появилось в 30-х – 40-х годах нашего столетия в связи с развитием радиорелейных систем, а также в связи с началом разработки в ряде стран принципиально новых устройств обработки информации — вычислительных машин, построенных на принципах исполняемой и хранимой в памяти машины программы. Оказалось, что аппарат булевской логики позволяет удобно описывать функционирование широкого класса схем, лежащих в основе многих технических устройств (в том числе и вычислительных схем), созданных на различной элементной базе (релейной, ламповой, а позднее полупроводниковой и пр.) и позволяет успешно решать задачи построения новых классов схем из них, а также проектировать новые классы устройств. Тем самым булевская функция стала рассматриваться как сравнительно несложный (в понятийном смысле) преобразователь информации, у которого входы и выходы принимают значения из множества E2 = {0,1}. Другой стороной этой модели оказалась возможность ее приложения к задачам обработки семантической информации в рамках исчисления высказываний. Именно в рамках этой модели происходило первоначальное осмысление процесса моделирования обработки информации живыми организмами, начиная с простейших организмов и заканчивая человеком, в частности формальная модель нейрона У.Маккаллока и У.Питтса, базирующаяся на принципе «все или ничего». Вместе с тем, довольно быстро выяснилось, что эта модель преобразователя явно недостаточна для адекватного моделирования реальных процессов, протекающих к тому же, как правило, еще и во времени. В связи с этим, как это отмечалось уже выше, в рамках общекибернетического подхода была выработана новая модель дискретного преобразователя — конечного автомата — которая естественным образом, в отличии от других формально-логических моделей в своем функционировании отражала временной фактор, как бесконечный дискретный набор чисел, изоморфных натуральному ряду.

Трудности решения задач моделирования интеллектуальных функций человека (в том числе и формально-логическими методами) привели постепенно к дроблению предмета исследований в области кибернетики, углублению в соответствующие разделы исследований и, как следствие этого, к утрате системной (интегративной) функции кибернетикой. Свидетельством тому стало появление новых отдельных научных направлений (информатика, искусственный интеллект, семиотика и т.д.), претендующих на самостоятельность и в рамках которых собственно были достигнуты важные научный результаты по моделированию интеллектуальных функций живых систем. Постепенно возникло понимание необходимости продолжения активных работ по создании фундаментальной теории, исследующей феномен интеллекта на основе точного знания.

Одним из таких научных направлений (как это уже отмечалось выше), доказавшим в дальнейшем свою фундаментальную роль при исследовании реальных интеллектуальных систем, явилась теория автоматов, ставшая главной математической и методологической базой в исследованиях по теории интеллектуальных систем в силу разработанности к настоящему времени математического аппарата этой теории и его достаточной общности.

Именно использование автоматной идеологии позволило создать новый класс моделей решателей математических задач (Кудрявцев В.Б., Подколзин А.С.) базирующихся на специально созданном для этого алгоритмическом языке высокого уровня ЛОС (логический описатель ситуации), позволяющих говорить о создании интеллектуальных искусственных решателей задач на уровне, сравнимом с интеллектом человека. Отметим, что при этом удалось решить задачу моделирования понимания человеком задач в предметной области в терминах проблемы распознавания форм (новые методы и подходы к моделированию интуиции человека). Кроме того, автоматные модели (в сочетании с, например, моделями нечеткой логики) позволяют перейти от игрушечных моделей к реально работающим экспертным системам в обучении, медицине, промышленности и т.д.

В заключении выделим некоторые фундаментальные области исследований в т.и.с., изучение которых необходимо для развития как собственно теории, так и практики создания интеллектуальных систем. Такими направлениями на наш взгляд являются:

  • исследования по теории автоматов;
  • разработка методов распознавания образов, возникающих при слуховых, визуальных и иных формах восприятия информации;
  • поиск общих принципов принятия решений, включая логические, стохастические, комбинаторные, нечеткие и другие подходы, создание решателей задач в различных предметных областях;
  • разработка языков высокого уровня как для описания ситуаций, так и для использования математических средств при решении задач распознавания и принятия решений;
  • создание оптимальных по использованию баз данных и знаний и связанное с этим исследование сложности поиска и хранения информации;
  • разработка общих приемов и методов конструирования иерархических экспертных систем и компьютерных решателей задач;
  • исследование возможностей автоматов и роботов с элементами интеллектуального поведения при решении задач в предметных областях с различной степенью формализации;
  • создание компьютерных систем обучения в хорошо- и слабо- формализованных областях знаний;
  • разработка методов компьютерного моделирования в естествознании, гуманитарной и технической областях: математика, механика, физика, химия, биология, экономика, политические и общественные науки и др.;
  • исследование свойств дискретных структур, алгоритмов, функций и функциональных систем;
  • разработка теории и методов анализа и синтеза эффективных алгоритмов и вычислителей;
  • разработка проблематики нечеткой математики;
  • исследование проблем кодирования и защиты информации;
  • исследование математических проблем телекоммуникаций;
  • и др.

Эта статья еще не написана, но вы можете сделать это.