В связи с быстрым развитием интернет-технологий возникла необходимость применения средств искусственного интеллекта для поиска и обработки интернет-ресурсов. Применение интел­лектуальных MAC для решения задач сбора, поиска и анализа ин­формации в глобальных сетях дает следующие существенные преимущества перед традиционными средствами обработки ин­формации:

  • обеспечение доступа пользователя к сетевым протоколам в сети Интернет;
  • параллельное решение нескольких задач;
  • выполнение поиска информации после отключения поль­зователя от сети;
  • увеличение скорости и точности поиска, а также уменьше­не загрузки сети за счет поиска информации непосредственно на сервере;
  • создание собственных баз информационных ресурсов, постоянно обновляемых и расширяемых;
  • реализация возможности сотрудничества между агентами, которая позволяет использовать накопленный опыт;
  • возможность автоматически корректировать и уточнять за­просы, используя контекст и применяя модели пользователей.

В табл.7.2 приведены отличительные особенности известных в России коммерческих мультиагентных систем Autonomy и WebCompass, предназначенных для интеллектуального поис­ка и обработки информации в сети Интернет.

Недостатком современных систем интеллектуального поиска и обработки информации является их слабая способность к обучению. Поэтому основные усилия по совершенствованию интел­лектуальных систем информационного поиска в сети Интернет направлены на развитие моделей представления знаний, меха­низмов вывода новых знаний, моделей рассуждения и способов обучения агентов.

Таблица 7.2 Анализ систем интеллектуального поиска и обработки информации

Характеристика Autonomy WebCompass
Категория пользовате­лей, на которую ориен­тирована система Конечные пользовате­ли «Продвинутые» поль­зователи
Подход к описанию предметной области Технология нейронных сетей и специальные методы распознавания образов и обработки сигналов Иерархии понятий, связанных отношения­ми типа IS-A, PART-OF, HAS-PART, IS-A KIND OF и т.

д.

Средства специфика­ции запросов Естественный язык «Прямое» использова­ние сформированного пользователем описа­ния предметной облас­ти
Методы поиска реле­вантной информации Нечеткая логика Поиск по списку клю­чевых слов одновре­менно на 35 машинах поиска
Режим обучения поис­ковых агентов Есть Нет

Рис. 7.5. Архитектура системы MARRI

Одним из успешных исследовательских проектов, выполнен­ных в этом направлении, стал проект системы MARRI, кото­рая была разработана для поиска Web-страниц, релевантных за­просам в определенной предметной области. Для решения по­ставленной задачи система использует знания, представленные в виде онтологии, под которой в данном случае понимается упоря­доченное множество понятий предметной области. Архитектура системы MARRI показана на рис. 7.5.

Система MARRI включает следующие типы агентов:

  • интерфейсный агент (агент пользователя) обеспечивает ин­теллектуальное взаимодействие с пользователем. Он поддержи­вает процесс формулирования запросов и представляет результа­ты поиска в виде списка URL или Web-страниц.

Агенты-брокеры двух типов:

  1. брокер типа URL предназна­чен для формирования списков интернет-адресов, поставляемых браузером;
  2. брокер типа HTML выполняет функции запомина­ния полученных Web-страниц и их распределения между агента­ ми обработки текста;
  • агент сети (интернет-агент) обеспечивает считывание и анализ заданной страницы URL или Web-страницы (URL — авто­номная Java-программа с собственным сетевым адресом).
Он должен уметь выполнять обработку исключительных ситуаций (например, когда страница недоступна), а также производить анализ текста на считанной странице;
  • агент обработки текста сначала преобразует HTML-текст к представлению, с которым работают морфологический и синтак­сический анализаторы, а затем проводит семантический анализ Web-страниц для проверки их релевантности запросу на основе соответствующей онтологии. Результат обработки текста пред­ставляется в виде синтаксического дерева, которое должно соот­ветствовать какому-нибудь фрагменту используемой онтологии.

Каждый из перечисленных типов агентов наделен специаль­ными знаниями, которые используются для повышения эффек­тивности поиска информации. Агенты способны взаимодейство­вать друг с другом; обмениваться информацией, контактировать с Web-браузерами, анализаторами естественного языка и онтоло­гическими базами данных.

Отличительной чертой системы MARRI является представле­ние агентов автономными Java-программами, каждая из которых имеет собственный сетевой адрес (URL). Это обеспечивает мо­бильность агентов, но противоречит политике безопасности, не допускающей запуск подобных программ, если они не сертифи­цированы на данном сервере.