Рассмотрим существующие модели оптимального распределения данных по узлам компьютерной сети. В качестве критериев эффективности будем использовать средний объем пересылаемых данных по линиям связи при обработке запросов и распространением обновлений, общую стоимость трафика, порожденного функционированием распределенной вычислительной системы в течение единицы времени, эксплуатационную стоимость сети ?. В качестве примера рассмотрим модель оптимального размещения файлов по компьютерной сети с критерием эффективности – средний объем пересылаемых данных по линиям связи при обработке запросов и распространении обновлений.
image

Рассмотрим вычислительную сеть, каждый узел, который состоит из ЭВМ, терминальных устройств и аппаратуры передачи данных. Предположим, что запрос, поступающий на терминальное устройство любого узла, предполагает доступ к определённому файлу распределённой базы данных, и объем запросного и корректного сообщения к одному и тому же файлу зависит от узла, без которого оно поступило. Будем считать, что схема обработки запросов состоит в следующем.
Запрос, инициированный на терминале, поступает во входную очередь соответствующего узла. Процессор ЭВМ обрабатывает запросы в порядке их поступления. Если копия нужного файла содержится в локальной базе данных узла, на терминал которого поступал запрос, то запрос обрабатывается и результат выводится на этот терминал. Если копия нужного файла не содержится в локальной базе данных узла, те сначала по справочнику локальной базы данных определяется узел, содержащей копию нужного файла. Затем запрос пересылается в тот узел, там обрабатывается и ответ поступает первоначальный узел. Порядок обслуживания запросов не влияет на объем пересылаемых данных по каналам связи.

Корректирующие сообщения обслуживаются в порядке их очереди. Однако по сравнению с запросами сообщениями, они имеют наивысший приоритет обслуживания.
В процессе обслуживания запросных и корректирующих сообщений в течение каждой единицы времени по каналам связи пересылается некоторый объем данных, зависящий ри распределения копий файлов по локальным базам данных. Чем меньший объем пересылаемых данных по каналам связи за единицу времени, тем выше скорость обработки сообщений.
Путь
п — число узлов сети;
т — число независимости файлов, входящих в распределенную базу данных;
Kj – j – й узел связи;
Fi- i- й файл распределенной базы данных;
аv – объем запрашиваемых данных при выполнении запроса к файлу Fi из узла Kj;
?v – объем запрашиваемых данных при выполнении запроса к файлу Fi из узла Kj;
Уv – объем корректирующего сообщения к файлу Fi из узла Kj;
?v — интенсивность запросов к файлуFi, инициированных в узле Kj;
?`v — интенсивность корректирующих сообщений к файлу Fi из узла Kj;
вj– объем памяти узла Kj, предназначенный для размещения файлов;
Уj–число копий i – го файла (Уj – заданная величина i < = Уji< = п);
Хv (I=I, m? j= I, n) — величины, определяемые по формуле.
{ I, если копия файла Fi, находится в узле Kj;}
Хv {О? в противном случае}

Интенсивность ?i порождает объем данных
Vi = ?A?`v УvХi
5 — i
5 – j
нуждающихся в пересылке. Если положить

n k
?` = ??AV
i= j j=i

то средней объем данных, необходимых для пересылки при обработке корректирующего сообщения в системе равен.
nkх
V` =I????`v УvХI
?` i= j j= i 5 — i
5 – j

Интенсивность ?`v порождает объем данных ?`v (av+?) (I-Хv) нуждающихся в пересылке. Поэтому средний объем данных, необходимых при пересылке при выполнении запроса в системе равен
n k
V`= I???`v (av+?) (I-Х v)
?` i= jj= i

n k
где?=? ??`v
i= j j= i

Таким образом, математическая модель задачи оптимального распределения копий файлов по узлам вычислительной сети для критерия оптимальности средней объем пересылаемых данных по линиям связи при обработке запросного и корректирующего сообщения будет следующей: требуется найти минимум линейной функции
L,= V+V'
при ограничениях
n
? xv=yi(i=I,m)
i= j

n
?L,xv ? bi(i=I,n)
i= j

Хv=(o??I) I'I,m,j=I,n)

Для улучшения производительности системы в качестве дополнительного условия может быть использовано ограничения на ожидаемое время выполнения запроса из каждого узла. Действительно, пусть aifz – ожидаемое время, необходимое для выполнения запроса, инициированного в узле Kj, к файлу Fj, который содержится в узле Kj, Tif – максимально допустимое время выполнения запроса к файлу Fj, инициированного в узлеKj. Тогда между величинами aifz и Тv имеет место соотношения
av5(I-Хv) Х15? Тv
для j <> S, I<>i<>m.
Чтобы из этого соотношения получить ограничения, следует величины aifz выразить через переменные Хv. В общем случае топологии сети это сделать очень трудно. И только при непользовании целого ряда допущений, налагаемых на характеристики сети, можно найти простые выражения знаний aifz черезХv.
К недостаткам разработанных моделей можно отнести то, что они содержат ряд ограничений и упрощений, не отражают такую особенность РБД, как фрагмента к недостаткам разработанных моделей можно отнести то, что они содержат ряд ограничений и упрощения, не отражают такую особенность РБД, как фрагментация, а также что они статичны и не учитывают динамику происходящих в системе процессов.
Что касается методов, применявшихся для оптимизации РБД – метод ветвей и границ, математического программирования – они дали положительных результатов, так как для реальных сложенных компьютерных информационных систем с РБД, размеренность задачи велика, что требует значительных затрат времени и вычислительных ресурсов. Поэтому для данной задачи целесообразно использовать генетические алгоритмы, реализующие направленный случайный поиск, основанный на механизмах природной эволюции.
Таким, образом, несмотря на проведенные ранее исследования вопросы моделирования и оптимизации РБД компьютерных информационных систем не получили окончательного решения, используемые модели и методы имеют ряд недостатков, что обусловило необходимость их дальнейшего совершенствования.
Не менее важным вопросом, является предоставление наиболее точных исходных данных. Реализация любой математической модели. Оптимального размещения файлов РБД по узлам компьютерной сети требует ряда информационных массивов исходных данных, значительная часть которых может быть получена лишь в усредненном или приниженном виде. Это такие характеристики, как интенсивности запросов, время пересылки и обработки запросов, объёмы запросов и ответов на запросы. Точность собранной статической информации будет решающим образом влиять на конечный результат реализации выбранной математической модели и следовательно, на производительность системы, работающей с РБД.
Для получения достоверных числовых данных необходимо выяснить цикличность обращения информации в системе. Этот период может колебаться различных приложений от одного дня до квартала. При дальнейшей обработке собранной информации необходимо учитывать как среднестатистические всплески активности. Числовые характеристики времени обработки, объема, пересылок и вероятностей обращения необходимо рассчитать с учетом поправки на пиковые ситуации, чтобы защитить систему от значительных задержек во время наиболее интенсивных загрузок.
Кроме перечисленных характеристик в процессе работы с оптимизируемой базой данных необходимо накапливать информацию о виде запроса (чтение, поиск, корректировка) имени файла, к которому выдан запрос, номер узла, с которого выдан запрос, времени реального ответа.
БЗ – это совокупность единиц знаний которые представляют собой формирование помощью некоторого метода представления знаний отражение объектов проблемной области и их взаимосвязей, действий над объектами и, возможно неопределенностей с которыми эти действия осуществляются.
В качестве методов представления знаний чаще всего используются либо правила, либо объекты (фреймы), либо их комбинация. Так, правила представляют собой конструкции.
Если < условие> То < заключение > CF (фактор определенности) < значение >.
В качестве факторов определенности (CF), как правило, встречают либо условные вероятности байесовского подхода (от 0 до 1), либо коэффициенты уверенности нечетной логики (от 0 до 100). Примеры правил имеют следующий вид.
Правило 1. Если Коэффициент рентабельности > 0,2
То Рентабельность = «удовл» CF 100.
Правило 2. Если Задолженность = «нет» и Рентабельность = «удовл».
То Надежность предприятия = «удовл» CF 90.
В любой момент времени в системе существуют при типа знаний:
Структурированные знания – статистические знания о предметной области. После того как знания выявлены, они уже не изменяются.
Структурированные динамические знания – изменяемые знания о предметной области, они обновляются по мере выявления новой информации.
Качество ЭС определяется размером и качеством базы знаний (правил или эвристик). Система функционирует в следующем циклическом режиме: выбор (запрос) данные или результатов анализов наблюдения, интерпретация результатов, усвоение новой информации, выдвижении с помощью правил временных гипотез и затем выбор следующей порции данных и результатов анализов. Такой процесс продолжается до тех пор, пока поступит информация, достаточная для окончательного заключения.
Таким образом, систему искусственного интеллекта, построенную на основе высококачественных специальных знаний о некоторой предметной области (полученных от экспертов – специалистов в этой области) называют экспертной системой. Экспертные системы – один из немногих видов систем искусственного интеллекта – получили широкое распространение и нашли практическое применение.

От других программ экспертные системы отличаются по следующим признакам:
1. Компетентность – в конкретных предметной области экспертная система должна достичь того же уровня, что и эксперты – люди, при этом она должна пользоваться теми же эвристическими приемами, также глубоко и широко отражать предметную область;
2. Символьные рассуждения–знания, на которых основана экспертная систем, представляют в символьном виде понятия реального мира, рассуждения также происходят в виде преобразований символьных наборов;
3. Глубина – экспертиза должна решать глубокие, нетривиальные задачи отмечающиеся сложностью либо в плане сложности знаний, которые экспертная система использует либо в плане их обилия, это не позволяет использовать полный перебор вариантов как метод решения задач и заставляет прибегать к эвристическим, творческим, неформальным методам;
4. Самосознание – экспертная система должна включать в себя механизм объяснение того, каким образом она приходит к решению задачи.

Литература
1. Моисеев В.Б. Представление знаний в интеллектуальных системах. / Информатика и образование, №2, 2003.
2. Петров В.Н. Информационные системы – СПб: Питер, 2003.
3. Растрагин Л.Х. Системы экспериментального управления. – М.: Наука, 1974.
4. Саак А.Э., Пахомов Е.В., Тюшняков В.Н. Информационные технологии управления: Учебник для вузов. СПб: Питер, 2005.
5. Семенов М.И. и др. Автоматизированные информационные технологии в экономике. Учебник. – М.: Финансы ис статистка, 2003.
6. Советов Б.Я. Моделирование систем: Учебник для вузов. – 3 – изд. перераб. и док. – М.: Высшая школа, 2001.
7. Суворова Н. Информационное моделирование: величины, объекты, алгоритмы. – М.: Лаборатория базовых знаний, 2002.

Небольшой кусочек моей курсовой работы по Экспертным системам.

Комментарии (2)


  1. Mgrin
    05.12.2015 12:00

    А можно формулы все же переписать на латехе и вставить как картинки? Потому как это читать невозможно, хотя очень было бы интересно