ПОСТРОЕНИЕ ЛОГИЧЕСКОЙ МОДЕЛИ БАЗЫ ДАННЫХ РОДИЛЬНОГО ДОМА

А.А. Сидоров, Е.Е. Ковшов, А.В. Фролов

Родильный дом №17 г. Москвы (127591,
Москва, ул. 800-летия Москвы, 22; т. 906-01-31)

Построение информационно-аналитической системы родильного дома (ИАС РД) является достаточно сложной и ответственной работой в виду того, что используются большие объемы информации о пациентах, достоверность которых не должна вызывать сомнения при их аналитической обработке. При разработке ИАС РД было предложено использовать базу данных (БД) для хранения, обработки и выборки информации по роженицам и новорожденным, проектирование которой, является главным звеном в построении вышеназванной системы.

Первоначально в теории БД основное внимание уделялось средствам эффективной организации данных и манипулирования ими, в результате чего возникли три основные модели данных: иерархическая, реляционная и сетевая. При этом явно или неявно предполагалось, что предложенные средства достаточно универсальны для представления знаний или информации о любых предметных областях.

По этой причине в последние годы получило развитие семантическое, или концептуальное направление моделирования в базах данных. Его основная цель - организация интерфейса проектировщика, а также конечного пользователя с информационной системой на уровне представлений о предметной области, а не на уровне структур данных.

В настоящее время определился основной подход к решению задач семантического моделирования в базах данных. Он заключается в выделении двух уровней моделирования: уровня концептуального моделирования предметной области и уровня моделирования собственно базы данных.

Поскольку объектное ядро предметной области потенциально содержит бесконечное число объектов, которые находятся в бесконечном множестве взаимосвязей, ясно, что прямой подход к описанию предметной области через описание всех объектов и взаимосвязей между ними обречен на провал.

Очевидной альтернативой в этой ситуации является подход к описанию предметной области ИАС РД, фиксирующий только то общее, что является неизменным и характеризует ее в любой момент времени или, говоря иными словами, отражающий семантику системы родильного дома.

Наиболее часто на практике семантическое моделирование используете на первой стадии проектирования базы данных. Его результатом, как правило, является концептуальная модель предметной области, выраженная в терминах используемой семантической модели (например, ER-модели). При переходе следующему этапу - этапу моделирования схемы БД - возникает проблема выражения концептуальной модели предметной области родильного дома в терминах применяемой модели данных (например, реляционной).

Существует три подхода к решению этой проблемы [1].

Первый подход состоит в ручном преобразовании концептуальной модели информационной системы в схему БД, выполняемом согласно методикам, в которых достаточно четко оговорены все этапы такого преобразования.

Во втором подходе реализуется автоматизированная компиляция концептуальной модели предметной области в схему БД (чаще всего реляционную). При этом возможны два варианта решения:
  • явное представление концептуальной модели предметной области как исходной информации для компиляции;
  • построение интегрированных систем проектирования с автоматизированным созданием концептуальной модели предметной области на основе интервью с экспертами предметной области.

И в том, и в другом случае в результате продуцируется реляционная схема базы данных в третьей нормальной форме.

Наконец, третий подход - это непосредственная работа с базой данных в семантической модели, т.е. применение СУБД, основанных на семантических моделях данных.

В настоящее время на рынке программного обеспечения появилось достаточно много универсальных (не привязанных к какой-либо конкретной СУБД) средств автоматизированного проектирования БД, позволяющих выполнять концептуальное моделирование предметной области. Такие системы являются реализацией второго из рассмотренных выше подходов. Одним из наиболее популярных программных продуктов в этой области является ERwin фирмы Platinum.

Процесс моделирования в ERwin базируется на методологии проектирования реляционных баз данных - IDEF1X. Она определяет стандарты терминологии и графического изображения типовых элементов на ER-диаграммах.

В ERwin используются два уровня представления модели данных: логический и физический. На логическом уровне не рассматривается использование конкретной СУБД, не определяются типы данных и не определяются индексы для таблиц. Целевая СУБД, имена объектов и типы данных, индексы составляют второй (физический) уровень модели ERwin.

Процесс построения информационной модели ИАС РД включает в себя следующие этапы.

1. Создание логической модели данных:
  • определение сущностей;
  • определение зависимостей между сущностями;
  • задание первичных и альтернативных ключей;
  • определение неключевых атрибутов сущностей;

2. Переход к физическому описанию модели;

3. Генерация физического представления базы данных.

С точки зрения пользователя ERwin, процесс создания логической модели данных заключается в визуальном редактировании ER-диаграммы. Диаграмма ERwin строится из трех основных блоков: сущностей, атрибутов и связей.

На диаграмме сущность изображается прямоугольником. Основная информация, описывающая сущность, включает:
  • атрибуты, составляющие первичный ключ;
  • неключевые атрибуты;
  • тип сущности (независимая/зависимая).

Первичный ключ - это атрибут или набор атрибутов, уникально идентифицирующий экземпляр сущности. Если несколько наборов атрибутов могут уникально идентифицировать сущность, то выбор одного из них осуществляется при разработке на основании анализа предметной области и учета следующих требований к первичному ключу:
  • первичный ключ не должен принимать пустые (NULL) значения;
  • первичный ключ не должен изменяться в течение времени;
  • размер первичного ключа должен быть как можно меньшим.

При этом если какой-либо из оставшихся наборов будет часто использоваться для доступа к сущности, то можно объявить его альтернативным ключом.

Работая с ERwin, можно также составлять группы атрибутов, которые не идентифицируют уникально экземпляры сущности, но часто используются для доступа к данным. Они получили название инверсных входов. Одни и те же атрибуты сущности могут входить в несколько различных групп ключей.

Среди всех атрибутов данной сущности на роль первичного ключа могут претендовать "идентификатор истории родов" и группа атрибутов "фамилия", "имя", "отчество", "дата рождения" (последний необходим, т.к. в родильном доме могут находиться полные тезки). Очевидно, что по соображениям размера в качестве первичного ключа следует выбрать первый из вариантов.

Таким образом, применение CASE-средств на этапе построения логической модели базы данных ИАС РД обеспечивает достоверность данных и бесперебойную работу прикладного программного обеспечения как на этапе опытной так и на этапе промышленной эксплуатации.

Литература

1. Кузнецов С.Д.. Введение в СУБД: Часть 4. Системы управления базами данных. №4/95, с. 114-122.

Содержание конференции | Секция10