Назад (Введение в специальность).

Базовые информационные процессы.

    Базовые информационные процессы:
  1. Извлечение информации.
  2. Транспортирование информации.
  3. Обработка информации.
  4. Хранение информации.
  5. Представление и использование информации.

Извлечение информации.

Реальное представление предметной области -> Формальное представление -> Информационное представление



    Формы оценки:
  1. Синтаксическая ценность (правильность представления).
  2. Семантическая (смысловая ценность).
  3. Прагматическая (пользовательская ценность).
    Формы и методы исследования данных:
  • Поиск ассоциаций.
  • Установление последовательности событий во времени.
  • Выявление закономерностей (причинно-следственные связи между свойствами объектов).
  • Оценка важности влияния параметра на развитие ситуации.
  • Классификация (распознавание) объектов (событий, ситуаций, процессов).
  • Кластеризация, основанная на группировании объектов по каким-либо признакам.
  • Прогнозирование событий и ситуаций.

Объектно-ориентированный подход.

Базовые понятия: объект, атрибут, экземпляр объекта, класс, элемент класса.

Объект - это абстракция множества предметов реального мира, обладающих одинаковыми характеристиками и законами поведения.

Объект характеризует типичный неопределённый элемент такого множества.

Основная характеристика - состав его атрибутов (свойств).

Атрибуты - это специальные объекты, посредством которых можно задавать правила описания свойств других объектов.

Экземпляр объекта - это конкретный элемент множества объектов.

Класс - это множество предметов реального мира, связанных общностью структуры и поведением.

Элемент класса - это конкретный элемент данного множества класса.

Объект - это типичный представитель класса. Элемент класса и элемент объекта - равнозначные понятия.

    Особенности подхода:
  • Инкапсуляция (сокрытие данных и методов для объекта).
  • Полиморфизм (многотипность объекта; объект может принадлежать больше, чем к одному типу).
  • Наследование (новые классы определяются путём добавления или переопределения данных и методов).
    Методы обогащения информации:
  • Структурные (изменение параметров сообщения, в котором отображается информация в зависимости от свойств объекта).
  • Статистические (накопление статистических данных, их обработка и выборка).
  • Семантические (минимизация логической формы, выделение классификаций понятий, переход от частного к общему).
  • Прагматические (из полученной информации избирается наиболее ценная информация для пользователя в соответствии с его целями и задачами при принятии решения).

Транспортирование информации.

OSI (Open System Intercongtcion - связь открытых систем) - эталонная модель сетевого обмена, разработанная международной организацией по стандартизации ISO.

    Уровни представления в OSI
  • Физический (сетевые аппаратные средства - управление физическими цепями).
  • Канальный (сетевое программное обеспечение - управление звеном сети - каналом).
  • Сетевой (управление виртуальной цепью, маршрутизация пакетов данных в сети).
  • Транспортный (контроль очерёдности пакетов и их принадлежности по аналогии с телефонной коммутацией).
  • Сеансовый (управление и завершение виртуальной связи по аналогии с голосовой телефонией).
  • Уровень представления (преобразование {конвертирование, сжатие, распаковка...} данных из формата передающего компьютера в формат компьютера-получателя).
  • Прикладной (поддержка пользователя на более высоком прикладном и системном уровнях).
    Протоколы сетевого взаимодействия.
  • Нижний уровень (канальный и физический уровни OSI, например: NDIS, ODI).
  • Средний уровень (сетевой, транспортный и сеансовый уровни OSI, например: сеансовые и дейтаграммные протоколы).
  • Верхний уровень (уровень представления и прикладной уровень OSI).

Обработка информации

    Обработка информации
  • Последовательная (один процессор).
  • Параллельная (несколько процессоров).
  • Конвейерная (одни и те же ресурсы для решения различных задач).
  • Последовательная и векторная.
    Основные процедуры:
  • создание данных в результате выполнения некоторого алгоритма;
  • модификация данных как результат отображения изменений в реальной предметной области;
  • контроль, безопасность и целостность информации;
  • поиск информации;
  • поддержка принятия решения;
  • создание сводок, документов, отчётов.
    Оценка и выбор стратегии:
  • В условиях определённости (используются методы математического программирования).
  • В условиях риска (вероятностные методы).
  • В условиях неопределённости (на основе внешних оценок выигрыша).
  • В условиях многокритериальности (методы моделирования).

Базовые термины: база данных, банк данных, система баз данных, хранилище данных (Data Warehouse), витрины (Data Mart), репозитарий.

База данных - совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулярной избыточностью. Для модификации и изменения применяется общий метод.

Банк данных - система, представляющая определённые услуги по хранению и поиску данных определённой группе пользователей по определённой тематике.

Система баз данных - это совокупность, которая состоит из следующих частей: управляющая система, прикладное программное обеспечения, база данных, операционная система и технические средства, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (склад данных, информационное хранилище) - это база, хранящая данные, агрегированные по нескольким изменениям (то есть данные в хранилище собираются, концентрируются в зависимости от измерения), когда разнородные данные их предметной области имеют некоторые устойчивые связи. В зависимости от нужд пользователя устанавливается набор данных, необходимых программе. Как-то так. Данные никогда не удаляются. Пополнение хранилища осуществляется на периодической основе. Формирование новых типов (агрегатов) данных, зависящих от старых, - автоматическое. Доступ осуществляется на основе модели "гиперкуб" или "многомерный куб".

Витрины данных - множество тематических баз данных, содержащих информацию и относящихся к отдельным информационным аспектам предметной области.

Репозитарий - БД для хранения системных (не пользовательских!) данных.

    Уровни представлений для предметной области:
  • Концептуальный : отличается разнообразием используемых моделей (модель "Сущность-связь", ER-модель, инфологическая модель и др.).
  • Логический: иерархические (совокупность деревьев или лес), сетевые (орграф со связями "многие к одному") и реляционные модели данных (в виде таблиц (реляций) с отношениями на основе реляционной алгебры и теории отношений).
  • Физический или внутренний: определяется конкретным методом управления данными; основные компоненты - записи, блоки, промежутки между блоками, служебная информация.

Классификация баз данных.

    По способу хранения:
  • Интегрированные (хранящиеся в одном месте).
  • Распределённые (в компьютерной сети).
    По типу пользователей:
  • Монопользовательские.
  • Многопользовательские.
    По характеру использования данных:
  • Прикладные.
  • Предметные.
    Способы реализации СУБД (системами управления базами данных):
  • Программный.
  • Аппаратный.
    Функции программных модулей СУБД:
  • Описание данных на концептуальном и логическом уровнях.
  • Загрузка данных.
  • Хранение данных.
  • Поиск и ответ на запрос (транзакция).
    Стандарты СУБД:
  • Независимость данных на всех трёх уровнях.
  • Универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ).
  • Совместность, неизбыточность.
  • Безопасность и целостность данных.
  • Актуальность и управляемость.

Представление предметной области.



Пример концептуального представления предметной БД «СБЫТ».



Пример логического представления предметной БД «СБЫТ».



Критерии оценки БД.

Количественные: время, необходимое для ответа на запрос; стоимость модификации; стоимость памяти; время на создание; стоимость реорганизации и др.

Качественные: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность восстановления, возможность расширения и распределения и др.

Основные принципы организации хранилища данных (ХД).

  • Предметная реализация: каждая оперативная БД поддерживает несколько предметных областей – источник для ХД.
  • Средства интеграции: общий тип для разных представлений одних и тех же сущностей.
  • Постоянство данных: за счет реализации модели «массовых загрузок» данных.
  • Хронология данных.


Представление и использование информации.

    Факторы, имеющие наибольшее значение для деятельности человека:
  • эргономические (рациональный набор функций человека, рациональное сопряжение человека с ТС и средой ИС);
  • психологические ( психологический барьер, усложнение деятельности, др. субъективные факторы).
    Варианты интерфейсов в системе «человек-компьютер»:
  • на основе меню: «Смотри и выбирай»;
  • на основе языка команд: «Вспоминай и набирай».

Принципы разработки пользовательских интерфейсов.

  • Пользовательский интерфейс целесообразно строить на основе концептуальной модели предметной области.
  • Доступ к объектам и их экземплярам возможен только через систему окон различных типов (ряд окон должен быть связан с конкретным объектом).
  • Сценарий работы пользователя с ИС включает две фазы: выбор окна и работа с окнами.
  • Проектирование пользовательского интерфейса – процесс спецификации окон, по существу спецификация задает сценарий работы с экземплярами.
  • Спецификацию окон следует проводить в соответствии с функциональной потребностью: выделять разделы, строить иерархию разделов, указывать допустимые режимы работы с экземплярами объекта.

Основные функции фазы выбора объектов.

  • Работа с общим каталогом окон в главном разделе.
  • Создание нового раздела.
  • Удаление раздела.
  • Редактирование описания раздела.
  • Передача определений и окон между разделами.
  • Движение по иерархии разделов.
  • Отбор разделов для работы.
  • Отбор окон для работы.