Базовые информационные процессы.
- Базовые информационные процессы:
- Извлечение информации.
- Транспортирование информации.
- Обработка информации.
- Хранение информации.
- Представление и использование информации.
Извлечение информации.
Реальное представление предметной области -> Формальное представление -> Информационное представление

- Формы оценки:
- Синтаксическая ценность (правильность представления).
- Семантическая (смысловая ценность).
- Прагматическая (пользовательская ценность).
- Формы и методы исследования данных:
- Поиск ассоциаций.
- Установление последовательности событий во времени.
- Выявление закономерностей (причинно-следственные связи между свойствами объектов).
- Оценка важности влияния параметра на развитие ситуации.
- Классификация (распознавание) объектов (событий, ситуаций, процессов).
- Кластеризация, основанная на группировании объектов по каким-либо признакам.
- Прогнозирование событий и ситуаций.
Объектно-ориентированный подход.
Базовые понятия: объект, атрибут, экземпляр объекта, класс, элемент класса.
Объект - это абстракция множества предметов реального мира, обладающих одинаковыми характеристиками и законами поведения.
Объект характеризует типичный неопределённый элемент такого множества.
Основная характеристика - состав его атрибутов (свойств).
Атрибуты - это специальные объекты, посредством которых можно задавать правила описания свойств других объектов.
Экземпляр объекта - это конкретный элемент множества объектов.
Класс - это множество предметов реального мира, связанных общностью структуры и поведением.
Элемент класса - это конкретный элемент данного множества класса.
Объект - это типичный представитель класса. Элемент класса и элемент объекта - равнозначные понятия.
- Особенности подхода:
- Инкапсуляция (сокрытие данных и методов для объекта).
- Полиморфизм (многотипность объекта; объект может принадлежать больше, чем к одному типу).
- Наследование (новые классы определяются путём добавления или переопределения данных и методов).
- Методы обогащения информации:
- Структурные (изменение параметров сообщения, в котором отображается информация в зависимости от свойств объекта).
- Статистические (накопление статистических данных, их обработка и выборка).
- Семантические (минимизация логической формы, выделение классификаций понятий, переход от частного к общему).
- Прагматические (из полученной информации избирается наиболее ценная информация для пользователя в соответствии с его целями и задачами при принятии решения).
Транспортирование информации.
OSI (Open System Intercongtcion - связь открытых систем) - эталонная модель сетевого обмена, разработанная международной организацией по стандартизации ISO.
- Уровни представления в OSI
- Физический (сетевые аппаратные средства - управление физическими цепями).
- Канальный (сетевое программное обеспечение - управление звеном сети - каналом).
- Сетевой (управление виртуальной цепью, маршрутизация пакетов данных в сети).
- Транспортный (контроль очерёдности пакетов и их принадлежности по аналогии с телефонной коммутацией).
- Сеансовый (управление и завершение виртуальной связи по аналогии с голосовой телефонией).
- Уровень представления (преобразование {конвертирование, сжатие, распаковка...} данных из формата передающего компьютера в формат компьютера-получателя).
- Прикладной (поддержка пользователя на более высоком прикладном и системном уровнях).
- Протоколы сетевого взаимодействия.
- Нижний уровень (канальный и физический уровни OSI, например: NDIS, ODI).
- Средний уровень (сетевой, транспортный и сеансовый уровни OSI, например: сеансовые и дейтаграммные протоколы).
- Верхний уровень (уровень представления и прикладной уровень OSI).
Обработка информации
- Обработка информации
- Последовательная (один процессор).
- Параллельная (несколько процессоров).
- Конвейерная (одни и те же ресурсы для решения различных задач).
- Последовательная и векторная.
- Основные процедуры:
- создание данных в результате выполнения некоторого алгоритма;
- модификация данных как результат отображения изменений в реальной предметной области;
- контроль, безопасность и целостность информации;
- поиск информации;
- поддержка принятия решения;
- создание сводок, документов, отчётов.
- Оценка и выбор стратегии:
- В условиях определённости (используются методы математического программирования).
- В условиях риска (вероятностные методы).
- В условиях неопределённости (на основе внешних оценок выигрыша).
- В условиях многокритериальности (методы моделирования).
Базовые термины: база данных, банк данных, система баз данных, хранилище данных (Data Warehouse), витрины (Data Mart), репозитарий.
База данных - совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулярной избыточностью. Для модификации и изменения применяется общий метод.
Банк данных - система, представляющая определённые услуги по хранению и поиску данных определённой группе пользователей по определённой тематике.
Система баз данных - это совокупность, которая состоит из следующих частей: управляющая система, прикладное программное обеспечения, база данных, операционная система и технические средства, обеспечивающих информационное обслуживание пользователей.
Хранилище данных (склад данных, информационное хранилище) - это база, хранящая данные, агрегированные по нескольким изменениям (то есть данные в хранилище собираются, концентрируются в зависимости от измерения), когда разнородные данные их предметной области имеют некоторые устойчивые связи. В зависимости от нужд пользователя устанавливается набор данных, необходимых программе. Как-то так. Данные никогда не удаляются. Пополнение хранилища осуществляется на периодической основе. Формирование новых типов (агрегатов) данных, зависящих от старых, - автоматическое. Доступ осуществляется на основе модели "гиперкуб" или "многомерный куб".
Витрины данных - множество тематических баз данных, содержащих информацию и относящихся к отдельным информационным аспектам предметной области.
Репозитарий - БД для хранения системных (не пользовательских!) данных.
- Уровни представлений для предметной области:
- Концептуальный : отличается разнообразием используемых моделей (модель "Сущность-связь", ER-модель, инфологическая модель и др.).
- Логический: иерархические (совокупность деревьев или лес), сетевые (орграф со связями "многие к одному") и реляционные модели данных (в виде таблиц (реляций) с отношениями на основе реляционной алгебры и теории отношений).
- Физический или внутренний: определяется конкретным методом управления данными; основные компоненты - записи, блоки, промежутки между блоками, служебная информация.
Классификация баз данных.
- По способу хранения:
- Интегрированные (хранящиеся в одном месте).
- Распределённые (в компьютерной сети).
- По типу пользователей:
- Монопользовательские.
- Многопользовательские.
- По характеру использования данных:
- Прикладные.
- Предметные.
- Способы реализации СУБД (системами управления базами данных):
- Программный.
- Аппаратный.
- Функции программных модулей СУБД:
- Описание данных на концептуальном и логическом уровнях.
- Загрузка данных.
- Хранение данных.
- Поиск и ответ на запрос (транзакция).
- Стандарты СУБД:
- Независимость данных на всех трёх уровнях.
- Универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ).
- Совместность, неизбыточность.
- Безопасность и целостность данных.
- Актуальность и управляемость.
Представление предметной области.

Пример концептуального представления предметной БД «СБЫТ».

Пример логического представления предметной БД «СБЫТ».

Критерии оценки БД.
Количественные: время, необходимое для ответа на запрос; стоимость модификации; стоимость памяти; время на создание; стоимость реорганизации и др.
Качественные: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность восстановления, возможность расширения и распределения и др.
Основные принципы организации хранилища данных (ХД).
- Предметная реализация: каждая оперативная БД поддерживает несколько предметных областей – источник для ХД.
- Средства интеграции: общий тип для разных представлений одних и тех же сущностей.
- Постоянство данных: за счет реализации модели «массовых загрузок» данных.
- Хронология данных.

Представление и использование информации.
- Факторы, имеющие наибольшее значение для деятельности человека:
- эргономические (рациональный набор функций человека, рациональное сопряжение человека с ТС и средой ИС);
- психологические ( психологический барьер, усложнение деятельности, др. субъективные факторы).
- Варианты интерфейсов в системе «человек-компьютер»:
- на основе меню: «Смотри и выбирай»;
- на основе языка команд: «Вспоминай и набирай».
Принципы разработки пользовательских интерфейсов.
- Пользовательский интерфейс целесообразно строить на основе концептуальной модели предметной области.
- Доступ к объектам и их экземплярам возможен только через систему окон различных типов (ряд окон должен быть связан с конкретным объектом).
- Сценарий работы пользователя с ИС включает две фазы: выбор окна и работа с окнами.
- Проектирование пользовательского интерфейса – процесс спецификации окон, по существу спецификация задает сценарий работы с экземплярами.
- Спецификацию окон следует проводить в соответствии с функциональной потребностью: выделять разделы, строить иерархию разделов, указывать допустимые режимы работы с экземплярами объекта.
Основные функции фазы выбора объектов.
- Работа с общим каталогом окон в главном разделе.
- Создание нового раздела.
- Удаление раздела.
- Редактирование описания раздела.
- Передача определений и окон между разделами.
- Движение по иерархии разделов.
- Отбор разделов для работы.
- Отбор окон для работы.