Технология баз данных как самостоятельная ветвь развития информатики появилась
База данных (БД) – именованная совокупность данных, отображающая состояние объектов и их отношений в рассматриваемой предметной области.
Создавая базу данных, стремятся упорядочить информацию по различным признакам и быстро извлекать выборку с произвольным сочетанием признаков. Это возможно, только если данные структурированы.
Структурирование – это введение соглашений о способах представления данных.
База данных (БД) – это поименованная совокупность структурированных данных, относящихся к определенной предметной области.
В развитии технологии баз данных выделяют 4 этапа.
Первый этап связан с развитием баз данных на больших машинах типа IBM 360/370, ЕС ЭВМ.
История развития систем управления базой данных (СУБД) насчитывает более 30 лет. В 1968 г. была введена в эксплуатацию первая промышленная СУБД фирмы IBM. В 1975 г. появился первый стандарт ассоциации по языкам систем обработки данных Conference of Data System Languages (CODASYL), определивший ряд фундаментальных понятий в теории баз систем данных. В 1981 г. Э.Ф. Кодд получил премию Тьюринга за разработку реляционной модели и реляционной алгебры.
Базы данных хранились во внешней памяти центральной ЭВМ, пользователями этих баз были задачи, запускаемые в основном в пакетном режиме. Интерактивный режим доступа обеспечивался с помощью консольных терминалов, не обладавших собственными вычислительными ресурсами. Эти системы относят к системам распределенного доступа.
Второй этап связан с появлением и развитием персональных компьютеров. На этом этапе преобладают настольные СУБД в частности: Dbase, FoxPro, Clipper, Paradox.
Третий этап. Начался процесс интеграции. Этот этап связан с развитием компьютерных сетей, поэтому остро встает задача согласованности данных хранящихся и обрабатываемых в разных местах и логически друг с другом не связанных. Успешное решение этих задач приводит к появлению распределенных баз данных.
Особенности этого этапа:
- поддержка структурной и языковой целостности;
- возможность работы на компьютерах с различной архитектурой;
- поддержка многопользовательского режима и возможность децентрализованного хранения данных.
К этому этапу относятся СУБД Access`97, Oracle 7.3(8.4), MS SQL 6.5(7.0) System 10(11).
Четвертый этап определяет перспективы развития СУБД. Этот этап характеризуется появлением новой технологии доступа к данным – интранет. В этой технологии не используется специализированное клиентское программное обеспечение. Для работы с удаленной базой данных можно применить Internet Explorer и др.
Создание базы данных предполагает решение целого комплекса проблем, в т.ч. разработку программных, языковых, организационных и технических средств, предназначенных для централизованного хранения и коллективного использования информации. Однако предварительно следует осуществить отбор этой самой информации (которая и составит фонд БД), структурировать ее. Здесь и начинаются основные сложности. При создании массива МЧД необходимо не только адекватно перевести информацию с бумажного носителя (хотя и эта проблема актуальна), но и сохранить саму возможность оперирования этой информацией не в меньшей степени, чем ранее. Фактически база данных должна представлять собой информационную модель исторического источника, либо проблемы, которая решается с помощью БД. Определение объекта базы данных принципиально важно, поскольку влияет как на отбор источников, так и на способы хранения.
Сегодня можно сформулировать основные требования к формированию исторической базы данных так:
точное воспроизведение содержания источника;
кодирование качественных признаков;
возможность агрегирования данных с определенной корректировкой;
возможности по поиску и анализу данных; [11, c. 203]
На данный момент можно констатировать значительную роль БД в исследовании любого историка, использующего в своей работе компьютер. Важным является то обстоятельство, что БД могут давать представление об исторических процессах как на макро-, так и на микро-уровне. Это, в свою очередь, убеждает в необходимости внедрения практики использования БД в исследовательскую деятельность историков, работающих в последнем направлении.
Заключение
Как видим, благодаря развитию информационных технологий исследование повседневной жизни белорусов в начале XX ст. может и должно проводиться на качественно новом уровне.
Чтобы достичь этого уровня, историк должен быть оснащён современной компьютерной техникой (современный ПК, цифровая звукозаписывающая техника, доступ в Интернет, программная обеспеченность).
Оформляя работу согласно требованиям ВАК, автор основательно изучил Инструкцию по оформлению диссертации, автореферата и публикаций по теме диссертации утверждённую Постановлением президиума Государственного высшего аттестационного комитета Республики Беларусь 24.12.1997 № 178 (в редакции постановления Высшей аттестационной комиссии Республики Беларусь 22.02.2006 № 2).
Список литературы к реферату
1. Блинова О. Н. Опыт изучения экономических программ политических партий России 1990-х гг.: методика применения контент-анализа // Круг идей: историческая информатика в информационном обществе. М., 2001. С. 213-214.
2. Л.И.Бородкин, И.М. Гарскова. Историческая информатика. М., 1994.
4. Гарскова И.М. Базы и банки данных в исторических исследованиях. М.,1994.
5. Дмитриева В.А., Святец Ю.А. Технологии баз данных в историческом исследовании: творчество без расчета на будущее? // Круг идей: традиции и тенденции исторической информатики. М.,1997.
6. Змитрович А.И. Базы данных. Минск, 1991.
8. Лихтер Ю.А. "Классификация древних материалов с использованием программы нечеткой классификации FuzzyClass" // ИБ АИК N26/27, ноябрь 2000.
10. Петров А.Н. Компьютерный анализ текста: историография метода // Круг идей: модели и технологии исторической информатики. М.,1996.
11. Разников С.В. База данных “Советские немцы — трудармейцы Тагиллага”: принципы создания, источники и методы обработки // Круг идей: историческая информатика в информационном обществе. М., 2001.
12. Сидорцов В. Н. Методология истории: количественные методы и информационные технологии. – Мн.:БГУ, 2003.
13. Методологические проблемы истории: учеб. пособие для студентов, магистрантов и аспирантов ист. и филос. Специальностей учреждений, обеспечивающих получение высш. образования / Под ред. В. Н. Сидорцова. – Мн.: ТетраСистемс, 2006.
История развития БД обусловлена появлением и развитием компьютерной техники и может быть разделена на три основных этапа. Начальный этап был ознаменован созданием первого поколения БД. Закономерно, что он совпал с периодом создания и развития больших ЭВМ (тат&ате), которые вместе с БД первого поколения составили аппаратно-программную платформу больших информационных систем. Технология баз данных возникла с реализацией 1М8 - программного продукта компании ШМ, который обеспечивал управление данными, организованными в форме иерархий. Важным вкладом 1М8 стало широкое распространение представления о том, что данные имеют самостоятельную ценность и что они должны управляться независимо от какого-либо отдельного приложения. Так возникла первая система управления БД или СУБД. До этого приложения обладали собственными файлами данных, которые часто дублировали данные из других файлов. При использовании систем БД дублирование данных существенно сократилось, что облегчило их поддержку.
Модели данных, - как IMS, так и ее весьма широко известный преемник СODASYL, - основывались на графовых структурах данных.
С одной стороны, БД первого поколения были, как правило, закрытыми системами, для которых не обеспечивалась переносимость (мобильность) прикладных программ. Эти БД не имели средств автоматизации программирования и были очень дороги. С другой стороны, они оказались на редкость долговечными: разработанное на их основе программное обеспечение используется и в наши дни, а большие ЭВМ по-прежнему хранят огромные массивы актуальной и сегодня информации.
Второй этап в развитии БД начался с создания реляционной модели данных
Для реляционных систем характерны:
- управление распределенными базами данных;
- параллельная обработка запросов и многопотоковая архитектура;
- технология тиражирования данных и ряд других современных достижений в области обработки данных.
Реляционные БД представляют собой сложные многофункциональные программные системы, действующие в открытой распределенной среде.
Тем временем уже в середине 80-х гг. появилась необходимость рассматривать вопросы, выходящие за рамки реляционной модели. Для хранения элементов данных реляционные СУБД поддерживали набор стандартных типов данных, таких как целые числа, числа с плавающей запятой и строки символов. Над этими данными можно выполнять набор стандартных, достаточно простых операций. Но уже скоро стало ясно, что традиционных типов данных реляционных СУБД и функций поиска SQL для обработки данных оказывается недостаточно. Кроме того, требования к приложениям, обрабатывающим данные, настолько различаются, что их невозможно удовлетворить за счет каких-либо предопределенных расширений языка. Поэтому потребовались не столько новые типы данных и новые функции, сколько средства, позволяющие определять новые типы данных и функции их обработки.
Эти задачи во многом решили объектно-ориентированные СУБД, появившиеся еще в начале 80-х годов, но ставшие полноценными коммерческими продуктами лишь в начале 90-х и ознаменовавшие третий этап в развитии БД.
Объектно-ориентированная модель данных и объектно-ориентированные БД основываются на принципах объектно-ориентированного программирования. Эта модель данных была первой попыткой создания постреляционной расширяемой модели данных.
Появились и постреляционные гибридные модели данных:
- объектно-реляционная модель данных, в которой объектно-ориентированные возможности встраиваются в реляционное основание;
- объединенная объектно-ориентированная модель данных, в которой объектно-ориентированные возможности встраиваются в модель данных, объединяющую сетевую и реляционную модели.
Объектно-ориентированные и объектно-реляционные БД являются представителями третьего поколения БД.
Сегодня же в БД все чаще возникает необходимость хранить и, что важнее всего, обрабатывать большие неструктурированные объекты - текст, графический образ, аудио, видео, анимацию; сложные структурированные данные - диаграммы, графики, таблицы, массивы; составные документы, которые объединяют элементы данных всех этих типов. Совокупность таких данных получила название мультимедийных данных, а БД, хранящие и обрабатывающие такие данные, названы мультимедийными БД.
На ближайшее десятилетие предусмотрены следующие основные направления развития БД:
- создание средств хранения и обработки графических образов. Современные СУБД уже позволяют хранить потенциально неограниченные битовые строки;
- разработка пространственных баз данных, в которых требуется работа с пространственной информацией (например, картографические приложения). Сегодня все развитые СУБД (Огас1е, DВ2 и т.д.) поддерживают управление пространственной информацией;
- разработка средств хранения и поиска в полнотекстовых базах данных, поддерживающих информационно-поисковые системы;
- создание расширяемых архитектур СУ БД на основе как реляционных, так и объектно-ориентированных и объектно-реляционных баз данных. При этом ведутся разработки полнофункциональных СУБД, поддерживающих возможности пользовательских расширений и инструментариев, позволяющих создавать необходимую пользователям систему;
- разработка методов организации добычи данных, хранилищ данных, репозитариев;
- разработка баз данных, основанных на правилах, и баз знаний.
Архитектура системы баз данных
Архитектура системы БД состоит из следующих четырех компонентов:
- аппаратное обеспечение (по сути является компьютером или компьютерной сетью, в которой создается система БД);
Физические данные - это данные, хранящиеся в памяти компьютера (оперативной или внешней). Физические данные представляют собой совокупность нулей и единиц (битов). Биты объединяются в последовательности байтов, слов и т.д. Оперативная память разбита на байты и слова, которым присваивается порядковый номер (адрес).
Поле - наименьшая поименованная единица данных.
Запись - поименованная совокупность полей.
Система управления файлами осуществляет распределение внешней памяти, отображение имен файлов в соответствующие адреса во внешней памяти и обеспечение доступа к данным.
Среди множества всевозможных файлов можно выделить следующие типы:
- файлы для хранения текстовых данных: документов, текстов программ и т.д.; такие файлы обычно образуются и модифицируются с помощью различных текстовых редакторов;
- файлы с текстами программ; такие файлы являются входными параметрами компиляторов, которые, в свою очередь, формируют файлы, содержащие объектные модули;
- файлы объектных модулей, логическая структура которых неизвестна файловой системе; эта структура поддерживается соответствующими программами систем программирования;
- файлы выполняемых программ, которые формируются редакторами связей (компоновщиками выполняемых программ); логическая структура таких файлов остается известной только редактору связей и программе-загрузчику, являющейся компонентом операционной системы.
Таким образом, файловые системы обычно обеспечивают хранение слабо структурированной информации, оставляя дальнейшую структуризацию прикладным программам. При этом системы управления файлами имеют следующие недостатки:
- в них не учитывается внутренняя структура записей, и они не могут обрабатывать запросы, предполагающие знание такой структуры;
- они имеют неудовлетворительную поддержку правил безопасности и целостности информации, а также практически не обеспечивают восстановление данных;
- на уровне управления файлами не создается словаря данных, содержащего данные о данных, т.е. метаданные;
- не обеспечивается независимость данных.
Система баз данных упрощенно может рассматриваться как компьютеризированная система хранения записей-данных, а сама база данных - как хранилище совокупности файлов данных, предназначенных для совместного использования. Пользователь такой системы БД имеет возможность выполнять целый ряд операций над записями:
- добавлять записи в БД;
- удалять записи из БД;
- модифицировать записи в БД;
- осуществлять поиск записей в БД и др.
Таким образом, система баз данных является компьютеризированной системой для хранения, изменения и предоставления информации (данных) по требованию.
Можно выделить три уровня внутренней архитектуры системы БД, которые одновременно отображают три уровня абстрагирования данных в БД:
- внутренний или физический уровень - это уровень, наиболее близкий к физическим данным;
- внешний уровень - это уровень, наиболее близкий к пользователям и способам представления данных для отдельных пользователей;
В данной статье приводится история появления и развития теории баз данных. Данный материал полезен по дисциплине МДК.04.03 " Системы управления базами данных" специальности 230115 СПО углубленной подготовки
История возникновения и развития баз данных
В истории вычислительной техники можно проследить развитие двух основных областей ее использования:
Первая область — применение вычислительной техники для выполнения численных расчетов, сложных алгоритмов обработки с помощью алгоритмических языков, но все они имеют дело с простыми структурами данных, объем которых невелик.
Вторая область — это использование средств вычислительной техники в автоматических или автоматизированных информационных системах. Информационная система представляет собой программно-аппаратный комплекс, обеспечивающий выполнение следующих функций:
- надежное хранение информации в памяти компьютера;
- выполнение специфических для данного приложения преобразований информации и вычислений;
- предоставление пользователям удобного и легко осваиваемого интерфейса.
Важным шагом в развитии именно информационных систем явился переход к использованию централизованных систем управления файлами.
Файл — это именованная область внешней памяти, в которую можно записывать и из которой можно считывать данные.
Правила именования файлов, способ доступа к данным, хранящимся в файле, и структура этих данных зависят от конкретной системы управления файлами и, возможно, от типа файла. Система управления файлами берет на себя распределение внешней памяти, отображение имен файлов в соответствующие адреса во внешней памяти и обеспечение доступа к данным. Пользователь ряд стандартных операций:
создать файл (требуемого типа и размера);
открыть ранее созданный файл;
прочитать из файла некоторую запись (текущую, следующую, предыдущую, первую, последнюю);
записать в файл на место текущей записи новую, добавить новую запись в конец файла.
Структура записи файла была известна только программе, которая с ним работала. Каждая программа, работающая с файлом, должна была иметь у себя внутри структуру данных, соответствующую структуре этого файла. Поэтому при изменении структуры файла требовалось изменять структуру программы, а это требовало новой компиляции. То есть это означает зависимость программ от данных. Информационные системы используются многими пользователями одновременно. При изменении структуры файлов необходимо изменять программы всех пользователей. А ведет дополнительные затраты на разработку.
Это было первым существенным недостатком файловых систем, который явился толчком к созданию новых систем хранения и управления информацией.
идентификатор пользователя, который создал этот файл, и фиксироваться, какие действия ему доступы и доступны для других пользователей группы.
Администрирование режимом доступа к файлу в основном выполняется его создателем-владельцем. Для множества файлов, отражающих информационную модель одной предметной области, такой децентрализованный принцип управления доступом вызывал дополнительные трудности. Отсутствие централизованных методов управления доступом к информации послужило еще одной причиной разработки СУБД.
Одновременная работа нескольких пользователей во многопользовательских ОС, связанная с модификацией данных в файле, либо вообще не реализовывалась, либо очень замедлена.
Все эти недостатки послужили развитию нового подхода к управлению информацией. Этот подход был реализован в СУБД (системах управления данными).
История развития СУБД насчитывает более 30 лет. В 1968 году была введена в эксплуатацию первая промышленная СУБД системаIMS фирмы IBM. В 1975 году появился первый стандарт ассоциации по языкам систем обработки данных — Conference of Data System Languages (CODASYL), который определил ряд фундаментальных понятий в теории систем баз данных, которые и до сих пор являются основополагающими для сетевой модели данных. В дальнейшее развитие теории баз данных большой вклад был сделан американским математиком Э. Ф. Коддом, который является создателем реляционной модели данных. В 1981 году Э. Ф. Кодд получил за создание реляционной модели и реляционной алгебры престижную премию Тьюринга Американской ассоциации по вычислительной технике.
Развитие вычислительной техники повлияло также и на развитие технологии баз данных. Можно выделить четыре этапа в развитии данного направления в обработке данных.
Первый этап развития СУБД связан с организацией баз данных на больших машинах типа IBM 360/370, ЕС-ЭВМ и мини-ЭВМ типа PDP11 (фирмы Digital Equipment Corporation — DEC), разных моделях HP (фирмы Hewlett Packard).
Базы данных хранились во внешней памяти центральной ЭВМ, пользователями этих баз данных были задачи, запускаемые в основном в пакетном режиме. Интерактивный режим доступа обеспечивался с помощью консольных терминалов, которые не обладали собственными вычислительными ресурсами (процессором, внешней памятью) и служили только устройствами ввода-вывода для центральной ЭВМ. Программы доступа к БД писались на различных языках и запускались как обычные числовые программы.
Особенности этого этапа развития выражаются в следующем:
Все СУБД базируются на мощных мультипрограммных операционных системах (MVS, SVM, RTE, OSRV, RSX, UNIX), поэтому в основном поддерживается работа с централизованной базой данных в режиме распределенного доступа.
Функции управления распределением ресурсов в основном осуществляются операционной системой (ОС).
Поддерживаются языки низкого уровня манипулирования данными, ориентированные на навигационные методы доступа к данным.
Значительная роль отводится администрированию данных.
Проводятся серьезные работы по обоснованию и формализации реляционной модели данных, и была создана первая система (System R), реализующая идеологию реляционной модели данных.
Проводятся теоретические работы по оптимизации запросов и управлению распределенным доступом к централизованной БД, было введено понятие транзакции.
Результаты научных исследований открыто обсуждаются в печати, идет мощный поток общедоступных публикаций, касающихся всех аспектов теории и практики баз данных, и результаты теоретических исследований активно внедряются в коммерческие СУБД.
Появляются первые языки высокого уровня для работы с реляционной моделью данных. Однако отсутствуют стандарты для этих первых языков.
2 этап – это этап развития персональных компьютеров.
Особенности этого этапа следующие:
Все СУБД были рассчитаны на создание БД в основном с монопольным доступом.
Большинство СУБД имели развитый и удобный пользовательский интерфейс. В большинстве существовал интерактивный режим работы с БД как в рамках описания БД, так и в рамках проектирования запросов. Кроме того, большинство СУБД предлагали развитый и удобный инструментарий для разработки готовых приложений без программирования ( на основе готовых шаблонов форм, конструкторов запросов).
Во всех СУБД поддерживался только внешний уровень представления реляционной модели, то есть только внешний табличный вид структур данных.
При наличии высокоуровневых языков манипулирования данными типа реляционной алгебры и SQL в настольных СУБД поддерживались низкоуровневые языки манипулирования данными на уровне отдельных строк таблиц.
В настольных СУБД отсутствовали средства поддержки ссылочной и структурной целостности базы данных. Эти функции должны были выполнять приложения.
Наличие монопольного режима работы фактически привело к вырождению функций администрирования БД и в связи с этим — к отсутствию инструментальных средств администрирования БД.
сравнительно скромные требования к аппаратному обеспечению со стороны настольных СУБД.
Представители этого семейства — очень широко использовавшиеся до недавнего времени СУБД Dbase (DbaseIII+, DbaseIV), FoxPro, Clipper, Paradox.
3 этап - распределенные базы данных (переход от персонализации к интеграции)
Особенности этого этапа:
Практически все современные СУБД обеспечивают поддержку полной реляционной модели , а именно:
О структурной целостности — допустимыми являются только данные, представленные в виде отношений реляционной модели;
О языковой целостности, то есть языков манипулирования данными высокого уровня (в основном SQL);
О ссылочной целостности, контроля за соблюдением ссылочной целостности в течение всего времени функционирования системы, и гарантий невозможности со стороны СУБД нарушить эти ограничения.
Большинство современных СУБД рассчитаны на многоплатформенную архитектуру, то есть они могут работать на компьютерах с разной архитектурой и под разными операционными системами.
Необходимость поддержки многопользовательской работы с базой данных и возможность децентрализованного хранения данных потребовали развития средств администрирования БД с реализацией общей концепции средств защиты данных.
Создание теоретических трудов по оптимизации реализаций распределенных БД и работе с распределенными транзакциями и запросами с внедрением полученных результатов в коммерческие СУБД.
Для того чтобы не потерять клиентов, которые ранее работали на настольных СУБД, практически все современные СУБД имеют средства подключения клиентских приложений, разработанных с использованием настольных СУБД, и средства экспорта данных из форматов настольных СУБД второго этапа развития.
Разработка стандартов языков описания и манипулирования данными SQL89, SQL92, SQL99 и технологий по обмену данными между различными СУБД.
Разработка концепцией объектно-ориентированных БД — ООБД. Представителями СУБД, относящимся к второму этапу, можно считать MS Access 97 и все современные серверы баз данных Oracle7.3,Oracle 8.4 MS SQL6.5, MS SQL7.0, System 10, System 11, Informix, DB2, SQL Base и другие современные серверы баз данных, которых в настоящий момент насчитывается несколько десятков.
4 этап характеризуется появлением новой технологии доступа к данным — интранет.
Основное отличие этого подхода от технологии клиент-сервер состоит в том, что отпадает необходимость использования специализированного клиентского программного обеспечения. Для работы с удаленной базой данных используется стандартный браузер.
При этом встроенный в загружаемые пользователем HTML-страницы код, написанный обычно на языке Java, Java-script, Perl и других, отслеживает все действия пользователя и транслирует их в низкоуровневые SQL-запросы к базе данных, выполняя, таким образом, ту работу, которой в технологии клиент-сервер занимается клиентская программа. Сложные задачи реализованы в архитектуре "клиент-сервер" с разработкой специального клиентского программного обеспечения.
Читайте также: