Что называется файлом в прикладной программе
История систем управления данными во внешней памяти начинается еще с магнитных лент, но современный облик они приобрели с появлением магнитных дисков. До этого каждая прикладная программа сама решала проблемы именования данных и их структуризации во внешней памяти . Это затрудняло поддержание на внешнем носителе нескольких архивов долговременно хранящейся информации. Историческим шагом стал переход к использованию централизованных систем управления файлами . Система управления файлами берет на себя распределение внешней памяти , отображение имен файлов в адреса внешней памяти и обеспечение доступа к данным.
Файловая система - это часть операционной системы, назначение которой состоит в том, чтобы организовать эффективную работу с данными, хранящимися во внешней памяти , и обеспечить пользователю удобный интерфейс при работе с такими данными. Организовать хранение информации на магнитном диске непросто. Это требует, например, хорошего знания устройства контроллера диска, особенностей работы с его регистрами. Непосредственное взаимодействие с диском - прерогатива компонента системы ввода-вывода ОС, называемого драйвером диска. Для того чтобы избавить пользователя компьютера от сложностей взаимодействия с аппаратурой, была придумана ясная абстрактная модель файловой системы. Операции записи или чтения файла концептуально проще, чем низкоуровневые операции работы с устройствами.
Основная идея использования внешней памяти состоит в следующем. ОС делит память на блоки фиксированного размера, например, 4096 байт. Файл , обычно представляющий собой неструктурированную последовательность однобайтовых записей, хранится в виде последовательности блоков (не обязательно смежных); каждый блок хранит целое число записей. В некоторых ОС (MS-DOS) адреса блоков, содержащих данные файла , могут быть организованы в связный список и вынесены в отдельную таблицу в памяти. В других ОС (Unix) адреса блоков данных файла хранятся в отдельном блоке внешней памяти (так называемом индексе или индексном узле). Этот прием, называемый индексацией , является наиболее распространенным для приложений, требующих произвольного доступа к записям файлов . Индекс файла состоит из списка элементов, каждый из которых содержит номер блока в файле и сведения о местоположении данного блока. Считывание очередного байта осуществляется с так называемой текущей позиции, которая характеризуется смещением от начала файла . Зная размер блока, легко вычислить номер блока, содержащего текущую позицию. Адрес же нужного блока диска можно затем извлечь из индекса файла . Базовой операцией, выполняемой по отношению к файлу , является чтение блока с диска и перенос его в буфер , находящийся в основной памяти.
Файловая система позволяет при помощи системы справочников ( каталогов , директорий ) связать уникальное имя файла с блоками вторичной памяти, содержащими данные файла . Иерархическая структура каталогов , используемая для управления файлами , может служить другим примером индексной структуры. В этом случае каталоги или папки играют роль индексов, каждый из которых содержит ссылки на свои подкаталоги. С этой точки зрения вся файловая система компьютера представляет собой большой индексированный файл . Помимо собственно файлов и структур данных, используемых для управления файлами ( каталоги , дескрипторы файлов , различные таблицы распределения внешней памяти ), понятие " файловая система " включает программные средства , реализующие различные операции над файлами .
Перечислим основные функции файловой системы.
- Идентификация файлов . Связывание имени файла с выделенным ему пространством внешней памяти .
- Распределение внешней памяти между файлами . Для работы с конкретным файлом пользователю не требуется иметь информацию о местоположении этого файла на внешнем носителе информации. Например, для того чтобы загрузить документ в редактор с жесткого диска, нам не нужно знать, на какой стороне какого магнитного диска, на каком цилиндре и в каком секторе находится данный документ.
- Обеспечение надежности и отказоустойчивости. Стоимость информации может во много раз превышать стоимость компьютера.
- Обеспечение защиты от несанкционированного доступа.
- Обеспечение совместного доступа к файлам , так чтобы пользователю не приходилось прилагать специальных усилий по обеспечению синхронизации доступа.
- Обеспечение высокой производительности.
Иногда говорят, что файл - это поименованный набор связанной информации, записанной во вторичную память. Для большинства пользователей файловая система - наиболее видимая часть ОС. Она предоставляет механизм для онлайнового хранения и доступа как к данным, так и к программам для всех пользователей системы. С точки зрения пользователя, файл - единица внешней памяти , то есть данные, записанные на диск, должны быть в составе какого-нибудь файла .
Важный аспект организации файловой системы - учет стоимости операций взаимодействия с вторичной памятью. Процесс считывания блока диска состоит из позиционирования считывающей головки над дорожкой, содержащей требуемый блок, ожидания, пока требуемый блок сделает оборот и окажется под головкой, и собственно считывания блока. Для этого требуется значительное время (десятки миллисекунд). В современных компьютерах обращение к диску осуществляется примерно в 100 000 раз медленнее, чем обращение к оперативной памяти. Таким образом, критерием вычислительной сложности алгоритмов, работающих с внешней памятью , является количество обращений к диску.
В данной лекции рассматриваются вопросы структуры, именования, защиты файлов ; операции , которые разрешается производить над файлами ; организация файлового архива (полного дерева справочников). Проблемы выделения дискового пространства, обеспечения производительной работы файловой системы и ряд других вопросов, интересующих разработчиков системы, вы найдете в следующей лекции.
Общие сведения о файлах
Имена файлов
Файлы представляют собой абстрактные объекты. Их задача - хранить информацию, скрывая от пользователя детали работы с устройствами. Когда процесс создает файл , он дает ему имя. После завершения процесса файл продолжает существовать и через свое имя может быть доступен другим процессам.
Правила именования файлов зависят от ОС. Многие ОС поддерживают имена из двух частей (имя+расширение), например progr.c ( файл , содержащий текст программы на языке Си) или autoexec.bat ( файл , содержащий команды интерпретатора командного языка). Тип расширения файла позволяет ОС организовать работу с ним различных прикладных программ в соответствии с заранее оговоренными соглашениями. Обычно ОС накладывают некоторые ограничения, как на используемые в имени символы, так и на длину имени файла . В соответствии со стандартом POSIX, популярные ОС оперируют удобными для пользователя длинными именами (до 255 символов).
Типы файлов
Важный аспект организации файловой системы и ОС - следует ли поддерживать и распознавать типы файлов . Если да, то это может помочь правильному функционированию ОС, например не допустить вывода на принтер бинарного файла .
Основные типы файлов : регулярные (обычные) файлы и директории (справочники, каталоги ). Обычные файлы содержат пользовательскую информацию. Директории - системные файлы , поддерживающие структуру файловой системы. В каталоге содержится перечень входящих в него файлов и устанавливается соответствие между файлами и их характеристиками ( атрибутами ). Мы будем рассматривать директории ниже.
Напомним, что хотя внутри подсистемы управления файлами обычный файл представляется в виде набора блоков внешней памяти , для пользователей обеспечивается представление файла в виде линейной последовательности байтов. Такое представление позволяет использовать абстракцию файла при работе с внешними устройствами, при организации межпроцессных взаимодействий и т. д. Так, например, клавиатура обычно рассматривается как текстовый файл , из которого компьютер получает данные в символьном формате. Поэтому иногда к файлам приписывают другие объекты ОС, например специальные символьные файлы и специальные блочные файлы , именованные каналы и сокеты, имеющие файловый интерфейс. Эти объекты рассматриваются в других разделах данного курса.
Далее речь пойдет главным образом об обычных файлах.
Обычные (или регулярные) файлы реально представляют собой набор блоков (возможно, пустой) на устройстве внешней памяти , на котором поддерживается файловая система. Такие файлы могут содержать как текстовую информацию (обычно в формате ASCII), так и произвольную двоичную (бинарную) информацию.
Текстовые файлы содержат символьные строки, которые можно распечатать, увидеть на экране или редактировать обычным текстовым редактором.
Другой тип файлов - нетекстовые, или бинарные, файлы . Обычно они имеют некоторую внутреннюю структуру. Например, исполняемый файл в ОС Unix имеет пять секций: заголовок, текст, данные, биты реаллокации и символьную таблицу. ОС выполняет файл , только если он имеет нужный формат. Другим примером бинарного файла может быть архивный файл . Типизация файлов не слишком строгая.
Обычно прикладные программы, работающие с файлами , распознают тип файла по его имени в соответствии с общепринятыми соглашениями. Например, файлы с расширениями .c , .pas , .txt - ASCII-файлы, файлы с расширениями .exe - выполнимые, файлы с расширениями .obj , .zip - бинарные и т. д.
Атрибуты файлов
Кроме имени ОС часто связывают с каждым файлом и другую информацию, например дату модификации, размер и т. д. Эти другие характеристики файлов называются атрибутами . Список атрибутов в разных ОС может варьироваться. Обычно он содержит следующие элементы: основную информацию (имя, тип файла ), адресную информацию (устройство, начальный адрес, размер), информацию об управлении доступом (владелец, допустимые операции) и информацию об использовании (даты создания, последнего чтения, модификации и др.).
Список атрибутов обычно хранится в структуре директорий (см. следующую лекцию) или других структурах, обеспечивающих доступ к данным файла .
Организация файлов и доступ к ним
Программист воспринимает файл в виде набора однородных записей. Запись - это наименьший элемент данных , который может быть обработан как единое целое прикладной программой при обмене с внешним устройством. Причем в большинстве ОС размер записи равен одному байту. В то время как приложения оперируют записями, физический обмен с устройством осуществляется большими единицами (обычно блоками). Поэтому записи объединяются в блоки для вывода и разблокируются - для ввода. Вопросы распределения блоков внешней памяти между файлами рассматриваются в следующей лекции.
ОС поддерживают несколько вариантов структуризации файлов .
Последовательный файл
Простейший вариант - так называемый последовательный файл . То есть файл является последовательностью записей. Поскольку записи, как правило, однобайтовые, файл представляет собой неструктурированную последовательность байтов.
Обработка подобных файлов предполагает последовательное чтение записей от начала файла , причем конкретная запись определяется ее положением в файле . Такой способ доступа называется последовательным (модель ленты). Если в качестве носителя файла используется магнитная лента, то так и делается. Текущая позиция считывания может быть возвращена к началу файла ( rewind ).
Файл прямого доступа
В реальной практике файлы хранятся на устройствах прямого (random) доступа, например на дисках, поэтому содержимое файла может быть разбросано по разным блокам диска, которые можно считывать в произвольном порядке. Причем номер блока однозначно определяется позицией внутри файла .
Здесь имеется в виду относительный номер, специфицирующий данный блок среди блоков диска, принадлежащих файлу . О связи относительного номера блока с абсолютным его номером на диске рассказывается в следующей лекции.
Естественно, что в этом случае для доступа к середине файла просмотр всего файла с самого начала не обязателен. Для специфицирования места, с которого надо начинать чтение, используются два способа: с начала или с текущей позиции, которую дает операция seek. Файл , байты которого могут быть считаны в произвольном порядке, называется файлом прямого доступа .
Таким образом, файл , состоящий из однобайтовых записей на устройстве прямого доступа, - наиболее распространенный способ организации файла . Базовыми операциями для такого рода файлов являются считывание или запись символа в текущую позицию. В большинстве языков высокого уровня предусмотрены операторы посимвольной пересылки данных в файл или из него.
Подобную логическую структуру имеют файлы во многих файловых системах, например в файловых системах ОС Unix и MS-DOS. ОС не осуществляет никакой интерпретации содержимого файла . Эта схема обеспечивает максимальную гибкость и универсальность. С помощью базовых системных вызовов (или функций библиотеки ввода/вывода) пользователи могут как угодно структурировать файлы . В частности, многие СУБД хранят свои базы данных в обычных файлах .
Другие формы организации файлов
Известны как другие формы организации файла , так и другие способы доступа к ним, которые использовались в ранних ОС, а также применяются сегодня в больших мэйнфреймах (mainframe), ориентированных на коммерческую обработку данных.
Другой способ представления файлов - последовательность записей переменной длины, каждая из которых содержит ключевое поле в фиксированной позиции внутри записи (см. рис. 11.1). Базисная операция в данном случае - считать запись с каким-либо значением ключа. Записи могут располагаться в файле последовательно (например, отсортированные по значению ключевого поля) или в более сложном порядке. Метод доступа по значению ключевого поля к записям последовательного файла называется индексно-последовательным.
Рис. 11.1. Файл как последовательность записей переменной длины
В некоторых системах ускорение доступа к файлу обеспечивается конструированием индекса файла . Индекс обычно хранится на том же устройстве, что и сам файл , и состоит из списка элементов, каждый из которых содержит идентификатор записи, за которым следует указание о местоположении данной записи. Для поиска записи вначале происходит обращение к индексу, где находится указатель на нужную запись. Такие файлы называются индексированными, а метод доступа к ним - доступ с использованием индекса.
Предположим, у нас имеется большой несортированный файл , содержащий разнообразные сведения о студентах, состоящие из записей с несколькими полями, и возникает задача организации быстрого поиска по одному из полей, например по фамилии студента. Рис. 11.2 иллюстрирует решение данной проблемы - организацию метода доступа к файлу с использованием индекса.
Рис. 11.2. Пример организации индекса для последовательного файла
Следует отметить, что почти всегда главным фактором увеличения скорости доступа является избыточность данных.
Способ выделения дискового пространства при помощи индексных узлов, применяемый в ряде ОС (Unix и некоторых других, см. следующую лекцию), может служить другим примером организации индекса.
В этом случае ОС использует древовидную организацию блоков, при которой блоки, составляющие файл , являются листьями дерева, а каждый внутренний узел содержит указатели на множество блоков файла . Для больших файлов индекс может быть слишком велик. В этом случае создают индекс для индексного файла (блоки промежуточного уровня или блоки косвенной адресации).
Правильные ответы выделены зелёным цветом.
Все ответы: Данный курс предназначен для получения студентами представления об основных понятиях при работе с базой данных. Даются классификации баз данных и систем управления данными в рамках предмета "Информатика". Помимо лекций включены задания по лабораторным работам (2 работы со связанными списками и 4 лабораторные работы СУБД MS Access).
(1) описание некоторой сущности в виде совокупности логически связанных реквизитов
(2) имеет множество реализации - экземпляров, каждый из которых представлен совокупностью конкретных значений реквизитов
(3) двумерный массив в виде совокупности связанных реквизитов
(4) описание некоторой сущности в виде совокупности аналитически связанных реквизитов
(1) состоит из нескольких частей, хранимых в различных ЭВМ вычислительной сети (работа с такой БД происходит с помощью СУБД)
(2) в памяти одной вычислительной системы (применяется в локальных сетях ПК)
(3) состоит из одной части, которая хранится в памяти одной вычислительной системы
(4) состоит из нескольких частей, хранимых в одной ЭВМ (применяется в локальных сетях ПК)
(5) состоит из нескольких программ соединенных в одну БД
Если данные представлены в виде древовидной структуры, то такая модель является .
Для реляционных отношений характерны следующие особенности
(1) любой тип записи содержит только простые (по структуре) элементы данных
(3) порядок кортежей в таблице имеет существенное значение
(4) тип записи содержит сложные элементы групповых отношений
(5) описание сущности в виде совокупности связанных реквизитов
(1) - это именованная область внешней памяти, в которую можно записывать и из которой можно считывать данные
(2) - это имя данных, которые применяются для создания программы
(3) - это область, которая находится во внешней памяти и применяется для создания программы
(4) - это имя поименованных данных, которые можно изменять
(5) - это именованная область внутренней памяти, в которую записываются данные
(1) относительной независимости логической и физической организации данных
(2) полной независимости логической и физической организации данных
(5) совместимости шифрования и программного обеспечения
Если данные имеют сложную структуру и предназначены для создания крупных БД, то такая модель является .
(1) аппарат ограничений на формирование отношений (таблиц), который позволяет устранить дублирование
(2) аппарат, который обеспечивает непротиворечивость хранимых в базе данных
(1) в виде алгоритмов решения задач с помощью геометрических последовательностей
(3) в виде алгоритмов, процедур и эвристических последовательностей
(4) в виде алгоритмов задач, арифметических последовательностей
(1) это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями
(3) это совокупность нескольких программ предназначенных для совместного использования БД многими пользователями
(4) состоит из совокупности файлов расположенных на одной машине
(5) это совокупность программных средств, для создания файлов в БД
(1) означает полную защищенность внешних схем от изменений, вносимых в концептуальную схему
(2) означает защищенность концептуальной схемы от изменений, вносимых во внутреннюю схему
(3) тем группам пользователей, которых эти изменения не касаются, не потребуется вносить изменения в свои программы
(4) пользователем могут быть замечены изменения только в общей производительности системы
(5) означает не защищенность внешних схем от вмешательства извне
(1) зависимость, при которой в экземпляре информационного объекта определенному значению ключевого реквизита соответствует только одно значение описательного реквизита
(2) зависимость, при которой в экземпляре информационного объекта определенному значению ключевого реквизита соответствует много значений описательного реквизита
(3) значения ключевого реквизита соответствует определенное групповое отношение
(4) зависимость группового отношения от реквизитов БД
(5) зависимость ключевого фактора от описательной характеристики
(1) называется языком описания схем, - для построения структуры таблиц БД
(2) называется язык для заполнения БД данными и операций обновления
(3) язык поиска наборов величин в файле в соответствии с заданной совокупностью критериев поиска и выдачи затребованных данных без изменения содержимого файлов и БД
Для групповых отношений в иерархической модели обеспечивается
(1) полуавтоматический режим включения и фиксированное членство
(3) автоматизированный режим включения и не фиксированное членство
(4) автоматический режим включения и фиксированное членство
(5) ручной режим включения и не фиксированное членство
При соответствии записи одной таблицы нескольким записям другой таблицы отношения называются
(1) совокупность правил изученных в результате обучения
(2) совокупность факторов полученных опытным способом
(3) совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача
(4) совокупность эвристических правил построенных экспериментальным методом
(5) совокупность факторов, с помощью которых строится общество
(1) непосредственное управление данными во внешней памяти
(1) в том, что в сетевой модели запись может быть членом более чем одного группового отношения
(2) в том, что в сетевой модели запись не может быть членом более чем одного группового отношения
(3) в том, что в иерархической модели запись может быть членом более чем одного группового отношения
(4) в том, что в иерархической модели запись не может быть членом более чем одного группового отношения
(2) набор стандартов для решения задач связанных с базами данных
(1) позволяют определять представления БД, фактически являющиеся хранимыми в БД запросами
На этапе формулирования и анализа требований устанавливаются
(1) развитые средства управления данными во внешней памяти на низком уровне
(2) возможность экономии памяти за счет разделения подобъектов
(3) высокий уровень требований к знаниям о физической организации БД
(5) возможность разделения памяти на физическом уровне
(2) это инструмент для анализа, выбора и изменения данных
(3) специальный формат экрана, используемый для ввода данных в таблицу и просмотра их
(4) это гибкое и эффективное средство для организации данных
(5) объект, представляющий собой структурированное описание одного или нескольких действий, которые должен выполнить Access в ответ на определенное событие
(2) минимизировать возможные структурные изменения БД при процедурах обновления
(1) отсутствуют мощные непроцедурные средства извлечения объектов из базы
(2) можно рассматривать послойно, на разных уровнях абстракции
(3) вместо чисто декларативных ограничений целостности или полудекларативных триггеров для обеспечения внутренней целостности приходится писать процедурный код
(4) представляет более совершенные средства для отображения реального мира
(5) присутствуют общие средства манипулирования данными
(1) атрибуты, представляющие собой копии ключей других отношений
(2) ключ, состоящий из единственного поля таблицы, значения которого уникальны для каждой записи
(3) ключ, составленный из нескольких полей, совокупность значений которых гарантирует уникальность
Какое направление развития СУБД характеризуется применением вычислительной техники для выполнения численных расчетов?
Архитектуры систем централизованных БД с сетевым доступом подразделяются
Если данные представлены в виде произвольного графа, то такая модель является
(1) в виде совокупности упорядоченных нормализованных отношений
(2) в виде определенной процедуры проектирования нормальных отношений
(5) в виде совокупности эффективных средств для формирования БД
(2) последовательность правил перехода от исходных данных к результату
(3) процедура расчета данных, построенная на геометрическом подходе
(4) процедура расчета данных, построенная на алгоритмическом подходе
(5) последовательность операций чередующих алгоритмический и геометрический подходы
(4) иерархическое отношение между записями двух типов
Таблица, находящаяся во второй нормальной форме, должна удовлетворять следующим правилам
(1) таблица должна содержать данные об одном типе объектов
(2) все поля, не имеющие ключа, должны определяться полным уникальным идентификатором данной таблицы
(1) уровнем знаний субъекта и степенью его восприятия
(1) называется языком описания схем, - для построения структуры таблиц БД
(2) называется язык для заполнения БД данными и операций обновления
(3) язык поиска наборов величин в файле в соответствии с заданной совокупностью критериев поиска и выдачи затребованных данных без изменения содержимого файлов и БД
Иерархическая модель реализует отношение между исходной и дочерней записью
(1) это инструмент для анализа, выбора и изменения данных
(2) специальный формат экрана, используемый для ввода данных в таблицу и просмотра их
(3) это гибкое и эффективное средство для организации данных
(4) инструмент с помощью которого удобно располагать информацию
(5) запоминание с помощью программ всех данных находящихся во внешней памяти
(3) использование подготовленных объектов для наполнения базы использование подготовленных объектов для получения данных из БД
(4) использование концептуальных моделей для строительства БД
Способ упорядочения подчиненных записей в сетевой модели:
(1) специальный формат экрана, используемый для ввода данных в таблицу и просмотра их
(3) это инструмент для анализа, выбора и изменения данных
(4) гибкое и эффективное средство для организации данных при выводе на печать
(5) объект, содержащий программы, написанные на языке Visual Basic для приложений
(1) это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями
(2) это основа для будущего наращивания прикладных программ: базы данных должны обеспечивать возможность быстрой и дешевой разработки новых приложений
(3) это запросы на данные, которые обрабатываются с помощью высокоуровневого языка
(4) это существующие программы и логические структуры данных для внесения изменений в базу данных
(5) это совокупность взаимодействия конечных пользователей с системой для обеспечения конечным пользователям возможности получения данных без использования прикладных программ
Буферизация данных в оперативной памяти необходима
(1) для увеличения скорости обмена данными с внешней памятью
(4) для сглаживания различий между оперативной и внешней памятью
Ограничение целостности в иерархической модели подразумевает
(1) никакой потомок не может существовать без предка
(2) не обеспечивается автоматическое поддержание соответствия парных записей, входящих в разные иерархии
(4) обеспечивает автоматический режим для разных иерархий
(5) обеспечивается ручным вводом данных на разных слоях иерархий
(1) атрибуты, представляющие собой копии ключей других отношений
(2) ключ, состоящий из единственного поля таблицы, значения которого уникальны для каждой записи
(3) ключ, составленный из нескольких полей, совокупность значений которых гарантирует уникальность
(5) взаимодействие с конечными пользователями программ
(1) последовательность операций над БД, рассматриваемых СУБД как единое целое
(4) последовательность программных операций для создания единой БД
(2) доступность для новых пользователей, адаптивность
(5) время на создание отчета, доступность для других пользователей
Структура объектной модели описываются с помощью ключевых понятий
Отношение называется нормализованным или приведенным к первой нормальной форме
(2) если Описательные реквизиты информационного объекта логически связаны с общим для них ключом
(3) если функциональная зависимость позволяет выделить самостоятельные информационные объекты
(5) если атрибуты представляют, из себя групповые отношения
(1) реализуются как программный продукт, способный функционировать на ЭВМ
(2) реализуются как программный продукт, поставляемый пользователям как коммерческое изделие
(3) создаются в особых случаях, реализуются как программный продукт
(5) реализуются как программный продукт для отдельных предприятий
Причинами низкой эффективности проектируемых БД могут быть
(1) разорвать связь между записью-владельцем и записью-членом
(2) нефиксированные данные удалить вместе с владельцем
(3) извлечь записи последовательно по значению ключа
(4) предварительно исключить из группового отношения фиксированные данные
(5) извлечь записи непоследовательно в произвольном порядке
(1) объект, представляющий собой структурированное описание одного или нескольких действий, которые должен выполнить Access в ответ на определенное событие
(2) объект, содержащий программы, написанные на языке Visual Basic для приложений
Файловая система . На каждом носителе информации (гибком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске определяется используемой файловой системой.
Каждый диск разбивается на две области: обла сть хранения файлов и каталог. Каталог содержит имя файла и указание на начало его размещения на диске. Если провести аналогию диска с книгой, то область хранения файлов соответствует ее содержанию, а каталог - оглавлению. Причем книга состоит из страниц, а диск - из секторов.
Для дисков с небольшим количеством файлов (до нескольких десятков) может использоваться одноуровневая файловая система , когда каталог (оглавление диска) представляет собой линейную последовательность имен файлов (табл. 1.2). Такой каталог можно сравнить с оглавлением детской книжки, которое содержит только названия отдельных рассказов.
Если на диске хранятся сотни и тысячи файлов, то для удобства поиска используется многоуровневая иерархическая файловая система , которая имеет древовидную структуру. Такую иерархическую систему можно сравнить, например, с оглавлением данного учебника, которое представляет собой иерархическую систему разделов, глав, параграфов и пунктов.
Начальный, корневой каталог содержит вложенные каталоги 1-го уровня, в свою очередь, каждый из последних может содержать вложенные каталоги 2-го уровня и так далее. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы.
Например, в корневом каталоге могут находиться два вложенных каталога 1-го уровня (Каталог_1, Каталог_2) и один файл (Файл_1). В свою очередь, в каталоге 1-го уровня (Каталог_1) находятся два вложенных каталога второго уровня (Каталог_1.1 и Каталог_1.2) и один файл (Файл_1.1) - рис. 1.3.
Файловая система - это система хранения файлов и организации каталогов.
Рассмотрим иерархическую файловую систему на конкретном примере. Каждый диск имеет логическое имя (А:, В: - гибкие диски, С:, D:, Е: и так далее - жесткие и лазерные диски).
Пусть в корневом каталоге диска С: имеются два каталога 1-го уровня (GAMES, TEXT), а в каталоге GAMES один каталог 2-го уровня (CHESS). При этом в каталоге TEXT имеется файл proba.txt, а в каталоге CHESS - файл chess.exe (рис. 1.4).
Рис. 1.4. Пример иерархической файловой системы |
Путь к файлу . Как найти имеющиеся файлы (chess.exe, proba.txt) в данной иерархической файловой системе? Для этого необходимо указать путь к файлу. В путь к файлу входят записываемые через разделитель "\" логическое имя диска и последовательность имен вложенных друг в друга каталогов, в последнем из которых содержится нужный файл. Пути к вышеперечисленным файлам можно записать следующим образом:
Путь к файлу вместе с именем файла называют иногда полным именем файла.
Пример полного имени файла:
Представление файловой системы с помощью графического интерфейса . Иерархическая файловая система MS-DOS, содержащая каталоги и файлы, представлена в операционной системе Windows с помощью графического интерфейса в форме иерархической системы папок и документов. Папка в Windows является аналогом каталога MS-DOS
Однако иерархическая структура этих систем несколько различается. В иерархической файловой системе MS-DOS вершиной иерархии объектов является корневой каталог диска, который можно сравнить со стволом дерева, на котором растут ветки (подкаталоги), а на ветках располагаются листья (файлы).
В Windows на вершине иерархии папок находится папка Рабочий стол. Следующий уровень представлен папками Мой компьютер, Корзина и Сетевое окружение (если компьютер подключен к локальной сети) - рис. 1.5.
Рис. 1.5. Иерархическая структура папок |
Если мы хотим ознакомиться с ресурсами компьютера, необходимо открыть папку Мой компьютер.
1. В окне Мой компьютер находятся значки имеющихся в компьютере дисков. Активизация (щелчок) значка любого диска выводит в левой части окна информацию о его емкости, занятой и свободной частях.
Файл – это поименованная область внешней памяти.
Операции над файлами:
- Копирование
- Перемещение
- Переименование
- Удаление
- Поиск
Маска представляет собой последовательность букв, цифр и прочих допустимых символов, среди которых также могут встречаться следующие символы:
? – означает ровно один произвольный символ
* – означает любую последовательность символов, в том числе, и пустую.
Каталог – это поименованная совокупность файлов и подкаталогов.
Файловая структура – это совокупность файлов на диске и взаимосвязей между ними.
Простые файловые структуры могут использоваться для дисков с небольшим (до нескольких десятков) количеством файлов.
Иерархические файловые структуры используются для хранения большого (сотни и тысячи) количества файлов.
Графическое изображение иерархической файловой структуры называется деревом.
Последовательно записанные: путь к файлу и имя файла, составляют полное имя файла.
Основная литература:
1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.
Дополнительная литература:
- Босова Л. Л. Информатика: 7–9 классы. Методическое пособие. // Босова Л. Л., Босова А. Ю., Анатольев А. В., Аквилянов Н.А. – М.: БИНОМ, 2019. – 512 с.
- Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 1. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
- Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 2. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
- Гейн А. Г. Информатика: 7 класс. // Гейн А. Г., Юнерман Н. А., Гейн А.А. – М.: Просвещение, 2012. – 198 с.
Теоретический материал для самостоятельного изучения.
Компьютер человеку даёт большие возможности: создавать, копировать, передавать, хранить информацию различного рода. Данные в компьютере могут быть разными, это и документы, и рисунки, и программы, и музыка и многое другое. Так вот, все данные и программы в компьютере хранятся в виде файлов. Сегодня на уроке мы и узнаем, что такое файл.
Вам уже известно, что все программы и данные хранятся во внешней памяти компьютера в виде файлов. Файл – это поименованная область внешней памяти.
Файл характеризуется набором параметров: именем, размером, датой создания, датой последней модификации и атрибутами, которые используются операционной системой для его обработки: является ли файл системным, скрытым или предназначен только для чтения. Размер файла выражается в байтах.
Файлы, которые содержат данные – графические, текстовые называются документами, а файлы, содержащие прикладные программы, – файлами-приложениями.
Причём, файлы-документы создаются и обрабатываются с помощью файлов-приложений.
Имя файла состоит из двух частей, разделённых точкой: собственно имени файла и расширения. Имя файлу даёт пользователь, делать это нужно осмысленно, отражая в имени содержание файла. Имя файла может содержать до 255 символов национальных алфавитов и пробелы. Но в имени файлов есть и запрещённые символы, например, знак вопроса, звёздочка. Расширение имени файла задаётся программой автоматически, оно содержит 3–4 символа, которые записываются после точки.
Над файлами можно выполнять следующие действия: копирование, перемещение, переименование, удаление, поиск.
Если имя файла указано неточно, то можно использовать маску имени файла. Маска представляет собой последовательность букв, цифр и прочих допустимых символов.
На каждом компьютерном носителе информации может храниться большое количество файлов. Для удобства поиска информации файлы объединяют в группы, называемые каталогами или папками. Каталогам, как и файлам, дают собственные имена. Каждый каталог может содержать множество файлов и вложенных каталогов, может входить в состав другого каталога, тем самым, образуя определённую структуру хранения файлов. Её называют файловой структурой. Файловая структура – это совокупность файлов на диске и взаимосвязей между ними.
Любой информационный носитель операционной системы Windowsимеет корневой каталог, который создаётся без участия человека. Корневые каталоги имеют специальное обозначение с указанием имени соответствующего устройства и знака «\» (обратный слэш).
Простые файловые структуры могут использоваться для дисков с небольшим количеством файлов. В этом случае оглавление диска представляет собой линейную последовательность имён файлов.
Иерархические файловые структуры используются для хранения большого количества файлов. Иерархия – это расположение частей целого в порядке от высшего к низшим. Корневой каталог содержит файлы и вложенные каталоги первого уровня.
Графическое изображение иерархической файловой структуры называется деревом, его можно изображать вертикально и горизонтально.
Чтобы обратиться к нужному файлу, который хранится, например, на жёстком диске, можно указать путь к файлу. То есть имена всех каталогов от корневого до того, в котором находится файл. Такую запись называют полным именем файла.
Учитель работал в каталоге Д:\Уроки\7 класс \Практические работы. Затем перешёл в дереве каталогов на уровень выше, спустился в подкаталог Презентации и удалил из него файл Введение.ppt. Каково полное имя файла, который удалил учитель?
Учитель работал с каталогом: Д:\Уроки\7 класс\Практические работы. Поднявшись на один уровень вверх, он оказался в каталоге Д:\Уроки\7 класс. После этого учитель спустился в каталог Презентации, путь к файлам которого имеет вид: D:\Уроки\7 класс \Презентации. В этом каталоге он удалил файл Введение.ppt, полное имя которого Д:\Уроки\7 класс \Презентации\ Введение.ppt.
Итак, сегодня мы узнали, что такое файл, какое имя он может иметь, какие операции можно выполнять над файлами. Также познакомились с понятиями каталог, файловая структура диска.
Материал для углубленного изучения темы.
Файловый менеджер Double Commander.
Double Commander‑ бесплатный файловый менеджер с двухоконным интерфейсом. Программа работает на разных операционных системах: Windows, Linux, MAC OS.
В программу встроены инструменты для группового переименования файлов и синхронизации, все операции выполняются в фоновом режиме, реализована поддержка вкладок, встроен просмотр файлов, эскизов, работа с архивами, расширенный поиск файлов, функция приостановки файловых операций, имеется поддержка некоторых плагинов для TotalCommander и т. д.
Внешний вид DoubleCommader является традиционным для программ подобного типа. Сверху расположены панели инструментов, список дисков, вкладки, собственно, список файлов, внизу находится командная строка и кнопки для тех, кто еще не запомнил наиболее часто используемые файловые операции, но можно скрыть эту панель,
DoubleCommander имеет огромное количество настроек. Настроить можно практически каждый элемент окна, главное найти нужные галочки или поля ввода.
Работа с избранными папками осуществляется с помощью меню, выпадающего при нажатии на кнопку «*». Выглядит оно следующим образом:
Сверху перечислены папки, добавленные в избранные, а снизу два пункта меню для добавления/удаления папки из выбранной панели в список.
Что касается группового переименования, то интерфейс для него выглядит следующим образом:
При переименовании можно использовать регулярные выражения и различные поля вроде счетчика (чтобы добавлять к каждому последующему файлу свой номер), даты, времени создания файла.
В DoubleCommander есть возможность с помощью горячих клавиш (или пункта меню) копировать в буфер обмена имя файла или полный путь до него, Правда, это решается двумя горячими клавишами: сначала переходим к «редактированию пути» в заголовке панели, затем выделенный путь можно скопировать с помощью стандартной комбинации Ctrl+C. Панель быстрого фильтра, позволяет искать файлы/папки в текущей папке, а при необходимости скрыть все файлы и папки, не удовлетворяющие критерию поиска.
Для поиска файлов в DoubleCommander довольно удобный интерфейс. Есть возможность вынесения результатов поиска на панель.
Программа DoubleCommander создана коллективом разработчиков из России, которые стремятся создать файловый менеджер, аналогичный по функциональности TotalCommander. Программа активно развивается.
Разбор решения заданий тренировочного модуля.
№1.Тип задания: выделение цветом.
Укажите, какое из указанных ниже имён файлов удовлетворяет маске ?ese*ie.?t*
Так как маска – это последовательность букв, цифр и других, допустимых в именах файлов символов, среди которых встречаются следующие: «?» – означает ровно один последовательный символ, «*» – означает любую (в том числе и пустую) последовательность символов произвольной длины. Рассмотрев маску?ese*ie.?t*, вопросительный знак – это один символ, т.е. s, * – это последовательность символов произвольной длины, т.е. может подойти ответ первый и последний, т.к. * – это ещё и пустой символ. Но, рассматривая расширение, и также рассуждая, последний вариант ответа не подходит, потому что на втором месте стоит буква t. Следовательно, выделяем цветом первый вариант ответа.
Ответ: seseie.ttx
№2.Тип задания: восстановление последовательности элементов.
Восстановите полное имя файла.
Файл Онегин.doc хранится на жёстком диске в каталоге ПОЭЗИЯ, который является подкаталогом каталога ЛИТЕРАТУРА. В таблице приведены фрагменты полного имени файла:
Читайте также: