Для своего размещения файл требует
Физическая организация выделяет способ размещения файлов на диске и учет соответствия блоков диска файлам. Основными критериями эффективности физической организации файлов являются:
- скорость доступа к данным;
- объем адресной информации файла;
- степень фрагментированности дискового пространства;
- максимально возможный размер файла.
Наиболее часто используются следующие схемы размещения файлов:
- непрерывное размещение (непрерывные файлы);
- сводный список блоков (кластеров) файла;
- сводный список индексов блоков (кластеров) файла;
- перечень номеров блоков (кластеров) файла в структурах, называемых i-узлами (index-node – индекс-узел).
Простейший вариант физической организации – непрерывное размещение в наборе соседних кластеров (рис. 7.15a). Достоинство этой схемы – высокая скорость доступа и минимальный объем адресной информации, поскольку достаточно хранить номер первого кластера и объем файла. Размер файла при такой организации не ограничивается.
Однако у этой схемы имеется серьезный недостаток – фрагментация, возрастающая по мере удаления и записи файлов. Кроме того, возникает вопрос, какого размера область нужно выделить файлу, если при каждой модификации он может увеличить свой размер.
И все-таки есть ситуации, в которых непрерывные файлы могут эффективно использоваться и действительно широко применяются – на компакт-дисках. Здесь все размеры файлов заранее известны и не могут меняться.
Второй метод размещения файлов состоит в представлении файла в виде связного списка кластеров дисковой памяти (рис. 7.15б). Первое слово каждого кластера используется как указатель на следующий кластер . В этом случае адресная информация минимальна, поскольку расположение файла задается номером его первого кластера.
Рис. 7.15. Варианты физической организации файлов
Кроме того, отсутствует фрагментация на уровне кластеров, а файл легко может изменять размер наращиванием или удалением цепочки кластеров. Однако доступ к такому файлу может оказаться медленным, так как для получения доступа к кластеру n операционная система должна прочитать первые n-1 кластеры. Кроме того, размер кластера уменьшается на несколько байтов, требуемых для хранения. Указателю это не очень важно, но многие программы читают и пишут блоками, кратными степени двойки.
Оба недостатка предыдущей схемы организации файлов могут быть устранены, если указатели на следующие кластеры хранить в отдельной таблице, загружаемой в память . Таким образом, образуется связный список не самих блоков (кластеров) файла, а индексов, указывающих на эти блоки (рис. 7.16).
Рис. 7.16. Вариант физической организации файлов
Такая таблица , называемая FAT -таблицей (File Allocation Table ), используется в файловых системах MS- DOS и Windows ( FAT 16 и FAT 32). Файлу выделяется память на диске в виде связного списка кластеров. Номер первого кластера запоминается в записи каталога, где хранятся характеристики этого файла. С каждым кластером диска связывается индекс . Индексы располагаются в FAT -таблице в отдельной области диска. Когда память свободна, все индексы равны нулю. Если некоторый кластер N назначен файлу, то индекс этого кластера либо становится равным номеру M следующего кластера файла, либо принимает специальное значение , являющееся признаком того, что кластер является последним для файла. Вообще индексы могут содержать следующую информацию о кластере диска (для FAT 32):
- не используется (Unused) – 0000.0000;
- используется файлом (Cluster in use by a file) – значение, отличное от 000.000, FFFF.FFFF и FFFF.FFF7;
- плохой кластер ( Bad cluster ) – FFFF.FFF7;
- последний кластер файла (Last cluster in a file) – FFFF.FFFF.
При такой организации сохраняются все достоинства второго метода организации файлов: отсутствие фрагментации, отсутствие проблем при изменении размера. Кроме того, данный способ обладает дополнительными преимуществами: для доступа к произвольному кластеру файла не требуется последовательно считывать его кластеры, достаточно прочитать FAT -таблицу, отсчитать нужное количество кластеров файла по цепочке и определить номера нужного кластера. Во-вторых, данные файла заполняют кластер целиком в объеме, кратном степени двойки.
Еще один способ заключается в простом перечислении номеров кластеров, занимаемых файлом (рис. 7.17). Этот перечень и служит адресом файла. Недостаток такого подхода – длина адреса зависит от размера файла. Достоинства – высокая скорость доступа к произвольному кластеру благодаря прямой адресации, отсутствие внешней фрагментации.
Рис. 7.17. Вариант физической организации файлов
Эффективный метод организации файлов, используемый в Unix -подобных операционных системах, состоит в связывании с каждым файлом структуры данных, называемой i-узлами. Такой узел содержит атрибуты файла и адреса кластеров файла (рис. 7.18). Преимущество такой схемы перед FAT -таблицей заключается в том, что каждый конкретный i-узел должен находиться в памяти только тогда, когда открыт соответствующий ему файл . Если каждый узел занимает n байт , а одновременно может быть открыто k файлов, то массив i-узлов займет в памяти k * n байт , что значительно меньше, чем FAT - таблица .
Это объясняется тем, что размер FAT -таблицы растет линейно с размером диска и даже быстрее, чем линейно, так как с увеличением количества кластеров на диске может потребоваться увеличить разрядность числа для хранения их номеров.
Рис. 7.18. вариант физической организации файлов
Достоинством i-узлов является также высокая скорость доступа к произвольному кластеру файла, так как здесь применяется прямая адресация . Фрагментация на уровне кластеров также отсутствует.
Однако с такой схемой связана проблема, заключающаяся в том, что при выделении каждому файлу фиксированного количества адресов кластеров этого количества может не хватить. Выход из этой ситуации может быть в сочетании прямой и косвенной адресации. Такой поход реализован в файловой системе ufs , используемой в ОС UNIX , схема адресации в которой приведена на рис. 7.19.
Для хранения адреса файла выделено 15 полей, каждое из которых состоит из 4 байт . Если размер файлов меньше или равен 12 кластерам, то номера этих кластеров непосредственно перечисляются в первых двенадцати полях адреса. Если кластер имеет размер 8 Кбайт, то можно адресовать файл размеров до 8 Кбайт * 12 = 98304 байт . Если размер кластера превышает 12 кластеров, то следующее 13 поле содержит адрес кластера, в котором могут быть расположены номера следующих кластеров, и размер файла может возрасти до 8192 * (12 + 2048) = 16.875.520 байт .
Следующий уровень адресации, обеспечиваемый 14-м полем, позволяет адресовать до 8192 * (12 + 2048 + 20482) = 3,43766*1020 байт . Если и этого недостаточно, используется следующее 15-е поле . В этом случае максимальный размер файла может составить 8192 * (12 + 2048 + 20482 + 20483) = 7,0403*1013 байт .
При этом объеме самой адресной информации составит всего 0,05% от объема адресуемых данных (задачи. ).
Метод перечисления адресов кластеров файла задействован и в файловой системе NTFS , применяемой в Windows NT/2000/2003. Для сокращения объема адресной информации в NTFS адресуются не кластеры файла, а непрерывные области, состоящие из смежных кластеров диска. Каждая такая область называется экстентом ( extent ) и описывается двумя числами: номером начального кластера и количеством кластеров.
В основе любой операционной системы лежит принцип организации работы внешнего устройства хранения информации. Несмотря на то, что внешняя память может быть технически реализована на разных материальных носителях (например, в виде гибкого магнитного диска или FLASH-карты), их определяет принятый в операционной системе принцип организации хранения логически связанных наборов информации в виде так называемых файлов.
Файл -логически связанная совокупность данных или программ, для размещение которой во внешней памяти выделяется именованная область.
Файл служит учетной единицей информации в операционной системе. Любые действия с информацией в ОС осуществляются над файлами: запись на диск, вывод на экран, ввод с клавиатуры, печать, считывание информации CD-ROM и пр.
На диске файл не требует для своего размещения непрерывного пространства, обычно он занимает свободные кластеры - группы смежных секторов - в разных частях диска. Сведения о номерах этих кластеров хранятся в специальной FAT- таблице (FileAllocationTable – таблица размещения файлов). Кластер является минимальной единицей пространства диска, которое может быть отведено файлу. Самый маленький файл занимает один кластер, большие файлы - несколько десятков кластеров.
Любой другой файл с нетекстовой информацией просмотреть теми же средствами, что и текстовый файл, не удается. При просмотре на экран будут выводиться абсолютно непонятные символы.
Для характеристики файла используются следующие параметры:
§ полное имя файла;
§ объем файла в байтах;
§ дата создания (последнего изменения) файла;
§ время создания (последнего изменения) файла;
§ специальные атрибуты файла: R (Readonly)- только для чтения, H (Hidden)-скрытый файл, S (System)- системный файл, A (Archive)- архивированный файл.
Полное имя файла образуется из собственно имени файла и расширения, характеризующего тип файла, разделенных точкой.
Правило образования имени.
Имя файла всегда уникально и служит для отличия одного файла от другого. Ранее, в ОС MSDOS, имя файла могла образовываться только по правилу «8.3», т.е. собственно имя файла могло содержать не более чем восемь символов, а расширение – только три символа. При этом могли использоваться только латинские буквы. Это ограничение снято в ОС Windows. Теперь имя файла может иметь до 215 символов, в том числе - русских, включая пробелы. Тем не менее, не рекомендуется создавать имена файлов длиной 215 символов. Очень длинные имена большинством программ не могут быть интерпретированы.
Не допускается использование в именах файлов следующих символов: \ / : * ? " <>.
Расширение (тип) файла служит для характеристики хранящейся в файле информации и образуется, как правило, из трех символов, причем используется, только буквы латинского алфавита.
При работе на персональном компьютере установлен ряд соглашений по соответствию расширения и типа файла, некоторые из которых приведены в следующей таблице. Кроме того, в ней приведены соответствующие некоторым типам файлов значки – иконки, широко используемые в ОС Windows.
Соответствие некоторых расширений, иконок и типов файлов
Расширение | Иконка | Тип файла |
ARJ | Архивный файл, созданный архиватором ARJ | |
RAR | | Архивный файл, созданный архиватором RAR |
BAK | | Копия файла, создаваемая при перезаписи файла оригинала |
BAS | Программа на языке Бейсик | |
BAT | | Командный файл |
СOM | | Исполняемый файл |
DAT | Файл данных | |
DOC, DOCX | | Файл документов (текстовый), созданный текстовым редактором MicrosoftWord |
XLS, XLSX | | Файл документов (электронная таблица), созданный MicrosoftExcel |
EXE | | Исполняемый файл |
TMP | Временный файл | |
TXT | | Текстовый файл |
$$$ | Временный файл | |
SYS | | Файлы, расширяющие возможности операционной системы, например драйверы |
DBF | Файл – таблица базы данных формата DataBaseFormat, например созданный СУБД FoxPro | |
MDB, ACCDB | | Файл базы данных СУБД MicrosoftAccess |
HLP | | Файл справочной системы |
| Файл, созданный в программе AdobeAcrobat | |
HTML | | Файл для просмотра в InternetExplorer |
PPT, PPTX | | Файл презентации, подготовленный в программе PowerPoint |
TIFF | | Формат хранения растровых графических изображений. Наиболее распространенным форматом хранения фотографий в издательском деле. |
BMP | | Формат хранения растровых изображений, характерный для Windows и OS/2. |
JPEG | | Современный растровый формат хранения фотографий. |
GIF | | Стандарт для хранения небольших изображений в тех случаях, когда не требуется особого качества. (С поддержкой анимации). |
PNG | | Растровый формат хранения графической информации, использующий сжатие без потерь |
AVI | | Расширение огромного количества видеофайлов, в котором могут храниться потоки 4-х типов - видео, аудио, текст и midi. |
WMV | | Видеоформат от компании Microsoft. Видеоролики, сделанные с помощью программы MovieMaker имеют данное расширение. |
MOV | | Формат, который может содержать видео, графику, анимацию, 3D. Чаще всего для проигрывания этого формата нужен QuickTimePlayer. |
FLV | | Формат видео для размещения и передачи в Интернете, используется такими площадками для размещения видеоклипов, как YouTube, RuTube, Tube.BY, GoogleVideo, Муви и многие другие. |
MP3 | | Формат цифрового кодирования звуковой информации. |
WAV | | Основной формат записи звука без сжатия. |
DVD-Audio | | Цифровой формат DVD, созданный специально для высококачественного воспроизведения звуковой информации. |
"Горячие" клавиши в Windows и приложениях
В Microsoft Windows и практически всех программ, работающих в той операционной среде зачастую бывает удобно пользоваться для выполнения часто используемых команд (особенно при редактировании файлов) различными сочетаниями клавиш на клавиатуре. Основные из них:
Самостоятельная работа 1. Программное обеспечение персонального компьютера.
Зайдите в сеть Интернет, используя любой браузер (например, Mozilla Firefox). Найдите подробную информацию по видам программного обеспечения (ПО) персонального компьютера и примерам программных средств (системное ПО (базовое и сервисное по), прикладное ПО, инструментарий технологии программирования). А также зайдите в электронный учебник Lessons, ознакомьтесь с темой Системное программное обеспечение компьютера. Результаты работы впишите в таблицу, представленную ниже.
Файл (file) — это поименованная область на диске или другом машинном носителе, в которой хранится определенная информация (хотя в некоторых случаях данные могут отсутствовать, тогда это будет «нулевой» файл). В файлах может храниться различная информация: тексты, таблицы, рисунки, чертежи и т.п.
Файл не требует для своего размещения непрерывного пространства и обычно занимает свободные кластеры в разных частях диска. Самый маленький файл занимает один кластер (даже если он нулевой), большие файлы могут располагаться в значительном количестве кластеров. Сведения о номерах этих кластеров хранятся в специальной таблице размещения файлов.
Любой файл характеризует четыре параметра.
1. Полное имя файла, состоящее из двух частей, разделенных точкой «.»:
имя файла образуется не более чем из восьми символов, причем используются только цифры, латинские буквы, знаки дефис «-» и подчеркивание «_»;
тип (расширение) файла образуется не более чем из трех символов, причем используются такие же символы, как в именах файлов. Расширение файла служит для характеристики хранящейся в нем информации. В операционной системе DOS установлен ряд стандартных типов файлов: .arj — архивный файл, . bak — копия файла, . bat — командный файл, . сот — командный системный файл, . ехе — исполняемый файл, . hip — файл справки, . txt — текстовый файл, . doc — документ Word, . xls — документ Excel и др.
Такие правила действуют в FAT, а в FAT32 или NTFS имена файлов могут включать русские буквы и достигать длины (вместе с типом файла) 256 символов.
В операционной системе не могут одновременно в одном месте находиться файлы с одинаковыми полными именами (хотя у файлов могут быть одинаковые имена или расширения).
- 2. Размер (объем) файла в байтах (большие файлы измеряются в килобайтах, мегабайтах или гигабайтах).
- 3. Дата и время создания файла (могут быть одинаковыми у разных файлов).
- 4.Специальные атрибуты файла: R (Read only) — только для чтения, Н (Hidden) — скрытый файл, S (System) — системный файл, A (Archive) — файл, который не был архивирован.
Зачастую возникает ситуация, когда на компьютере есть файлы, но пользователь не имеет к ним полного доступа, например, может лишь читать файлы с атрибутом R, но не может изменять их. Или часть файлов (с атрибутами Н или S) просто скрыта операционной системой от пользователя. Причем атрибут «системный» ОС устанавливает файлам только самостоятельно, а атрибут «скрытый» можно назначить файлу вручную (как и атрибут «только для чтения»).
С файлами можно проводить различные операции, например поиск, копирование, перемещение или удаление файлов. Операции с группой файлов легко выполнить, пользуясь шаблоном при создании группы. Шаблон имени файла — это специальная форма, в которой в полях имени и типа файла используются символы звездочка «*» или вопрос «?».
Символ «*» означает любое количество (1 и более) любых допустимых символов. Одна звездочка «*» может быть использована для обозначения любого имени или типа файла. Например, шаблон web. * означает группу файлов с именем web и любыми расширениями (web. exe, web. 1 и т.п.); шаблон *. * означает все файлы, имеющие любое имя и тип (web. exe, а. b, win. bak и др.).
Символ «?» означает наличие или отсутствие одного допустимого символа. Несколько вопросов «?» может быть использовано для обозначения нескольких символов в имени или типе файлов. Например, шаблон web7.txt означает группу файлов с расширением .txt, имя которых состоит из трех или четырех символов, причем четвертый символ может быть любым (web. txt, web2 . txt, weba. txt и т.п.).
Файловая система . На каждом носителе информации (гибком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске определяется используемой файловой системой.
Каждый диск разбивается на две области: обла сть хранения файлов и каталог. Каталог содержит имя файла и указание на начало его размещения на диске. Если провести аналогию диска с книгой, то область хранения файлов соответствует ее содержанию, а каталог - оглавлению. Причем книга состоит из страниц, а диск - из секторов.
Для дисков с небольшим количеством файлов (до нескольких десятков) может использоваться одноуровневая файловая система , когда каталог (оглавление диска) представляет собой линейную последовательность имен файлов (табл. 1.2). Такой каталог можно сравнить с оглавлением детской книжки, которое содержит только названия отдельных рассказов.
Если на диске хранятся сотни и тысячи файлов, то для удобства поиска используется многоуровневая иерархическая файловая система , которая имеет древовидную структуру. Такую иерархическую систему можно сравнить, например, с оглавлением данного учебника, которое представляет собой иерархическую систему разделов, глав, параграфов и пунктов.
Начальный, корневой каталог содержит вложенные каталоги 1-го уровня, в свою очередь, каждый из последних может содержать вложенные каталоги 2-го уровня и так далее. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы.
Например, в корневом каталоге могут находиться два вложенных каталога 1-го уровня (Каталог_1, Каталог_2) и один файл (Файл_1). В свою очередь, в каталоге 1-го уровня (Каталог_1) находятся два вложенных каталога второго уровня (Каталог_1.1 и Каталог_1.2) и один файл (Файл_1.1) - рис. 1.3.
Файловая система - это система хранения файлов и организации каталогов.
Рассмотрим иерархическую файловую систему на конкретном примере. Каждый диск имеет логическое имя (А:, В: - гибкие диски, С:, D:, Е: и так далее - жесткие и лазерные диски).
Пусть в корневом каталоге диска С: имеются два каталога 1-го уровня (GAMES, TEXT), а в каталоге GAMES один каталог 2-го уровня (CHESS). При этом в каталоге TEXT имеется файл proba.txt, а в каталоге CHESS - файл chess.exe (рис. 1.4).
Рис. 1.4. Пример иерархической файловой системы |
Путь к файлу . Как найти имеющиеся файлы (chess.exe, proba.txt) в данной иерархической файловой системе? Для этого необходимо указать путь к файлу. В путь к файлу входят записываемые через разделитель "\" логическое имя диска и последовательность имен вложенных друг в друга каталогов, в последнем из которых содержится нужный файл. Пути к вышеперечисленным файлам можно записать следующим образом:
Путь к файлу вместе с именем файла называют иногда полным именем файла.
Пример полного имени файла:
Представление файловой системы с помощью графического интерфейса . Иерархическая файловая система MS-DOS, содержащая каталоги и файлы, представлена в операционной системе Windows с помощью графического интерфейса в форме иерархической системы папок и документов. Папка в Windows является аналогом каталога MS-DOS
Однако иерархическая структура этих систем несколько различается. В иерархической файловой системе MS-DOS вершиной иерархии объектов является корневой каталог диска, который можно сравнить со стволом дерева, на котором растут ветки (подкаталоги), а на ветках располагаются листья (файлы).
В Windows на вершине иерархии папок находится папка Рабочий стол. Следующий уровень представлен папками Мой компьютер, Корзина и Сетевое окружение (если компьютер подключен к локальной сети) - рис. 1.5.
Рис. 1.5. Иерархическая структура папок |
Если мы хотим ознакомиться с ресурсами компьютера, необходимо открыть папку Мой компьютер.
1. В окне Мой компьютер находятся значки имеющихся в компьютере дисков. Активизация (щелчок) значка любого диска выводит в левой части окна информацию о его емкости, занятой и свободной частях.
Читайте также: