Формат web страниц расширение в имени файла
A расширение имени файла или тип файла - это идентификатор, указанный как суффикс к имени компьютерного файла . Расширение указывает на характеристику содержимого файла или его предполагаемое использование. Расширение имени файла обычно отделяется от имени файла точкой (точка), но в некоторых системах оно отделяется пробелами.
Некоторые файловые системы реализуют расширения имени файла как функцию самой файловой системы и могут ограничивать длину и формат расширения, в то время как другие рассматривают расширения файлов как часть имени файла без особого различия .
Содержание
Использование
Расширения имени файла можно рассматривать как тип метаданных . Они обычно используются для обозначения информации о том, как данные могут храниться в файле. Точное определение, дающее критерии для определения того, какая часть имени файла является его расширением, принадлежит правилам конкретной используемой файловой системы ; обычно расширением является подстрока, которая следует за последним вхождением символа точки , если таковое имеется (например: txt - это расширение имени файла readme.txt , а html расширение mysite.index.html ). В файловых системах некоторых систем мэйнфреймов, таких как CMS в VM, VMS , и в системах ПК, таких как CP / M и производных системах, таких как MS- DOS , расширение является отдельным пространством имен , отдельным от имени файла. В Microsoft DOS и Windows такие расширения, как EXE , COM или BAT , указывают на то, что файл является программой. исполняемый файл . В OS / 360 и последующих версиях часть имени набора данных, следующая за последней точкой, обрабатывается некоторым программным обеспечением как расширение, например, TSO EDIT, но не имеет особого значения для сама операционная система; то же самое относится к файлам Unix в MVS.
Файловые системы для UNIX-подобных операционных систем не отделяют метаданные расширения от остальной части имени файла. Точка - это просто еще один символ в основном имени файла. Имя файла не может иметь расширений, иметь одно или несколько расширений. Более одного расширения обычно представляют вложенные преобразования, такие как files.tar.gz ( .tar указывает, что файл является tar-архивом из одного или нескольких файлы, а .gz указывает, что файл архива tar сжат с помощью gzip ). Программы, преобразующие или создающие файлы, могут добавлять соответствующее расширение к именам, выводимым из имен входных файлов (если явно не указано имя выходного файла), но программы, читающие файлы, обычно игнорируют эту информацию; он в основном предназначен для человека. Чаще, особенно в двоичных файлах, сам файл содержит внутренние метаданные , описывающие его содержимое. Эта модель обычно требует, чтобы в командах было указано полное имя файла, тогда как подход с использованием метаданных часто позволяет опускать расширение.
Файловые системы VFAT , NTFS и ReFS для Windows также не отделяют метаданные расширения от остальная часть имени файла и разрешить несколько расширений.
С появлением графических пользовательских интерфейсов возникла проблема управления файлами и поведения интерфейса. Microsoft Windows позволяла связывать несколько приложений с одним расширением, и для выбора необходимого приложения были доступны различные действия, такие как контекстное меню , предлагающее выбор между просмотром, редактированием или печатью файла. Все еще предполагалось, что любое расширение представляет один тип файла; между расширением и значком было однозначное соответствие.
В классической Mac OS полностью удалены метаданные расширения на основе имени файла; вместо этого он использовал отдельный файл код типа для идентификации формата файла. Кроме того, был указан код создателя , чтобы определить, какое приложение будет запущено при двойном щелчке значка файла . Однако macOS использует суффиксы имен файлов, а также коды типов и создателей, поскольку они являются производными от UNIX-подобной операционной системы NeXTSTEP .
Улучшения
Расширение имени файла изначально использовалось для определения универсального типа файла. Необходимость сжать тип файла до трех символов часто приводила к сокращенным расширениям. Примеры включают использование .GFX для графических файлов, .TXT для обычного текста и .MUS для музыки. Однако, поскольку было создано множество различных программ, которые обрабатывают эти (и другие) типы данных различными способами, расширения файлов стали тесно ассоциироваться с определенными продуктами - даже с конкретными версиями продуктов. Например, в ранних файлах WordStar использовались файлы .WS или .WSn , где n - номер версии программы. Кроме того, были разработаны конфликтующие варианты использования некоторых расширений файлов. Одним из примеров является .rpm , используемый как для пакетов RPM Package Manager , так и для RealPlayer файлов мультимедиа ;. Остальные - .qif , общие для DESQview шрифты, Quicken финансовые книги и QuickTime изображения; .gba , совместно используемый сценариями GrabIt и образами ROM Game Boy Advance ; .sb , используется для SmallBasic и Scratch ; и .dts , используемый для Dynamix Three Space и DTS .
. Некоторые другие операционные системы, которые использовали расширения файлов, обычно имели гораздо более либеральные размеры для имен файлов. Многие разрешали полную длину имени файла из 14 и более символов, а максимальная длина имени до 255 не была редкостью. Файловые системы в операционных системах, таких как Multics и UNIX , хранят имя файла в виде одной строки, не разделенной на компоненты базового имени и расширения, с символом "." это просто еще один символ, разрешенный в именах файлов. Такие системы обычно допускают использование имен файлов переменной длины, допускающих использование более одной точки и, следовательно, нескольких суффиксов. Некоторые компоненты Multics и UNIX, а также приложения, работающие на них, в некоторых случаях использовали суффиксы для обозначения типов файлов, но они не использовали их так часто - например, исполняемые и обычные текстовые файлы не имели суффиксов в своих именах.
Высокопроизводительная файловая система (HPFS), используемая в Microsoft и IBM OS / 2 , также поддерживала длинные имена файлов и действительно не разделять имя файла на имя и расширение. Соглашение об использовании суффиксов продолжалось, хотя HPFS поддерживал расширенные атрибуты для файлов, позволяя хранить тип файла в файле как расширенный атрибут.
Собственная файловая система Microsoft Windows NT , NTFS , поддерживала длинные имена файлов и не разделяла имя файла на имя и расширение, но опять же, соглашение об использовании суффиксов для имитации расширений продолжено для совместимости с существующими версиями Windows.
Когда впервые наступила эпоха Интернета , те, кто использовал системы Windows, которые все еще были ограничены форматом файлов 8.3, должны были создавать веб-страницы с именами, заканчивающимися на .HTM , тогда как пользователи компьютеров Macintosh или UNIX могут использовать рекомендованное расширение имени файла .html . Это также стало проблемой для программистов, экспериментирующих с языком программирования Java , поскольку он требует, чтобы файлы исходного кода имели четырехбуквенный суффикс .java и компилирует выходные файлы с объектным кодом с пятибуквенным суффиксом .class .
В конце концов, Windows 95 представила поддержку длинных имена файлов и удалили разделение имени / расширения 8.3 в именах файлов из Windows, отличной от NT, в расширенной версии широко используемой файловой системы FAT под названием VFAT . VFAT впервые появился в Windows NT 3.5 и Windows 95 . Внутренняя реализация длинных имен файлов в VFAT в основном рассматривается как kludge , но она сняла важное ограничение длины и разрешила файлам иметь сочетание верхнего регистра и строчные буквы на машинах, которые плохо работают с Windows NT . Однако использование трехсимвольных расширений в Microsoft Windows продолжалось, первоначально для обратной совместимости со старыми версиями Windows, а теперь по привычке вместе с проблемами, которые это создает.
Проблемы с именем команды
Использование расширения имени файла в имени команды появляется иногда, обычно как побочный эффект команды, реализованной в виде сценария, например, для Оболочка Bourne или для Python , а имя интерпретатора добавляется к имени команды, практика, распространенная в системах, которые полагаются на связи между расширением имени файла и интерпретатором, но резко устарела в UNIX производные системы, такие как Linux и Apple macOS , где интерпретатор обычно указывается как заголовок в сценарии («shebang »).
В системах, основанных на ассоциациях, расширение имени файла обычно сопоставляется с одним общесистемным выбором интерпретатора для этого расширения (например, «.py» означает использование Python), а сама команда запускается из командной строки, даже если расширение не указано (при условии, что выполнена соответствующая настройка). Если язык реализации изменяется, расширение имени команды также изменяется, и ОС обеспечивает согласованный API , позволяя использовать одну и ту же версию команды без расширения в обоих случаях. Этот метод в некоторой степени страдает от по существу глобального характера сопоставления ассоциаций, а также от того, что разработчики не полностью избегают расширений при вызове программ, и что разработчики не могут принудительно этого избежать. Windows - единственный оставшийся широко распространенный работодатель этого механизма.
В системах с директивами интерпретатора , включая практически все версии Unix, расширения имен команд не имеют особого значения и по стандартной практике не используются, поскольку основной метод установки интерпретаторов для сценариев состоит в том, чтобы начинать их с единственной строки, определяющей используемый интерпретатор (который можно рассматривать как вырожденную ветвь ресурсов ). В этих средах включение расширения в имя команды излишне раскрывает детали реализации, которые подвергают все ссылки на команды из других программ будущему риску, если реализация изменится. Например, было бы совершенно нормально, если бы сценарий оболочки был переопределен на Python или Ruby, а затем на C или C ++, и все это изменило бы имя команды, если бы использовались расширения. Без расширений программа всегда имеет одно и то же имя без расширений, с изменением только директивы интерпретатора и / или магического числа , а ссылки на программу из других программ остаются действительными.
Проблемы безопасности
По умолчанию Проводник , обозреватель файлов, поставляемый с Microsoft Windows , не отображает расширения имен файлов. Злоумышленники пытались распространить компьютерные вирусы и компьютерные черви , используя имена файлов, имеющие вид LOVE-LETTER-FOR-YOU.TXT.vbs . Есть надежда, что это будет выглядеть как LOVE-LETTER-FOR-YOU.TXT , безвредный текстовый файл, без предупреждения пользователя о том, что это вредоносная компьютерная программа, в данном случае написанная на VBScript . Поведение по умолчанию для ReactOS - отображение расширений файлов в ReactOS Explorer .
Более поздних версиях Windows (начиная с Windows XP Service Pack 2 и Windows Server 2003 ) включал настраиваемые списки расширений файлов, которые следует считать «опасными» в определенных «зонах» работы, например, когда загружает из сети или получает как вложение к электронному письму. Современные системы антивирусного программного обеспечения также помогают защитить пользователей от таких попыток атак там, где это возможно.
Некоторые вирусы используют схожесть между доменом верхнего уровня «.com » и расширением имени файла «.COM» , отправка вредоносных, исполняемых файлов командных файлов по электронной почте под именами, внешне похожими на URL-адреса (например, "myparty.yahoo.com"), в результате чего некоторые наивные пользователи нажимают на встроенные в электронную почту ссылки, которые, по их мнению, ведут на веб-сайты, но фактически загружают и выполняют вредоносные вложения.
Были случаи вредоносного ПО , созданного для использования уязвимостей в некоторых приложениях Windows, которые могли вызвать переполнение стека буфера при открытии файла с слишком длинным, необработанное расширение имени файла.
Расширение имени файла - это просто маркер, и содержимое файла не обязательно должно совпадать с ним. Его можно использовать для маскировки вредоносного содержимого. Поэтому при попытке идентифицировать файл по соображениям безопасности считается опасным полагаться только на расширение, и предпочтительным является надлежащий анализ содержимого файла. Например, в системах, производных от UNIX , нередко можно найти файлы без расширений вообще, поскольку вместо них предназначены такие команды, как file (command) , и они будут прочтите заголовок файла, чтобы определить его содержимое.
Альтернативы
BeOS , чья файловая система BFS поддерживает расширенные атрибуты, пометит файл с его типом носителя как расширенный атрибут. KDE и GNOMEокружения рабочего стола связывают тип носителя с файлом, исследуя суффикс имени файла и его содержимое в виде файл как эвристика . Они выбирают приложение для запуска при открытии файла на основе этого типа носителя, уменьшая зависимость от расширений файлов. macOS использует как расширения файлов, так и типы носителей, а также коды типов файлов , чтобы выбрать унифицированный идентификатор типа , с помощью которого можно определить тип файла внутри.
A расширение имени файла или тип файла - это идентификатор, указанный как суффикс к имени компьютерного файла . Расширение указывает на характеристику содержимого файла или его предполагаемое использование. Расширение имени файла обычно отделяется от имени файла точкой (точка), но в некоторых системах оно отделяется пробелами.
Некоторые файловые системы реализуют расширения имени файла как функцию самой файловой системы и могут ограничивать длину и формат расширения, в то время как другие рассматривают расширения файлов как часть имени файла без особого различия .
Содержание
Использование
Расширения имени файла можно рассматривать как тип метаданных . Они обычно используются для обозначения информации о том, как данные могут храниться в файле. Точное определение, дающее критерии для определения того, какая часть имени файла является его расширением, принадлежит правилам конкретной используемой файловой системы ; обычно расширением является подстрока, которая следует за последним вхождением символа точки , если таковое имеется (например: txt - это расширение имени файла readme.txt , а html расширение mysite.index.html ). В файловых системах некоторых систем мэйнфреймов, таких как CMS в VM, VMS , и в системах ПК, таких как CP / M и производных системах, таких как MS- DOS , расширение является отдельным пространством имен , отдельным от имени файла. В Microsoft DOS и Windows такие расширения, как EXE , COM или BAT , указывают на то, что файл является программой. исполняемый файл . В OS / 360 и последующих версиях часть имени набора данных, следующая за последней точкой, обрабатывается некоторым программным обеспечением как расширение, например, TSO EDIT, но не имеет особого значения для сама операционная система; то же самое относится к файлам Unix в MVS.
Файловые системы для UNIX-подобных операционных систем не отделяют метаданные расширения от остальной части имени файла. Точка - это просто еще один символ в основном имени файла. Имя файла не может иметь расширений, иметь одно или несколько расширений. Более одного расширения обычно представляют вложенные преобразования, такие как files.tar.gz ( .tar указывает, что файл является tar-архивом из одного или нескольких файлы, а .gz указывает, что файл архива tar сжат с помощью gzip ). Программы, преобразующие или создающие файлы, могут добавлять соответствующее расширение к именам, выводимым из имен входных файлов (если явно не указано имя выходного файла), но программы, читающие файлы, обычно игнорируют эту информацию; он в основном предназначен для человека. Чаще, особенно в двоичных файлах, сам файл содержит внутренние метаданные , описывающие его содержимое. Эта модель обычно требует, чтобы в командах было указано полное имя файла, тогда как подход с использованием метаданных часто позволяет опускать расширение.
Файловые системы VFAT , NTFS и ReFS для Windows также не отделяют метаданные расширения от остальная часть имени файла и разрешить несколько расширений.
С появлением графических пользовательских интерфейсов возникла проблема управления файлами и поведения интерфейса. Microsoft Windows позволяла связывать несколько приложений с одним расширением, и для выбора необходимого приложения были доступны различные действия, такие как контекстное меню , предлагающее выбор между просмотром, редактированием или печатью файла. Все еще предполагалось, что любое расширение представляет один тип файла; между расширением и значком было однозначное соответствие.
В классической Mac OS полностью удалены метаданные расширения на основе имени файла; вместо этого он использовал отдельный файл код типа для идентификации формата файла. Кроме того, был указан код создателя , чтобы определить, какое приложение будет запущено при двойном щелчке значка файла . Однако macOS использует суффиксы имен файлов, а также коды типов и создателей, поскольку они являются производными от UNIX-подобной операционной системы NeXTSTEP .
Улучшения
Расширение имени файла изначально использовалось для определения универсального типа файла. Необходимость сжать тип файла до трех символов часто приводила к сокращенным расширениям. Примеры включают использование .GFX для графических файлов, .TXT для обычного текста и .MUS для музыки. Однако, поскольку было создано множество различных программ, которые обрабатывают эти (и другие) типы данных различными способами, расширения файлов стали тесно ассоциироваться с определенными продуктами - даже с конкретными версиями продуктов. Например, в ранних файлах WordStar использовались файлы .WS или .WSn , где n - номер версии программы. Кроме того, были разработаны конфликтующие варианты использования некоторых расширений файлов. Одним из примеров является .rpm , используемый как для пакетов RPM Package Manager , так и для RealPlayer файлов мультимедиа ;. Остальные - .qif , общие для DESQview шрифты, Quicken финансовые книги и QuickTime изображения; .gba , совместно используемый сценариями GrabIt и образами ROM Game Boy Advance ; .sb , используется для SmallBasic и Scratch ; и .dts , используемый для Dynamix Three Space и DTS .
. Некоторые другие операционные системы, которые использовали расширения файлов, обычно имели гораздо более либеральные размеры для имен файлов. Многие разрешали полную длину имени файла из 14 и более символов, а максимальная длина имени до 255 не была редкостью. Файловые системы в операционных системах, таких как Multics и UNIX , хранят имя файла в виде одной строки, не разделенной на компоненты базового имени и расширения, с символом "." это просто еще один символ, разрешенный в именах файлов. Такие системы обычно допускают использование имен файлов переменной длины, допускающих использование более одной точки и, следовательно, нескольких суффиксов. Некоторые компоненты Multics и UNIX, а также приложения, работающие на них, в некоторых случаях использовали суффиксы для обозначения типов файлов, но они не использовали их так часто - например, исполняемые и обычные текстовые файлы не имели суффиксов в своих именах.
Высокопроизводительная файловая система (HPFS), используемая в Microsoft и IBM OS / 2 , также поддерживала длинные имена файлов и действительно не разделять имя файла на имя и расширение. Соглашение об использовании суффиксов продолжалось, хотя HPFS поддерживал расширенные атрибуты для файлов, позволяя хранить тип файла в файле как расширенный атрибут.
Собственная файловая система Microsoft Windows NT , NTFS , поддерживала длинные имена файлов и не разделяла имя файла на имя и расширение, но опять же, соглашение об использовании суффиксов для имитации расширений продолжено для совместимости с существующими версиями Windows.
Когда впервые наступила эпоха Интернета , те, кто использовал системы Windows, которые все еще были ограничены форматом файлов 8.3, должны были создавать веб-страницы с именами, заканчивающимися на .HTM , тогда как пользователи компьютеров Macintosh или UNIX могут использовать рекомендованное расширение имени файла .html . Это также стало проблемой для программистов, экспериментирующих с языком программирования Java , поскольку он требует, чтобы файлы исходного кода имели четырехбуквенный суффикс .java и компилирует выходные файлы с объектным кодом с пятибуквенным суффиксом .class .
В конце концов, Windows 95 представила поддержку длинных имена файлов и удалили разделение имени / расширения 8.3 в именах файлов из Windows, отличной от NT, в расширенной версии широко используемой файловой системы FAT под названием VFAT . VFAT впервые появился в Windows NT 3.5 и Windows 95 . Внутренняя реализация длинных имен файлов в VFAT в основном рассматривается как kludge , но она сняла важное ограничение длины и разрешила файлам иметь сочетание верхнего регистра и строчные буквы на машинах, которые плохо работают с Windows NT . Однако использование трехсимвольных расширений в Microsoft Windows продолжалось, первоначально для обратной совместимости со старыми версиями Windows, а теперь по привычке вместе с проблемами, которые это создает.
Проблемы с именем команды
Использование расширения имени файла в имени команды появляется иногда, обычно как побочный эффект команды, реализованной в виде сценария, например, для Оболочка Bourne или для Python , а имя интерпретатора добавляется к имени команды, практика, распространенная в системах, которые полагаются на связи между расширением имени файла и интерпретатором, но резко устарела в UNIX производные системы, такие как Linux и Apple macOS , где интерпретатор обычно указывается как заголовок в сценарии («shebang »).
В системах, основанных на ассоциациях, расширение имени файла обычно сопоставляется с одним общесистемным выбором интерпретатора для этого расширения (например, «.py» означает использование Python), а сама команда запускается из командной строки, даже если расширение не указано (при условии, что выполнена соответствующая настройка). Если язык реализации изменяется, расширение имени команды также изменяется, и ОС обеспечивает согласованный API , позволяя использовать одну и ту же версию команды без расширения в обоих случаях. Этот метод в некоторой степени страдает от по существу глобального характера сопоставления ассоциаций, а также от того, что разработчики не полностью избегают расширений при вызове программ, и что разработчики не могут принудительно этого избежать. Windows - единственный оставшийся широко распространенный работодатель этого механизма.
В системах с директивами интерпретатора , включая практически все версии Unix, расширения имен команд не имеют особого значения и по стандартной практике не используются, поскольку основной метод установки интерпретаторов для сценариев состоит в том, чтобы начинать их с единственной строки, определяющей используемый интерпретатор (который можно рассматривать как вырожденную ветвь ресурсов ). В этих средах включение расширения в имя команды излишне раскрывает детали реализации, которые подвергают все ссылки на команды из других программ будущему риску, если реализация изменится. Например, было бы совершенно нормально, если бы сценарий оболочки был переопределен на Python или Ruby, а затем на C или C ++, и все это изменило бы имя команды, если бы использовались расширения. Без расширений программа всегда имеет одно и то же имя без расширений, с изменением только директивы интерпретатора и / или магического числа , а ссылки на программу из других программ остаются действительными.
Проблемы безопасности
По умолчанию Проводник , обозреватель файлов, поставляемый с Microsoft Windows , не отображает расширения имен файлов. Злоумышленники пытались распространить компьютерные вирусы и компьютерные черви , используя имена файлов, имеющие вид LOVE-LETTER-FOR-YOU.TXT.vbs . Есть надежда, что это будет выглядеть как LOVE-LETTER-FOR-YOU.TXT , безвредный текстовый файл, без предупреждения пользователя о том, что это вредоносная компьютерная программа, в данном случае написанная на VBScript . Поведение по умолчанию для ReactOS - отображение расширений файлов в ReactOS Explorer .
Более поздних версиях Windows (начиная с Windows XP Service Pack 2 и Windows Server 2003 ) включал настраиваемые списки расширений файлов, которые следует считать «опасными» в определенных «зонах» работы, например, когда загружает из сети или получает как вложение к электронному письму. Современные системы антивирусного программного обеспечения также помогают защитить пользователей от таких попыток атак там, где это возможно.
Некоторые вирусы используют схожесть между доменом верхнего уровня «.com » и расширением имени файла «.COM» , отправка вредоносных, исполняемых файлов командных файлов по электронной почте под именами, внешне похожими на URL-адреса (например, "myparty.yahoo.com"), в результате чего некоторые наивные пользователи нажимают на встроенные в электронную почту ссылки, которые, по их мнению, ведут на веб-сайты, но фактически загружают и выполняют вредоносные вложения.
Были случаи вредоносного ПО , созданного для использования уязвимостей в некоторых приложениях Windows, которые могли вызвать переполнение стека буфера при открытии файла с слишком длинным, необработанное расширение имени файла.
Расширение имени файла - это просто маркер, и содержимое файла не обязательно должно совпадать с ним. Его можно использовать для маскировки вредоносного содержимого. Поэтому при попытке идентифицировать файл по соображениям безопасности считается опасным полагаться только на расширение, и предпочтительным является надлежащий анализ содержимого файла. Например, в системах, производных от UNIX , нередко можно найти файлы без расширений вообще, поскольку вместо них предназначены такие команды, как file (command) , и они будут прочтите заголовок файла, чтобы определить его содержимое.
Альтернативы
BeOS , чья файловая система BFS поддерживает расширенные атрибуты, пометит файл с его типом носителя как расширенный атрибут. KDE и GNOMEокружения рабочего стола связывают тип носителя с файлом, исследуя суффикс имени файла и его содержимое в виде файл как эвристика . Они выбирают приложение для запуска при открытии файла на основе этого типа носителя, уменьшая зависимость от расширений файлов. macOS использует как расширения файлов, так и типы носителей, а также коды типов файлов , чтобы выбрать унифицированный идентификатор типа , с помощью которого можно определить тип файла внутри.
Самой главной функцией расширения файлов является возможность устанавливать соответствие каждого расширения с программой, которая может открывать и обрабатывать такие файлы. Расширения помогают операционной системе оперативно идентифицировать соответствующую программу, предназначенную для каждого конкретного файла, и автоматически запускать ее. Также, если отображается расширение имени файла, то работа с ним будет более безопасной, и возможность открыть вредоносный файл существенно снижается. [Источник 2]
Расширение обычно отделяется от основной части имени файла точкой. В операционных системах CP/M и MS-DOS длина расширения была ограничена тремя символами, в современных операционных системах это ограничение отсутствует. Иногда могут использоваться несколько расширений, следующих друг за другом, например, «.tar.gz». [Источник 3]
В файловой системе FAT16 имя файла и расширение являлись отдельными сущностями, а точка, разделявшая их, реально не являлась частью полного имени файла и служила лишь для визуального отделения имени файла от расширения. В файловых системах FAT32 и NTFS точка стала обычным разрешённым символом в имени файла, поэтому ограничения на количество точек в имени файла в этих системах и их местоположения были сняты (за некоторыми исключениями, например, все конечные точки в именах файлов просто отбрасываются).
Кроме того, расширение указывает ОС программу, которой его следует запускать и тип информации содержащийся внутри. Также, некоторые форматы могут иметь свой способ кодирования. Например, «.jpg», «.jpg», «.jpg» (форматы изображений), могут иметь разную кодировку. Так, не всегда получится открыть один и тот же элемент, например, «.mkv» программой, которая по сути должна его открывать, если она не понимает внутреннюю кодировку.Существует возможность в любой момент самим сменить расширения файла, но необходимо иметь в виду, что после самостоятельного изменения, например, с .txt (текстовый) в .mp3 (аудио), он точно не откроется, так как, текст сам не переконвертируется в музыку.
Типы расширений
- Выполняемые: .exe, .bat
- Текстовые и другие документы: .txt, .doc, .docx, .rtf
- Картинки: .jpg, .tiff, .bmp, .jpg, .jpg
- Аудио — Видео: .mp3, .mp4, .mpg, .avi, .mkv, .vob
- Системные библиотеки: dll
Типы файлов в операционной системе Windows
Рисунок 2 - Разница в представлении расширений файлов в W7 и W XP
Файл с расширением .tif
TIF - графический формат, который часто используется для хранения изображений с большой палитрой цветов, например, цифровых фотографий или отсканированных документов. Одним из больших преимуществ формата является поддержка тегов и возможность сохранения нескольких изображений в один файл.
Благодаря тегам формат является расширяемым, и в файлах TIF возможно сохранить дополнительную информацию. Например, в Adobe Photoshop можно сохранить в TIF-файле (опционально) информацию о слоях.
Файлы TIF могут быть сохранены как вообще без использования сжатия, так и с его применением по алгоритмам JPEG, ZIP, LZW и некоторым другим. Сжатие TIF-изображения по алгоритмам ZIP и LZW позволяет уменьшить размер файла без потерь качества.
Файл с расширением .doc
Файл DOC - документ Microsoft Word, без сомнения, самой популярной программы для работы с текстами. Word входит в поставку всех версий офисного пакета Microsoft Office.
Файлы формата DOC содержат самую разную информацию о форматировании текста - шрифты, их начертание, выравнивание текста, отступы, абзацы, списки, колонки и т.д.
Документы Microsoft Word также могут включать в себя изображения, диаграммы, таблицы, сценарии. Кроме различных объектов, текста и информации о его форматировании, файл DOC содержит параметры самого документа, печати.
Начиная с Microsoft Word версии 2007 по умолчанию для новых документов используется формат .DOCX.
Файл с расширением .jpg
Подробное описание JPG - самый популярный на сегодняший день формат изображений, разработан компанией Joint Photographic Experts Group (JPEG). Благодаря хорошей степени сжатия и поддержке глубины цвета в 24 бит, файлы с расширениями JPG/JPEG используются практически во всех цифровых фотоаппаратах и камерах.
Также, формат JPG очень широко распространен в интернете, почти всегда используется веб-разработчиками, ведь сжатие позволяет значительно уменьшить размер изображений. Степень сжатия может быть разной - чем она больше, тем меньше размер файла, но хуже качество и наоборот. Недостатком формата является отсутствие поддержки прозрачности.
Расширения JPG и JPEG полностью равнозначны, это один и тот же формат разница между ними только в одной букве расширения.
Файл с расширением .mkv
Формат видео-контейнера, похож на .AVI, .MOV, тем, что поддерживает несколько алгоритмов сжатия. Формат MKV может содержать различные текстовые субтитры (SRT, SSA, USF).
Формат Matroska вначале стал популярен в аниме-сообществах, поскольку данный формат поддерживает добавление субтитров и нескольких звуковых дорожек в один файл.
Также, файлы MKV можно смотреть на различных мобильных устройствах (Palm, Symbian, Pocket PC) с помощью программы CorePlayer.
Файл EXE - Windows, DOS-приложение или самораспаковывающийся архив. Любой файл в ОС Windows с расширением EXE открывается двойным щелчком мыши.
Файлы install.exe или setup.exe - это приложения, которые устанавливают программное обеспечение на компьютер. Двойной клик по ним инициализирует процесс установки.
В Mac OS EXE-приложения также могут быть запущены, но не напрямую, а с помощью эмуляторов Windows (например, Parallels Desktop или VMware Fusion).
Файл с расширением .xls
Файл XLS - электронная таблица, созданная в Microsoft Excel - самом популярном приложении для работы с таблицами. Данные в документе хранятся в ячейках, каждая из которых имеет определенный адрес (колонки нумеруются английскими буквами, строки - цифрами; например: A1 - левая верхняя ячейка).
Каждая ячейка может содержать как фиксированные данные, так и формулы, часто связанные с данными в других ячейках. Как и в документе Microsoft Word (.DOC), формат XLS позволяет пользователю изменять представление текста: его шрифт, цвет, начертание, выравнивание (в ячейке) и другие параметры. Кроме того, документ может содержать изображения, а также диаграммы, построенные на основе данных в определенных ячейках.
Формат XLS долгое время был основным в Microsoft Excel, но начиная с версии 2007 приложение по умолчанию создает новые документы в формате (.XLSX).
Файл с расширением .jpg
Файл PNG - растровое изображение, сохраненное в формате Portable Network Graphic. В каждом PNG-рисунке содержится палитра - набор используемых цветов. Для уменьшения размера файла применяется сжатие без потерь качества по алгоритму Deflate. Используется преимущественно в Интернете в качестве изображений для веб-страниц.
Однако, в отличие от предшественника, этот формат не поддерживает анимацию. С этой целью был создан другой формат MNG. В файлах PNG также невозможно использование палитры CMYK, потому как этот формат не предназначен для профессиональной работы с графикой.
Файлы PNG можно открыть в любом браузере и практически в любой программе для просмотра и редактирования изображений. В Windows файл с расширением PNG можно открыть двойным кликом мыши.
Файл с расширением .iso
Файл ISO - образ данных CD или DVD диска, основан на стандарте ISO-9660. Файл-образ содержит точную копию физического компакт-диска: данные, информацию о файловой системе, структуру директорий, атрибуты файлов и загрузочную информацию.
Образы дисков очень полезны для создания копий CD и DVD-дисков. При создании образа копируется каждый бит компакт-диска в соответствии с оригинальным носителем. При простом копировании файлов с CD или DVD на жесткий диск, будет утеряна информация о дорожках, заголовки диска, загрузочная информация. С существующего образа диска можно впоследствии легко восстановить оригинальную версию скопированного компакт-диска.
Для создания образов и эмуляции дисков существует огромное количество различных программ.
Формат ISO - пожалуй, самый распространенный формат образов дисков. Также, очень распространен похожий на ISO формат .MDF.
Файл с расширением .bmp
BMP - популярный формат несжатого растрового изображения. В заголовке файла записана информация об изображении - размер файла, ширина и высота рисунка, глубина пикселей, количество цветов. После заголовка может следовать палитра. Далее идет непосредственно набор данных о пикселях, который идентифицирует положение каждого пикселя и его цвет.
Файлы BMP поддерживают несколько различных глубин цвета - от черно-белого изображения (1 бит) до Deep color (64 бит). Реализована поддержка частичной прозрачности различной битности. Достоинством формата является тот факт, что изображение хранится без потерь качества. Однако, чем больше геометрические размеры BMP-изображения и цветовая глубина, тем больше размер файла.
К примеру, размер обычной фотографии с глубиной цвета 24 бит может легко достигнуть 15 МБ и более. Поэтому сфера целенаправленного применения формата ограничена. В основном, он используется для больших монохромных изображений - пиктограмм, схем, чертежей - там, где очень важна точная передача деталей.
Поддержка формата BMP интегрирована в Windows, таким образом файл можно открыть двойным щелчком мыши.
Файл с расширением .mts
Файл MTS содержит видео высокой четкости (HD), используется в видеокамерах Sony, Panasonic и других. Формат основан на алгоритме кодирования MPEG-2 и поддерживает HD-видео в формате 720p и 1080i.
Формат файла MTS получил название "AVCHD" (Advanced Video Codec High Definition) - Расширенный Видео Кодек Высокой Четкости. Разработан в 2006 году совместно компаниями Sony и Panasonic.
Файл с расширением .xml
XML - расширяемый язык разметки (англ. Extensible Markup Language). Файл XML - документ, в котором использованы теги для определения объектов и их атрибутов. Форматирование данных напоминает язык разметки HTML-документов. Но в отличие от HTML, в XML используются теги, которые задаются пользователями.
Структура XML-документа представляет собой дерево элементов. Некоторые элементы имеют содержимое и атрибуты. Например, <tag attr="attrval">value</tag> Здесь <tag>,</tag> - открывающий и закрывающий теги элемента, attr - атрибут, attrval - значение атрибута, value - содержимое.
XML-файлы и файлы других расширений, основанные на языке XML, получили очень широкое распространение. В XML-файлах хранятся самые различные данные - от настроек приложений до баз данных. Файлы на основе XML используются для обмена информацией в Интернете и между программами (для этого данный язык разметки и был изначально задуман). Т.к. файлы формата XML содержат текстовые данные, их можно легко отредактировать в любом текстовом редакторе.
Файл с расширением .pdf
Файл .PDF - документ, созданный с помощью программы Adobe Acrobat, соответствующего плагина для web-браузера, либо стороннего софта. Формат PDF на сегодняшний день приобрел огромную популярность благодаря тому, что он поддерживается практически всеми устройствами и операционными системами. Поэтому документы этого формата отлично подходят для обмена данными между пользователями.
PDF-документы могут быть открыты с помощью бесплатной версии Adobe Reader или web-плагина, который доступен для большинства интернет-браузеров. В некоторых браузерах, в частности, в Google Chrome обеспечена поддержка этого формата даже без установленного плагина. Редактировать файлы PDF можно с помощью платной версии Adobe Reader. Также, существует огромное количество программ как для открытия и работы с данным форматом, так и для конвертации других документов из/в этот формат.
Файлы PDF могут содержать текст, изображения, формы, аннотации и другие данные. Примечательно то, что отображение документа не зависит от платформы - что в Windows, что, к примеру, в Mac OS, документы будут выглядеть одинаково, также, как и при печати.
Файл с расширением .txt
Файл TXT - стандартный текстовый документ Windows. Содержит текст без форматирования. Может быть открыт любой программой для работы с текстом. Самая простая и доступная - Блокнот Windows, текстовые файлы по умолчанию ассоциированы именно с ней.
Текстовые файлы также открывают и большинство других программ, например, любые браузеры - Internet Explorer, Chrome или Firefox. Не является проблемой открытие текстовых файлов и на мобильных устройствах, в других операционных системах.
Файл с расширением .xps
Файл содержит информацию, записанную в формате XPS (XML Paper Specification). Данный формат может содержать метки, а также информацию, необходимую для печати документа.
Формат XPS был разработан в качестве замены формату Enhanced Metafile (.EMF). Файл формата XPS похож на файл .PDF, но основан на XML вместо языка PostScript.
Файл XPS может быть открыт программой Microsoft XPS Viewer (в Windows Vista), а также с помощью программы XPS Essentials Pack, которую можно загрузить с официального сайта Microsoft (для открытия файла в Windows XP).
Точность указания
Иногда расширение указывает формат лишь в общем (например, расширение .doc использовалось для множества различных форматов текста — как простого, так и форматированного; а расширение «txt» не даёт никакой информации о том, в какой кодировке текст в файле), из‑за чего необходимо использовать и другие способы определения формата.
Иногда расширение указывает только один из используемых в файле форматов (например, расширение «.ogg» первоначально использовалось для всех файлов в формате Ogg, независимо от кодеков, которыми закодированы содержащиеся в контейнере Ogg данные). Также расширение обычно не указывает версию формата (например, файлы в разных версиях XHTML могут использовать одни и те же расширения).
Самой главной функцией расширения файлов является возможность устанавливать соответствие каждого расширения с программой, которая может открывать и обрабатывать такие файлы. Расширения помогают операционной системе оперативно идентифицировать соответствующую программу, предназначенную для каждого конкретного файла, и автоматически запускать ее. Также, если отображается расширение имени файла, то работа с ним будет более безопасной, и возможность открыть вредоносный файл существенно снижается. [Источник 2]
Расширение обычно отделяется от основной части имени файла точкой. В операционных системах CP/M и MS-DOS длина расширения была ограничена тремя символами, в современных операционных системах это ограничение отсутствует. Иногда могут использоваться несколько расширений, следующих друг за другом, например, «.tar.gz». [Источник 3]
В файловой системе FAT16 имя файла и расширение являлись отдельными сущностями, а точка, разделявшая их, реально не являлась частью полного имени файла и служила лишь для визуального отделения имени файла от расширения. В файловых системах FAT32 и NTFS точка стала обычным разрешённым символом в имени файла, поэтому ограничения на количество точек в имени файла в этих системах и их местоположения были сняты (за некоторыми исключениями, например, все конечные точки в именах файлов просто отбрасываются).
Кроме того, расширение указывает ОС программу, которой его следует запускать и тип информации содержащийся внутри. Также, некоторые форматы могут иметь свой способ кодирования. Например, «.jpg», «.jpg», «.jpg» (форматы изображений), могут иметь разную кодировку. Так, не всегда получится открыть один и тот же элемент, например, «.mkv» программой, которая по сути должна его открывать, если она не понимает внутреннюю кодировку.Существует возможность в любой момент самим сменить расширения файла, но необходимо иметь в виду, что после самостоятельного изменения, например, с .txt (текстовый) в .mp3 (аудио), он точно не откроется, так как, текст сам не переконвертируется в музыку.
Типы расширений
- Выполняемые: .exe, .bat
- Текстовые и другие документы: .txt, .doc, .docx, .rtf
- Картинки: .jpg, .tiff, .bmp, .jpg, .jpg
- Аудио — Видео: .mp3, .mp4, .mpg, .avi, .mkv, .vob
- Системные библиотеки: dll
Типы файлов в операционной системе Windows
Рисунок 2 - Разница в представлении расширений файлов в W7 и W XP
Файл с расширением .tif
TIF - графический формат, который часто используется для хранения изображений с большой палитрой цветов, например, цифровых фотографий или отсканированных документов. Одним из больших преимуществ формата является поддержка тегов и возможность сохранения нескольких изображений в один файл.
Благодаря тегам формат является расширяемым, и в файлах TIF возможно сохранить дополнительную информацию. Например, в Adobe Photoshop можно сохранить в TIF-файле (опционально) информацию о слоях.
Файлы TIF могут быть сохранены как вообще без использования сжатия, так и с его применением по алгоритмам JPEG, ZIP, LZW и некоторым другим. Сжатие TIF-изображения по алгоритмам ZIP и LZW позволяет уменьшить размер файла без потерь качества.
Файл с расширением .doc
Файл DOC - документ Microsoft Word, без сомнения, самой популярной программы для работы с текстами. Word входит в поставку всех версий офисного пакета Microsoft Office.
Файлы формата DOC содержат самую разную информацию о форматировании текста - шрифты, их начертание, выравнивание текста, отступы, абзацы, списки, колонки и т.д.
Документы Microsoft Word также могут включать в себя изображения, диаграммы, таблицы, сценарии. Кроме различных объектов, текста и информации о его форматировании, файл DOC содержит параметры самого документа, печати.
Начиная с Microsoft Word версии 2007 по умолчанию для новых документов используется формат .DOCX.
Файл с расширением .jpg
Подробное описание JPG - самый популярный на сегодняший день формат изображений, разработан компанией Joint Photographic Experts Group (JPEG). Благодаря хорошей степени сжатия и поддержке глубины цвета в 24 бит, файлы с расширениями JPG/JPEG используются практически во всех цифровых фотоаппаратах и камерах.
Также, формат JPG очень широко распространен в интернете, почти всегда используется веб-разработчиками, ведь сжатие позволяет значительно уменьшить размер изображений. Степень сжатия может быть разной - чем она больше, тем меньше размер файла, но хуже качество и наоборот. Недостатком формата является отсутствие поддержки прозрачности.
Расширения JPG и JPEG полностью равнозначны, это один и тот же формат разница между ними только в одной букве расширения.
Файл с расширением .mkv
Формат видео-контейнера, похож на .AVI, .MOV, тем, что поддерживает несколько алгоритмов сжатия. Формат MKV может содержать различные текстовые субтитры (SRT, SSA, USF).
Формат Matroska вначале стал популярен в аниме-сообществах, поскольку данный формат поддерживает добавление субтитров и нескольких звуковых дорожек в один файл.
Также, файлы MKV можно смотреть на различных мобильных устройствах (Palm, Symbian, Pocket PC) с помощью программы CorePlayer.
Файл EXE - Windows, DOS-приложение или самораспаковывающийся архив. Любой файл в ОС Windows с расширением EXE открывается двойным щелчком мыши.
Файлы install.exe или setup.exe - это приложения, которые устанавливают программное обеспечение на компьютер. Двойной клик по ним инициализирует процесс установки.
В Mac OS EXE-приложения также могут быть запущены, но не напрямую, а с помощью эмуляторов Windows (например, Parallels Desktop или VMware Fusion).
Файл с расширением .xls
Файл XLS - электронная таблица, созданная в Microsoft Excel - самом популярном приложении для работы с таблицами. Данные в документе хранятся в ячейках, каждая из которых имеет определенный адрес (колонки нумеруются английскими буквами, строки - цифрами; например: A1 - левая верхняя ячейка).
Каждая ячейка может содержать как фиксированные данные, так и формулы, часто связанные с данными в других ячейках. Как и в документе Microsoft Word (.DOC), формат XLS позволяет пользователю изменять представление текста: его шрифт, цвет, начертание, выравнивание (в ячейке) и другие параметры. Кроме того, документ может содержать изображения, а также диаграммы, построенные на основе данных в определенных ячейках.
Формат XLS долгое время был основным в Microsoft Excel, но начиная с версии 2007 приложение по умолчанию создает новые документы в формате (.XLSX).
Файл с расширением .jpg
Файл PNG - растровое изображение, сохраненное в формате Portable Network Graphic. В каждом PNG-рисунке содержится палитра - набор используемых цветов. Для уменьшения размера файла применяется сжатие без потерь качества по алгоритму Deflate. Используется преимущественно в Интернете в качестве изображений для веб-страниц.
Однако, в отличие от предшественника, этот формат не поддерживает анимацию. С этой целью был создан другой формат MNG. В файлах PNG также невозможно использование палитры CMYK, потому как этот формат не предназначен для профессиональной работы с графикой.
Файлы PNG можно открыть в любом браузере и практически в любой программе для просмотра и редактирования изображений. В Windows файл с расширением PNG можно открыть двойным кликом мыши.
Файл с расширением .iso
Файл ISO - образ данных CD или DVD диска, основан на стандарте ISO-9660. Файл-образ содержит точную копию физического компакт-диска: данные, информацию о файловой системе, структуру директорий, атрибуты файлов и загрузочную информацию.
Образы дисков очень полезны для создания копий CD и DVD-дисков. При создании образа копируется каждый бит компакт-диска в соответствии с оригинальным носителем. При простом копировании файлов с CD или DVD на жесткий диск, будет утеряна информация о дорожках, заголовки диска, загрузочная информация. С существующего образа диска можно впоследствии легко восстановить оригинальную версию скопированного компакт-диска.
Для создания образов и эмуляции дисков существует огромное количество различных программ.
Формат ISO - пожалуй, самый распространенный формат образов дисков. Также, очень распространен похожий на ISO формат .MDF.
Файл с расширением .bmp
BMP - популярный формат несжатого растрового изображения. В заголовке файла записана информация об изображении - размер файла, ширина и высота рисунка, глубина пикселей, количество цветов. После заголовка может следовать палитра. Далее идет непосредственно набор данных о пикселях, который идентифицирует положение каждого пикселя и его цвет.
Файлы BMP поддерживают несколько различных глубин цвета - от черно-белого изображения (1 бит) до Deep color (64 бит). Реализована поддержка частичной прозрачности различной битности. Достоинством формата является тот факт, что изображение хранится без потерь качества. Однако, чем больше геометрические размеры BMP-изображения и цветовая глубина, тем больше размер файла.
К примеру, размер обычной фотографии с глубиной цвета 24 бит может легко достигнуть 15 МБ и более. Поэтому сфера целенаправленного применения формата ограничена. В основном, он используется для больших монохромных изображений - пиктограмм, схем, чертежей - там, где очень важна точная передача деталей.
Поддержка формата BMP интегрирована в Windows, таким образом файл можно открыть двойным щелчком мыши.
Файл с расширением .mts
Файл MTS содержит видео высокой четкости (HD), используется в видеокамерах Sony, Panasonic и других. Формат основан на алгоритме кодирования MPEG-2 и поддерживает HD-видео в формате 720p и 1080i.
Формат файла MTS получил название "AVCHD" (Advanced Video Codec High Definition) - Расширенный Видео Кодек Высокой Четкости. Разработан в 2006 году совместно компаниями Sony и Panasonic.
Файл с расширением .xml
XML - расширяемый язык разметки (англ. Extensible Markup Language). Файл XML - документ, в котором использованы теги для определения объектов и их атрибутов. Форматирование данных напоминает язык разметки HTML-документов. Но в отличие от HTML, в XML используются теги, которые задаются пользователями.
Структура XML-документа представляет собой дерево элементов. Некоторые элементы имеют содержимое и атрибуты. Например, <tag attr="attrval">value</tag> Здесь <tag>,</tag> - открывающий и закрывающий теги элемента, attr - атрибут, attrval - значение атрибута, value - содержимое.
XML-файлы и файлы других расширений, основанные на языке XML, получили очень широкое распространение. В XML-файлах хранятся самые различные данные - от настроек приложений до баз данных. Файлы на основе XML используются для обмена информацией в Интернете и между программами (для этого данный язык разметки и был изначально задуман). Т.к. файлы формата XML содержат текстовые данные, их можно легко отредактировать в любом текстовом редакторе.
Файл с расширением .pdf
Файл .PDF - документ, созданный с помощью программы Adobe Acrobat, соответствующего плагина для web-браузера, либо стороннего софта. Формат PDF на сегодняшний день приобрел огромную популярность благодаря тому, что он поддерживается практически всеми устройствами и операционными системами. Поэтому документы этого формата отлично подходят для обмена данными между пользователями.
PDF-документы могут быть открыты с помощью бесплатной версии Adobe Reader или web-плагина, который доступен для большинства интернет-браузеров. В некоторых браузерах, в частности, в Google Chrome обеспечена поддержка этого формата даже без установленного плагина. Редактировать файлы PDF можно с помощью платной версии Adobe Reader. Также, существует огромное количество программ как для открытия и работы с данным форматом, так и для конвертации других документов из/в этот формат.
Файлы PDF могут содержать текст, изображения, формы, аннотации и другие данные. Примечательно то, что отображение документа не зависит от платформы - что в Windows, что, к примеру, в Mac OS, документы будут выглядеть одинаково, также, как и при печати.
Файл с расширением .txt
Файл TXT - стандартный текстовый документ Windows. Содержит текст без форматирования. Может быть открыт любой программой для работы с текстом. Самая простая и доступная - Блокнот Windows, текстовые файлы по умолчанию ассоциированы именно с ней.
Текстовые файлы также открывают и большинство других программ, например, любые браузеры - Internet Explorer, Chrome или Firefox. Не является проблемой открытие текстовых файлов и на мобильных устройствах, в других операционных системах.
Файл с расширением .xps
Файл содержит информацию, записанную в формате XPS (XML Paper Specification). Данный формат может содержать метки, а также информацию, необходимую для печати документа.
Формат XPS был разработан в качестве замены формату Enhanced Metafile (.EMF). Файл формата XPS похож на файл .PDF, но основан на XML вместо языка PostScript.
Файл XPS может быть открыт программой Microsoft XPS Viewer (в Windows Vista), а также с помощью программы XPS Essentials Pack, которую можно загрузить с официального сайта Microsoft (для открытия файла в Windows XP).
Точность указания
Иногда расширение указывает формат лишь в общем (например, расширение .doc использовалось для множества различных форматов текста — как простого, так и форматированного; а расширение «txt» не даёт никакой информации о том, в какой кодировке текст в файле), из‑за чего необходимо использовать и другие способы определения формата.
Иногда расширение указывает только один из используемых в файле форматов (например, расширение «.ogg» первоначально использовалось для всех файлов в формате Ogg, независимо от кодеков, которыми закодированы содержащиеся в контейнере Ogg данные). Также расширение обычно не указывает версию формата (например, файлы в разных версиях XHTML могут использовать одни и те же расширения).
Читайте также: