Согласно файлу или файла как
Как узнать тип файла без расширения или с неправильным расширением
Команда file может определить тип файла для обычных файлов и используемую файловую систему для дисков.
Утилита file используется «магические» байты. Суть в том, что файлы одного типа имеют одинаковые байты в определённых местах файла, программа file использует обширную базу данных в которых описаны типы файлов и какие последовательности байтов в каких местах располагаются. Благодаря этому с помощью file можно определить тип файалов без расширения или с неправильным расширением.
Использование очень простое — укажите одно или несколько имён файлов, то есть:
Чтобы узнать тип файла без расширения, имеющего имя «file1» нужно выполнить команду:
Вначале идёт имя файла, а затем через двоеточия показывается информация о нём. В этом примере это JPEG, то есть изображение. Также для данного файла частично показана метаинформация.
Если вы не хотите, чтобы вначале показывалось имя файла, то используйте опцию -b:
Как проверить тип сразу нескольких файлов
Как можно увидеть на скриншоте, в текущей папке имеется несколько файлов без расширений. Узнаем тип каждого из них.
Можно указать имена всех файлов или использовать * (звёздочка) чтобы проверить все файлы в текущей директории:
Удалось определить тип каждого файла:
Как по типу файла узнать расширение
Чтобы узнать правильное расширение для файла определённого типа используйте опцию --extension:
Как сделать так, чтобы не менялась дата доступа к файлу при использовании file
Программа file считывает данные из файла и, следовательно, меняет дату последнего доступа к нему. Опция -p, --preserve-date в системах, поддерживающих utime или utimes, попытается сохранить время доступа к анализируемым файлам, чтобы сделать вид, что файл никогда их не читался.
Как узнать файловую систему диска
Для файлов образов файловых систем, программа file покажет тип файловой системы. Для дисков эта утилита также умеет определять тип файловой системы, но требуется использование двух дополнительных опций, поскольку файл блочного устройства это специальный файл, а иногда это просто ссылка на специальный файл.
Опция -L, --dereference заставляет следовать по символическим ссылкам, как опция с подобным именем в ls (в системах, которые поддерживают символические ссылки). Это значение по умолчанию, если определена переменная среды POSIXLY_CORRECT.
Обычно file пытается только прочитать и определить тип файлов, переданных в качестве аргументов, о которых stat сообщает как обычные файлы. Это предотвращает проблемы, поскольку чтение специальных файлов может иметь специфические последствия. Указание опции -s, --special-files заставляет файл также читать файлы, которые являются специальными блочными или символьными файлами. Это полезно для определения типов файловой системы данных в необработанных разделах диска, которые являются специальными блочными файлами. Эта опция также заставляет файл игнорировать размер файла, сообщаемый stat, поскольку в некоторых системах он сообщает нулевой размер для необработанных разделов диска.
Следующая информация выведет данные о файловой системе диска /dev/sda:
Как следует из вывода, это файловая система ext4. Также показаны некоторые её характеристики и поддерживаемые возможности.
Без опции -s, то есть командой
мы получили бы следующий результат:
Как в file заглянуть во внутрь сжатых файлов
С помощью опции -z, --uncompress можно попытаться заглянуть во внутрь сжатых файлов. Опция не всегда работает и иногда из-за неё работа file завершается ошибкой.
Самые опасные утечки конфиденциальных данных — это те, о которых люди даже не подозревают.
Минутка риторики. IT-угрозы какого типа опасны для корпораций и небольших компаний, правительств стран и отдельных людей? Утечки конфиденциальных данных. Какие утечки сложнее всего предотвратить? Те, о возможности которых жертвы даже не подозревают.
Не подозревают они, кроме всего прочего, о метаданных, легко превращающих обыкновенный электронный документ в ценный компрометирующий материал.
Метаданные в документах: какие они бывают
Начнем с теории. По классификации, используемой американской Фемидой, выделяют три категории метаданных:
1. Метаданные приложений. Они добавляются в файл приложением, в котором он создается, и хранят внесенные пользователем в документ изменения: журнал сделанных правок, комментарии.
2. Системные метаданные. Включают имя автора, название и размер файла, даты создания, изменения и так далее.
3. Внедренные метаданные. Сюда относятся формулы в ячейках электронных таблиц, гиперссылки, связанные файлы. К этой же категории причисляют и EXIF-метаданные графических файлов — о них мы уже рассказывали подробно.
Классический пример неприятностей от метаданных — отчет правительства Великобритании о наличии у Ирака оружия массового поражения, опубликованный в 2003 году. В DOC-файле отчета обнаружились сведения об авторах документа (точнее, о тех, кто сохранил последние 10 редакций файла). Этот список вызвал серьезные подозрения в качестве, достоверности и оригинальности отчета.
Как написала по следам скандала BBC, в итоге правительство Великобритании для публикации документов вместо формата DOC предпочло использовать PDF, несущий меньше метаданных.
Фальшивый файл ценой $20 миллионов
Любопытную историю разоблачения с помощью метаданных рассказали в 2015 году сотрудники американской юридической компании Venable. К ним обратилась некая компания, из которой уволился вице-президент. Вскоре у этой компании сорвался госконтракт — его с помощью уволившегося сотрудника получила конкурирующая организация.
Второе доказательство подделки файла заключалось в дате его создания на корпоративном сервере: он был создан уже после начала разбирательства. Кроме того, ответчиков уличили в манипуляции с датами последней модификации файлов формата OLM (файл почтовой базы Microsoft Outlook для Mac).
Суд счел эти доказательства достаточными для установления вины ответчиков и присудил истцу $20 млн компенсации плюс судебные издержки.
Скрытные файлы
А еще есть заметки к слайдам презентаций, скрытые столбцы в электронных таблицах…
Кстати, попытки спрятать информацию без знания матчасти тоже чреваты. В качестве примера можно рассмотреть опубликованный на сайте CBSLocal документ судебной тяжбы между правительством США и бывшим губернатором Иллинойса Родом Благоевичем о вызове в качестве свидетеля Барака Обамы, датированный 2010 годом.
Часть текста скрыта от любопытствующих глаз черными прямоугольниками. Но можно выделить мышкой все строки, скопировать их в буфер обмена и вставить в текстовый редактор. Теперь можно прочитать весь текст.
Черные прямоугольники в PDF помогут спрятать информацию при печати, но в электронном виде обойти их проще простого
Файлы с двойным дном
Отдельная песня — внедренные в документ данные внешних файлов.
Посмотрим, что можно найти в общедоступных источниках. Поискав документы в домене .gov, мы приметили налоговый отчет министерства образования США за 2010 финансовый год.
Файл Word с отчетом, а внутри — файл Excel с множеством исходных данных для этой и других диаграмм
Понятно, что в таких внедренных файлах может быть практически все что угодно, ведь тому, кто публиковал исходный документ, наверняка казалось, что это никто не увидит.
Урожай метаданных
FOCA может найти и загрузить с исследуемого сайта документы нужных форматов (например, DOCX и PDF), проанализировать их метаданные, а также рассказать многое об организации: используемое серверное ПО, имена пользователей и так далее.
Предостережение: изучение сайтов с помощью подобных инструментов даже в исследовательских целях может не понравиться их владельцам, а то и вовсе сойти за киберпреступление.
Документированные странности
Предлагаем пару особенностей метаданных, о которых, по нашим наблюдениям, знает не каждый IT-специалист. Возьмем для примера файловую систему NTFS, используемую операционными системами Windows.
Первая неочевидная вещь. Если удалить какой-либо файл из папки и сразу сохранить новый файл с тем же именем в эту же папку, то дата создания нового файла останется от старого, удаленного файла. То есть файл мы создали только что, но система уверяет, что он существует уже давно.
Вторая неочевидная вещь. NTFS среди прочего хранит дату последнего доступа к файлу. Однако если открыть файл, а потом посмотреть дату доступа к нему в свойствах, то можно увидеть, что она осталась неизменной.
Может даже показаться, что это баги, но нет: обе странности являются документированными особенностями. В первом случае работает так называемый механизм туннелирования (англ. tunneling), который нужен для совместимости со старыми программами. По умолчанию эффект длится 15 секунд, в течение которых новый файл получает дату создания своего предшественника (настроить этот интервал или вовсе отключить туннелирование можно в реестре). Впрочем, этого хватило, чтобы я сам столкнулся с туннелированием дважды в течение недели при обычной офисной работе.
Второй случай тоже описан в документации: начиная с Windows 7, для повышения производительности Microsoft отключила автоматическую простановку даты последнего доступа к файлу. Включить эту функцию можно в реестре. Впрочем, ее активация не имеет обратной силы — файловая система правильную дату не хранит (проверено низкоуровневым редактором диска).
Надеемся, эксперты по цифровой криминалистике знают все подобные нюансы.
Метаданные: защитные меры
Аналогичные функции удаления метаданных имеет и редактор Adobe Acrobat.
Кроме того, защита от утечек реализуется и в комплексных пакетах информационной безопасности. Так, модуль DLP (Data Loss Prevention) присутствует в Kaspersky Total Security для бизнеса, Kaspersky Security для почтовых серверов и Kaspersky Security для серверов совместной работы. Эти продукты умеют фильтровать такие нежелательные для попадания вовне вещи, как история изменения документа, комментарии и внедренные объекты.
Но идеальный (и, как это и положено идеалам, на все 100% недостижимый) способ побороть любые утечки — это обученные, думающие и ответственные сотрудники.
Файловая система . На каждом носителе информации (гибком, жестком или лазерном диске) может храниться большое количество файлов. Порядок хранения файлов на диске определяется используемой файловой системой.
Каждый диск разбивается на две области: обла сть хранения файлов и каталог. Каталог содержит имя файла и указание на начало его размещения на диске. Если провести аналогию диска с книгой, то область хранения файлов соответствует ее содержанию, а каталог - оглавлению. Причем книга состоит из страниц, а диск - из секторов.
Для дисков с небольшим количеством файлов (до нескольких десятков) может использоваться одноуровневая файловая система , когда каталог (оглавление диска) представляет собой линейную последовательность имен файлов (табл. 1.2). Такой каталог можно сравнить с оглавлением детской книжки, которое содержит только названия отдельных рассказов.
Если на диске хранятся сотни и тысячи файлов, то для удобства поиска используется многоуровневая иерархическая файловая система , которая имеет древовидную структуру. Такую иерархическую систему можно сравнить, например, с оглавлением данного учебника, которое представляет собой иерархическую систему разделов, глав, параграфов и пунктов.
Начальный, корневой каталог содержит вложенные каталоги 1-го уровня, в свою очередь, каждый из последних может содержать вложенные каталоги 2-го уровня и так далее. Необходимо отметить, что в каталогах всех уровней могут храниться и файлы.
Например, в корневом каталоге могут находиться два вложенных каталога 1-го уровня (Каталог_1, Каталог_2) и один файл (Файл_1). В свою очередь, в каталоге 1-го уровня (Каталог_1) находятся два вложенных каталога второго уровня (Каталог_1.1 и Каталог_1.2) и один файл (Файл_1.1) - рис. 1.3.
Файловая система - это система хранения файлов и организации каталогов.
Рассмотрим иерархическую файловую систему на конкретном примере. Каждый диск имеет логическое имя (А:, В: - гибкие диски, С:, D:, Е: и так далее - жесткие и лазерные диски).
Пусть в корневом каталоге диска С: имеются два каталога 1-го уровня (GAMES, TEXT), а в каталоге GAMES один каталог 2-го уровня (CHESS). При этом в каталоге TEXT имеется файл proba.txt, а в каталоге CHESS - файл chess.exe (рис. 1.4).
Рис. 1.4. Пример иерархической файловой системы |
Путь к файлу . Как найти имеющиеся файлы (chess.exe, proba.txt) в данной иерархической файловой системе? Для этого необходимо указать путь к файлу. В путь к файлу входят записываемые через разделитель "\" логическое имя диска и последовательность имен вложенных друг в друга каталогов, в последнем из которых содержится нужный файл. Пути к вышеперечисленным файлам можно записать следующим образом:
Путь к файлу вместе с именем файла называют иногда полным именем файла.
Пример полного имени файла:
Представление файловой системы с помощью графического интерфейса . Иерархическая файловая система MS-DOS, содержащая каталоги и файлы, представлена в операционной системе Windows с помощью графического интерфейса в форме иерархической системы папок и документов. Папка в Windows является аналогом каталога MS-DOS
Однако иерархическая структура этих систем несколько различается. В иерархической файловой системе MS-DOS вершиной иерархии объектов является корневой каталог диска, который можно сравнить со стволом дерева, на котором растут ветки (подкаталоги), а на ветках располагаются листья (файлы).
В Windows на вершине иерархии папок находится папка Рабочий стол. Следующий уровень представлен папками Мой компьютер, Корзина и Сетевое окружение (если компьютер подключен к локальной сети) - рис. 1.5.
Рис. 1.5. Иерархическая структура папок |
Если мы хотим ознакомиться с ресурсами компьютера, необходимо открыть папку Мой компьютер.
1. В окне Мой компьютер находятся значки имеющихся в компьютере дисков. Активизация (щелчок) значка любого диска выводит в левой части окна информацию о его емкости, занятой и свободной частях.
Обеспечительные сделки и защита кредиторов
Юридический Due Diligence
Подготовка к TOLES
Комментарии (7)
А что не так с "моим арбитром"?Постоянно им пользуюсь, никаких проблем не возникает. Внимательно прочитайте, как нужно подавать в суд документы в электронном виде. И таких проблем у вас не возникнет. Азамат Магизов Стерлитамак Начальник юридического отдела, Акционерное общество "Вагоноремонтный завод" Согласен с коллегами. В арбитраже все нормально, в СОЮ еще не подавал. Может Наталья пишет как раз с проблемами в СОЮ?
Наталья, судя по всему, проблема на Вашей стороне.
Попробуйте решить ее пошагово.
Вы отправляете документы в формате .pdf ? Если так, то причина может быть в некачественном скане, наличии засветок и черных пятен на документе, неправильной ориентации (вправо-влево), внедренных в документ макросах.
Если документы имеют формат .doc .docx .xls .xlsx , то причина может быть в том, что в этих файлах внутри могут быть внедрены служебные макросы, которых мы не видим, но они блокируются системой в целях безопасности.
Наталья Джеломанова Cанкт-Петербург Юрист, Дачно-строительный кооператив "Дюны"Вордовые документы исключите, перелопатьте их в .pdf, причем не сканированием распечатанного, а просто при отправке на печать из ворда посмотрите, там есть возможность указать виртуальный принтер PDF вместо принтера по умолчанию, тогда он вместо печати создаст Вам PDF.
Посмотрите на имена файлов, возможно, что проблема в них. Не помню, как сейчас, но раньше было требование о том, чтобы из имени файла было понятно, что это за документ и сколько в нем листов. Я с тех пор взял себе за правило все документы по делу хранить в таком формате:
"ХХ - Наименование документа - 5 л.pdf"
где ХХ - номер приложения в деле. Иск, например, идет под номером 00, приложение 1 - под номером 01.
Так проще работать с документами, и они сортируются в папках по номерам. И бонусом - видно, каких приложений не хватает.
Если нужна подпись на документе, заранее отсканируйте свою подпись и просто вставьте скан в вордовый документ как картинку со свойством "разместить за текстом".
А скриншоты не принял скорее всего из-за разрешающей способности, либо не смог распознать текст в них. Я бы попробовал приложить .jpg в этом случае. Вроде система позволяет это сделать, но сразу скажу, что не пробовал, не натыкался на такие проблемы.
Возможно, дело ещё в том, что в технических требованиях к pdf указано, что в таких файлах должна сохраняться возможность распознавания текста. Может быть, попробуете оптимизировать pdf, если есть чем?
И попутно можно задать вопрос техподдержке "арбитра", они отвечают. Правда, не всегда оперативно.
Читайте также: