Как редактировать mht файл
Поклонники серфинга в сети рано или поздно сталкиваются с вопросом, как открыть файл MHTML . За загадочной аббревиатурой скрывается относительно новый формат документов, сочетающий в себе код HTML и набор внешних ссылок. Последние могут содержать изображения, Flash -анимацию, аудиофайлы, Java - апплеты . Несмотря на высокую распространенность, пользователи часто не знают, как и чем открывать MHTML . Хотя ответ давно найден - Windows Word .
Программа для открытия MHTML
Расширение . MHTML подразумевает формат архива WEB - страницы, который был сохранен из HTML - файла и прошел кодировку . MIME . Документ включает в себя ряд ресурсов, непосредственно связанных с веб - страницей. Эти ресурсы можно сохранять на компьютер, а после открывать и просматривать, не подключаясь к сети. Проблемы, связанные с доступом к MHTML - файлам, могут быть связаны с различными причинами. Хотя в большинстве случаев пользователем просто была найдена не подходящая программа для файлов MHTML .
Открывается документ с таким форматом в Windows стандартным двойным кликом. После система автоматически ищет софт , который подходит для обслуживания запроса. Если ОС не справляется с построением ассоциаций, пользователь самостоятельно выбирает программу. В " Виндовс " с этой задачей работает следующее ПО:
- Mozilla Firefox ;
- Windows Word ;
- Opera ;
- Microsoft Internet Explorer ;
- Google Chrome .
Самый простой вариант - выбрать для просмотра любимый браузер . Но такая программа характеризуются ограниченным функционалом, чего не скажешь про Windows Word . Это бесплатное ПО не нуждается в активации и покупке серийных номер, чтобы открыть MHTML - документ.
Алгоритм работы с программой WindowsWord
Редактор WindowsWord идеально подходит для работы с MHTML - форматом. Программа предполагает быструю загрузку самых тяжелых документов. Ее можно скачать бесплатно, если не требуется использование в коммерческих целях. Обширного функционала Windows Word будет достаточно для полноценной работы с архивами веб страниц, имеющими расширение . MHTML .
Для начала работы с программой необходимо ее скачать на официальном сайте. Далее загруженный файл нужно установить, пользуясь инструкцией разработчика. После запуска ПО можно выбрать желаемый MHTML - документ для загрузки и просмотра. Windows Word порадует пользователя множеством достоинств:
- быстрота загрузки и сохранения файлов;
- необходимость в минимальном количестве места для установки софта;
- в процессе обработки MHTML - файлов программа не "зависает";
- риск потери данных нивелирует опция "Автосохранение".
Благодаря Windows Word , взаимодействие с MHTML - документами не вызывает сложностей среди пользователей ПК различного уровня. ПО подходит для различных версии ОС " Виндовс ".
Windows 7 / 8 / 10
Версия: 2020.10.0 от 21.10.2020
Размер файла: 12.1 Мб.
В предыдущей статье было рассказано, в каких форматах можно сохранять веб-страницы из Интернета для их дальнейшего хранения на своем компьютере.
- Один файл веб-архива (*.mht)
- Текстовый файл (*.txt);
- Веб-страница, только HTML (*.htm; *.html);
- Веб-страница, полностью (*.htm; *.html);
Конечно, их можно хранить на своем компьютере и в том виде, в котором они и сохранились, но в этом случае их внешний вид будет желать лучшего. На странице будут присутствовать элементы, которые не несут в себе никакой информации. Это пункты или кнопки навигации, рекламные баннеры и блоки, различные счетчики рейтингов и статистики и так далее.
Чтобы придать странице более привлекательный вид и уменьшить ее объем, хотя при нынешних объемах жестких дисков об этом вроде бы и не стоит беспокоиться, ее можно отредактировать. Для редактирования в каком-либо веб-редакторе, какие-то минимальные знания по работе с ним все же желательны. Вот об этом и пойдет речь ниже.
Один файл веб-архива
Один файл веб-архива (*.mht), на мой взгляд, редактированию не подлежит, по крайней мере, мне такой способ неизвестен.
Текстовый файл
При этом способе сохраняется только находящийся на веб-странице текст. Нет абсолютно графики, но ненужного текста достаточно много. Редактируется в любом текстовом редакторе. Файл получается очень маленьким по объему. Если редактировать в программе Блокнот, то "приукрасить" файл не получится. Если в Microsoft Word или аналогичной, то по своему желанию можно задать вид штифта и его размер, цвет, и все остальное, что позволяет делать сама программа.
Но все же веб-страница, это формат HTML, и я рекомендую сохранять страницы из Интернета только в этом формате. Хотя бы потому, что если на веб-странице присутствуют гиперссылки, то при сохранении двумя описанными ниже способами они будут работать, а ярлычок сохраняемых документов будет единым и красивым, в зависимости от используемого вами браузера. В программе "Блокнот" гиперссылки не работают.
Отредактированный в текстовом редакторе документ, можно превратить в HTML-файл. Для этого, его необходимо вставить в какой-либо веб-редактор и сохранить затем в формате HTML. Никогда не делайте этого из Microsoft Word, а только из программы "Блокнот". При копировании текста из Microsoft Word, текст копируется с элементами форматирования, и в HTML-коде полученного файла будет очень много, как его часто называют, "мусора". Столько ненужных тегов, что иногда, среди них очень трудно найти основной текст. Затем убирать все ненужное руками - довольно длительное и утомительное занятие.
В этом отношении, программа Блокнот абсолютно "чиста". Вставляется только текст и никаких тегов.
Веб-страница, только HTML
При этом способе сохранения, веб-страница копируется на жесткий диск компьютера единым HTML-файлом, без какой-либо графики, но рамки от нее присутствуют, и их бывает достаточно много. Так же на странице находятся и другие ненужные элементы. С помощью веб-редактора придадим сохраняемой странице более привлекательный и компактный вид. Этих приемов тоже несколько.
Быстрый способ редактирования
Открываем подлежащий обработке HTML-файл в каком-либо веб-редакторе, я работаю с программой FrontPage 2003, и все описанные операции относятся конкретно к нему, вы открываете тот веб-редактор, с которым привыкли работать. В открытом документе очень хорошо просматривается его структура (верстка). Можно удалить все ненужное, а его иногда бывает очень много, и оставить только статью. Можно наоборот, взять только статью, а все ненужное оставить на редактируемой странице и затем эту страницу удалить.
Как правило, текст статьи находится в отдельной ячейке таблицы, но не всегда. Выделяем ячейку со статьей, о способах выделения будет рассказано подробнее чуть ниже, копируем ее в буфер обмена. Не закрывая веб-редактор, создаем, пустую страницу, и вставляем в нее, скопированную ячейку со статьей. Как правило, при этом сохраняются все элементы форматирования (цвет фона ячейки, шрифт и его цвет и так далее). Присутствующие в статье гиперссылки, в отредактированном документе будут работать. Статья и в оригинале, и в сохраняемом файле по внешнему ввиду абсолютно идентичны. Можно закрыть и удалить оригинал веб-страницы, а если не уверены в результате, то это можно сделать и позже.
Переходите в режим просмотра HTML-кода сохраненной веб-страницы. В теге title будет написано "Новая страница". Удаляете эту запись и вместо ее вставляете название (заголовок) статьи. Далее в зависимости от ваших познаний в HTML, если не знаете, то лучше ничего не трогать, удаляете все, что посчитаете лишним. Например, лишние META-теги, все Java-скрипты, коды счетчиков статистики и рейтингов и т.д. Если статья узкая по ширине, то задаете свой размер и все остальное по своему желанию.
В процессе удаления, в спешке или по незнанию, можно удалить и что-то полезное. Поэтому необходимо периодически переходить из режима просмотра HTML-кода, в режим просмотра веб-страницы, особенно на начальном этапе освоения этого метода. Удалили что-то в HTML-коде, посмотрели, все ли на месте на редактируемой странице. Если все нормально, то сохраните изменения (файл/сохранить). Если чего-то не хватает, то ни в коем случае не выбирайте "файл/сохранить". В этом случае закройте редактируемый файл. Программа спросит вас, сохранить или нет внесенные изменения. Необходимо выбрать "нет". Затем вновь откройте редактируемый файл в веб-редакторе, и то, что вы нечаянно удалили, будет на месте.
Закончив редактировать файл, при выходе, не забудьте его сохранить. Затем его закрываете, при этом веб-редактор предложит вам сохранить его в папке "Мои документы", как index.html, если конечно, до этого момента вы еще не производили сохранение. Вы соглашаетесь, то есть, ничего не меняя, нажимаете кнопку "Сохранить". Если больше не будете обрабатывать файлы, то веб-редактор можно закрыть и удалить исходный файл.
В папке "Мои документы" дважды кликаете на файле index.html, который откроется в установленном у вас по умолчанию веб-браузере (Internet Explorer, Opera или другой). Выбираете "файл/сохранить как. ". Здесь вам необходимо выбрать конкретную папку, в которой планируете хранить этот документ. Имя файла будет стоять то, что находится в теге title, и это всегда так, по крайней мере, в Internet Explorer. Тип файла выбираете "Веб-страница, только HTML".
При некотором опыте и сноровке, на редактирование одного файла этим способом, уходит менее минуты времени. Если вы собрались редактировать большое количество файлов, то папка "Мои документы" постоянно должна быть открыта, и веб-редактор тоже. Причем, для меня лично, удобней и быстрей работать, когда оба окна открыты не на весь экран, а в настройках операционной системы (кнопка пуск\панель управления\свойства папки\вкладка общие) выбран пункт "открывать каждую папку в отдельном окне".
Вообще то, операционная система позволяет некоторые операции выполнять несколькими способами, поэтому, немного потренировавшись, вы выберете для себя свой, удобный для вас стиль работы.
Более медленный способ редактирования
Иногда требуется, наоборот, удалить все лишнее, а статью и еще что-либо на странице оставить. Выполняется это командой: пункт меню "Правка" и далее строка "Вырезать", а иногда более удобней и быстрее, особенно, если у вас монитор 19-и дюймовый или более, это кликнуть правой кнопкой мышки (обязательно на выделенном месте) и далее "Вырезать". Но главное в этом деле, это выделение удаляемого объекта. Их достаточно много и об этом пойдет речь ниже.
Способы выделения
Чтобы выделить графику или рамку, где она должна быть, нужно кликнуть левой кнопкой мышки по ней, но лучше кликать сразу правой. Разницу увидите при практической работе. Экономится один клик и не надо вести указатель мышки к пункту меню "Правка". Можно произвести выделение и традиционным способом. Нажав левую кнопку и не отпуская ее, ведете указатель слева-направо, и объект выделяется.
Текст так же выделяется традиционным способом, и повторяться не буду. Можно сделать и так. Подводите курсор слева к любой строке текста, и когда он примет вид белой наклонной стрелки, нажимаете левую кнопку. Не отпуская кнопки, перемещяете курсор вверх или вниз на столько строк, сколько желаете удалить, и отпускаете кнопку. Действует этот способ только тогда, когда текст не прижат вплотную к левой границе ячейки.
Ячейки, так же можно выделять традиционным способом, а можно и так. Подводите курсор к левой, либо верхней границе ячейки, и когда он примет вид маленькой черной стрелки, кликаете левой кнопкой, но лучше, опять же, правой. При таком способе может выделиться группа ячеек по вертикали или горизонтали, но не всегда. Можно попробовать перемещать черненькую стрелку слева-направо или, в другом случае, сверху-вниз. Выделенные ячейки или группа ячеек, меняют цвет на более темный или черный в зависимости от цвета их фона. Это заметно всегда.
Сколько ячеек выделится при том, или ином способе, зависит от структуры редактируемой страницы. Иногда, бывает довольно трудно уловить момент появления черной стрелки, но, потренировавшись, это получается практически всегда. На редактирование одного файла этим способом, в зависимости от сложности веб-страницы, затрачивается до пяти минут.
Веб-страница полностью
При этом способе веб-страница сохраняется двумя файлами. HTML-файл и папка с графическими файлами. Как редактировать HTML-файл, было рассказано выше. Можно использовать оба метода. То есть, можно копировать статью вместе с графикой и вставлять в новую страницу, а можно удалить все ненужное, а статью с графикой оставить. Если статья с картинками, то сохранять полученный результат необходимо как "Веб-страница, полностью".
В папке с графикой, которая иногда имеет внушительный вес, необходимо оставить только то, что относится к статье, а остальное удалить. Необходимо оставить также файл каскадных таблиц стилей (обычно файл-CSS).
Из этой папки, иногда приходится удалять несколько десятков файлов. Конечно, можно удалять их поштучно, а можно и группами, в зависимости от их расположения в папке. Делается это так. Ставите курсор слева от подлежащего удалению файла, нажимаете левую кнопку мышки и, не отпуская ее, ведете курсор вправо. Файлы начинают выделяться. Можно вести курсор не только вправо, но одновременно и вниз, при этом выделяется большее количество файлов. При этом нужно следить, чтобы в выделяемый прямоугольник не попал файл, который необходимо оставить.
Полученные после редактирования файлы имеют, против оригинала, значительно меньший вес, а открытые в браузере, по внешнему виду практически от него не отличаются.
Дата публикации: 8 ноября 2007
Автор публикации: Валерий Киселев
Позже, после того, как я уже написал эту статью, мне прислали необходимое уточнение. Я провёл несколько экспериментов, попросил своих друзей и знакомых опросить своих друзей и знакомых и вот что выяснилось:
В некоторых версиях Windows XP, 2000 (закономерность не выявлена, но, видимо, дело в наличии каких-то Service Pack) и, кажется, во всех 2003, способ не работает, если расширение файла не mht. Это несколько сужает сферу применения данного способа.
Обход этой проблемы читайте в следующей статье. Далее сама статья:
Сегодня немного поколдуем, ок? Тем, кому не интересна кухня, где готовят внутренности сайтов, могут перейти к просмотру чего-то более интересного, остальные оставайтесь.
смысл в том, что данные (картинки, javascript, другие ресурсы) можно помещать внутрь HTML. Эта схема является частью стандарта HTML 4.0, если я не ошибаюсь, но, в силу того, что она не поддерживается основным игроком на рынке браузеров, используется лишь эпизодически — чаще всего в интранет-приложениях и расширениях к Opera и Mozilla FireFox. Выглядит это, примерно, так:
Эта схема, кроме возможности помещать различные данные в HTML, имеет и более очевидные преимущества. Обычно, браузер открывает не более 2-4 соединений с сервером, через которые и получает данные. Если на странице очень много мелких картинок, браузер не имеет возможности загрузить и показать их одновременно — приходится ограничиваться означенным количеством соединений.
Мы, в нашей студии, обычно стараемся использовать карту ссылок, вместо нескольких мелких кнопок, например, для ускорения загрузки. Я очень много разговаривал с поисковиками Google и Yandex, но они уверены, что в IE внедрение ресурсов в HTML невозможно. Так ли это?
Нет. По крайней мере мне удалось найти минимум один способ сделать это. В интернете я ничего подобного не встретил, так что будет считать, что его изобрёл я. Натолкнула меня на эту мысль одна из кошмарных домашних страниц, которую сверстали в Microsoft Word и сохранили. в формате MHTML.
Этот формат первым начали использовать в браузере от Microsoft (поэтому его иногда расшифровывают как «Microsoft HTML») для того, чтобы можно было сохранять текст со всем содержимым — стилями, изображениями в одном файле, поэтому этот формат ещё называют веб-архивом (Web Archive). Чаще же всего его название расшифровывают как MIME HTML и в этом заключается главная проблема.
MIME HTML сильно отличается от обычного HTML форматом — внутри заголовок, информация об именах и форматах файлов, кодированные файлы изображений и так далее — более всего это похоже на файлы писем с вложениями (посмотрите исходный текст письма в своём почтовом клиенте). Нам было бы интересней, если бы в остальных браузерах показывалось бы что-то более похожее на HTML.
Просматривая веб-архив в браузере, я обнаружил, что IE отображает файлы архива через специальную схему — mhtml. У него есть интересная особенность — он позволяет адресовать файлы внутри веб-архива извне, вот так:
Причём, оказывается, браузер довольно вольно подходит к формату файла, лишь бы внутри были необходимые секции, что позволяет легко заключить архив внутрь HTML-комментария:
Те, кто знает как устроено обычное электронное письмо изнутри, разберутся и сами, для остальных расскажу. Строка, которую вы видите после слова «boundary», разделяет файл на секции. Секции начинаются с двух минусов и разделяющей строки. Заканчивается веб-архив разделяющей строкой, которая начинается и заканчивается двумя минусами — у меня завершающие минусы являются частью закрывающей части HTML-коментария. У секций есть заголовок:
Content-Location — имя файла внутри архива;
Content-Tranfer-Encoding — формат кодирования файла, экономичнее всего использовать base64;
Content-Type — MIME-тип файла;
если вы не знаете, что такое base64 и MIME-тип, то лучше обратиться к поисковику — такие вещи лучше знать. Первая секция с типом «text/html» — обязательная, без неё Internet Explorer не отобразит ваши файлы, остальные могут содержать данные любых типов. Ссылка может указывать на тот же самый или любой другой файл, который содержит веб-архив.
Я не уверен насчёт четвёртой версии браузера, но 5.0 и выше должны отобразить такой HTML нормально. У этого способа есть преимущество перед схемой data — на файл можно ссылаться несколько раз. Организация вывода разного контента для двух групп браузеров — сейчас довольно простая задача. Лучше всего, конечно, использовать для этого язык на стороне сервера (для JavaScript объёмы данных слишком значительные) — например, SSI или PHP.
Кстати, Opera 9 так же поддерживает веб-архивы, но использует для этой цели другую схему — «attachment». Но Opera 9 слишком мало распространена и, кроме того, этот браузер давно поддерживает схему «data».
Ещё хотелось бы упомянуть, что Internet Explorer поддерживает ещё одну схему, через которую, вероятно, можно получить доступ к ресурсам веб-архива — «mid», но я в этом не уверен и никаких экспериментов по этому поводу не проводил.
Вопросы и ответы в сфере it технологий и настройке ПК
Иногда есть необходимость сохранять веб-страницы. И каким образом это происходит скорее всего многим известно. И как результат всех действий – мы видим сохраненный на жестком диске файл с самой веб-страницей и рядом папку со всевозможными изображениями и наполнением. Хранить и тем более передавать такую конструкцию крайне неудобно. Неужели нет ничего лучше?
Для чего нужны файлы MHT
Файл с расширением mht (mhtml) способен решить все эти проблемы. Он представляет собой веб-архив, который включает в себя все элементы страницы: от текста до изображений. Хранится в одном месте единственным файлом.
При сохранении веб-страницы могут возникнуть проблемы с именами файлов по-умолчанию: зачастую многие браузеры предлагают назвать создаваемый mht-файл именем огромной длины, в котором часто содержатся спецсимволы. Если оставлять предлагаемый вариант имени, в дальнейшем это может привести к некоторым неудобствам в работе с документом как со стороны человека, так и у программ, которые из-за спецсимволов в названии могут не открыть такой файл mht.
Как создать MHT файл?
Для этого совершаем самое простое и очевидное действие: в браузере воспользуемся на мыши правой кнопкой, жмем по странице и выбираем «Сохранить как». Или же зажимаем сочетание клавиш «Ctrl + S». Дальше самое интересное.
Сначала стоит обратить внимание что, не все браузеры изначально могут сохранить и открыть такой формат.
Изучим особенности каждого из браузеров:
- Internet Explorer – самый первый браузер, который работал с MHT. Чтобы сохранить в заданном формате выбираем в типе сохраняемой страницы «Веб-архив, один файл (*.mht)»;
- Opera – поддерживает расширение с версии 9.0. В некоторых версиях, в зависимости от движка, сохранение происходит по умолчанию в MHTML. В других же версиях в типе выбираем «Веб-архив (единственный файл)»;
- Firefox и Safari – изначально не поддерживают такой формат. Но можно установить дополнительное расширение, если вам так необходимо работать именно с mht файлами; – поддерживает, но не полностью. Здесь придется поискать опцию сохранения как MHTML, но ее включение заменит одну из стандартных функций сохранения;
Открываем файл с расширением *.MHT
Если вам принципиально, чтобы любой веб-архив открывался в каком-то определенном браузере, только в одном, то это можно легко настроить. Следуем в панель управления, ищем раздел программ по умолчанию. Теперь нужно выбрать «Задание используемых по умолчанию программ». Далее ищете необходимый браузер и кликаете «Выбрать умолчания для этой программы», затем ставим галочку у MHT. Тем самым определили браузер для того, чтобы пользоваться веб-архивом, когда это потребуется.
Теперь мы можем открыть наш файл. Однако это не единственный способ, он лишь самый простой. Существует множество программ и инструментов, которые помогают открыть или просмотреть наш файл. Например, Universal Viewer. Это решение удобно, если вы используете только один браузер, не поддерживающий такое расширение.
Эти инструменты и программы позволяют открыть и просмотреть, но не изменить MHT файлы.
Итак, теперь вы знаете основные приемы работы с mht-файлами. Используя их, вы без проблем сможете в дальнейшем избежать трудностей при попытке открыть и поработать с сохраненными mht файлами.
Отблагодари меня, поделись ссылкой с друзьями в социальных сетях:
Как открыть документы в формате DOC онлайн
Онлайн просмотр файлов с расширением DWG
Как открыть файлы CDR онлайн
Формат AVI
Какими программами лучше открывать файлы формата .264 и .h264
Как и чем открывать, создавать и редактировать файлы формата HTML
Файл формата VOB: какие программы для открытия использовать и как сжать
Для чего используются файлы FDB, как и какими программами их открыть?
Оставить комментарий ВКонтакте
2 Комментариев
Архив mth очень удобен для сохранения вэб-страниц как они есть и просмотра их офф-лайн. Жаль, что при сохранении страниц в Мазилле и Хроме придется потанцевать с бубном, чтоб воспользоваться этой возможностью.
Читайте также: