Программа для перевода файлов html
Если вы не знаете иностранные языки, но возникла необходимость понять содержимое документа, web-страницы, инструкции т.д., можно воспользоваться какой-либо системой машинного перевода. А таких систем сегодня предлагается довольно много — на любой вкус и кошелек
Перевод CHM-файлов
В подавляющем числе случаев поставляемая с программами документация написана на английском языке, что вызывает немалые проблемы у многих русскоязычных пользователей. Последние вынуждены либо искать в сети ее русскоязычный перевод (а это удается далеко не всегда), либо попробовать самостоятельно перевести документацию. Если она представлена в формате HTML, то ничего особо трудного нет - достаточно воспользоваться одним из онлайновых сервисов перевода. С документацией в CHM-формате (а именно в этом формате, как правило, и бывает документация) все обстоит гораздо сложнее. Тут существуют два варианта решения проблемы. Первый путь долгий и нудный, но зато вам не придется потратить ни гроша. Нужно декомпилировать CHM-файл в формат HTML специальной утилитой, потом осуществить перевод всех полученных при декомпиляции HTML-файлов, воспользовавшись одним из соответствующих онлайн-сервисов, и сохранить новые их варианты. После этого можно с упоением приступать к изучению документации в HTML-формате либо предварительно обратно скомпилировать измененные HTML-документы в один CHM-файл (последнее, понятно, совсем необязательно, но упрощает работу с документом). В качестве утилиты для такой декомпиляции/компиляции можно выбрать, например htm2chm или Microsoft HTML Help Workshop. Оба решения бесплатны, однако под Windows Vista они не работают (Windows 2000/XP поддерживается). Быстрее и проще осуществить интересующие преобразования в программе htm2chm, но она при компиляции не встраивает закладку поиска по CHM-файлу, что делает процесс работы с таким файлом менее удобным. Программа Microsoft HTML Help Workshop подобным недостатком не грешит, но разобраться с ней сложнее. Второй путь гораздо приятнее, но потребует финансовых вложений (увы, за удовольствия в этом мире обычно приходится платить). Он предполагает использование программы CHM Editor, которая специально предназначена для перевода CHM-файлов. С ее помощью подобный перевод будет осуществлен быстро и просто, поскольку процесс изменения и сохранения CHM-файла не потребует загрузки каких-либо дополнительных инструментов, а пользователю не придется контролировать процесс декомпиляции/компиляции, да и никаких дополнительных знаний об HTML также не потребуется.
htm2chm 3.0.9.3
Разработчик: Yaroslav Kirillov
Размер дистрибутива: 709 кб
Распространение: бесплатная htm2chm представляет собой утилиту для компиляции отдельных HTML-страниц либо целых сайтов (например, скачанных офлайн-браузерами) в CHM-файлы, а также для преобразования CHM-файлов в исходные документы в формате HTML. У создаваемых справочников автоматически генерируется древовидное содержание, статьи которого могут быть переименованы. Программу (русскоязычная локализация отсутствует) можно скачать и использовать совершенно бесплатно. Для декомпиляции переводимого CHM-файла нужно будет активировать режим "Decompiler", указать файл и щелкнуть на кнопке "Start".
А для компилирования уже готового CHM-файла на русском языке требуется активировать режим "Compiler", указать папку со всеми материалами проекта (то есть переведенными HTML-файлами и картинками) и определить корневой HTML файл (обычно он называется index.htm).
Microsoft HTML Help Workshop 4.74
Разработчик: Microsoft Corporation
Размер дистрибутива: 3,34 Мб
Распространение: бесплатная Microsoft HTML Help Workshop - специализированное решение для разработки файлов помощи в формате CHM. Программа позволяет создавать справочные материалы со встроенным иерархическим содержанием и наличием возможности полнотекстового поиска по документам, которые генерируются из предварительно подготовленных HTML-файлов. Внешний вид CHM-документа настраиваем - можно отрегулировать список закладок навигационной панели (например, "Содержание", "Индекс", "Поиск", "Избранное"), перечень кнопок на ней, размер окна и т.д. Для каждой из страниц предусмотрено определение набора ключевых слов для быстрого поиска, возможно также исключение слов из полнотекстового поиска. Программу (русскоязычная локализация отсутствует) можно скачать и использовать совершенно бесплатно. Для декомпиляции CHM-файла, который требуется перевести, нужно воспользоваться командой File > Decompile и указать папку для размещения распакованных файлов и исходный CHM-файл.
Процесс компиляции потребует гораздо больше усилий, да и не столь очевиден. Нужно скомпоновать все файлы в одной папке и при помощи команды File > New > Project создать новый проект, указав имя проекта и добавив в него нужные файлы.
После этого придется настроить проект - на закладке Project щелкнуть на кнопке "Change project options" и указать имя главного HTML-файла, на закладке Contents вручную подготовить файл содержания, а на закладке Index - файл предметного указателя. И только после этого провести компиляцию (кнопка "Compile HTML file") и получить на выходе готовый CHM-файл.
CHM Editor 1.3
Разработчик: GridinSoft
Размер дистрибутива: 1,93 Мб
Распространение: условно бесплатная CHM Editor представляет собой простой и удобный WYSIWYG-редактор, имеющий встроенную возможность перевода CHM-файлов посредством передачи соответствующих запросов онлайновым сервисам Google и Yahoo. Демо-версия программы (имеется русскоязычная локализация) работоспособна в течение 15 дней, однако не полностью функциональна - в частности, в ней заблокировано сохранение и теперь невозможен перевод файлов на русский язык (для других языков ограничений нет). Стоимость коммерческой версии составляет 49 евро. Для осуществления перевода CHM-документа в этой программе достаточно просто его открыть, выбрать онлайновый сервис перевода, указать его направление и запустить процесс. Перевод будет произведен с сохранением всех HTML-тегов и структуры документа, так что на выходе (то есть после последовательного перевода всех разделов и сохранения итогового документа) вы увидите тот же самый CHM-файл, но уже на другом языке.
Заключение
Как можно создавать документы в формате PDF на лету, из скрипта? Для таких целей существуют различные инструменты. Одним из них является язык разметки LaTeX, позволяющий автоматизировать многие задачи по подготовке статей, включая набор текста на нескольких языках, нумерацию разделов и формул, перекрёстные ссылки, размещение иллюстраций и многие другие. Но у LaTeX есть одна очень серьезная проблема: у него очень крутая кривая обучения. Чтобы выучить его, требуется затратить много времени. И в LaTeX'е очень неудобно работать с таблицами. Потратив много времени на поиск наилучшего решения, я пришел к выводу, что проще всего конвертировать готовую HTML страницу в PDF и передать клиенту. Я сделал обзор программ, которые можно использовать для такой конвертации.
Требования к конвертерам
- Простота настройки шрифтов
- Вставка разрыва страницы
- Безразличие к X серверу
- Поддержка CSS
Так странички отображаются в браузере:
Обзор
wkhtmltopdf. Наверное, самый популярный на сегодняшний день конвертер и, как оказалось, неспроста. Его основа — движок webkit: шрифты берет из системы, умеет делать разрывы страниц, а для работы нужны библиотечные файлы от X-сервера.
Пример работы:
Как видно из примера, wkhtmltopdf хорошо справился. Все блоки на месте, присутствуют картинки, есть разрыв страницы.
webkit2pdf. Аналог wkhtmltopdf. Ему нужен запущенный X-сервер. С результатами его работы можно ознакомиться чуть выше.
pisa(xhtml2pdf). Конвертер написан на python, а, значит, независим от Х-сервера. Умеет делать разрывы, шрифты настраиваются в отдельном CSS файле, путь к которому передается через параметр. Однако, очень привередливый: в случае малейших ошибок или недочетов в HTML коде падает.
Пример работы:
Очень плохо: шрифт определил правильно, с разметкой не справился.
html2pdf. Прост в обращении, шрифты берет из системы, умеет делать разрывы страниц. Для конвертации использует какую-то старую версию браузера Firefox. Но ему нужен запущенный X-сервер. Помимо этого, может заглючить и отказаться работать. Платный.
Пример работы:
Кроме подвала на второй странице, все блоки и картинки на месте.
htmldoc. Простой конвертер без наворотов.
Пример работы:
Не понимает CSS.
html2ps, ps2pdf. По характеристикам похож на htmldoc.
Пример работы:
prince. Платный конвертер, стоит недешево. Использует системные шрифты, умеет делать разрывы, безразличен к X-серверу.
Пример работы:
Все съехало, проблемы с позиционированием.
Результаты в виде таблицы
Наименование | Способ настройки шрифтов | Поддержка разрывов страниц | Независимость от X-сервера | Поддержка CSS | Бесплатный |
wkhtmltopdf | Использует системные | + | + | + | + |
webkit2pdf | Использует системные | + | - | + | + |
html2pdf | Использует системные | + | - | + | - |
htmldoc | Задаются через параметры | - | + | - | + |
pisa(xhtml2pdf) | Нужно указывать пути к шрифтам в CSS файле | + | + | + | + |
Связка html2ps, ps2pdf | ? | - | + | - | + |
prince | Использует системные | + | + | + | - |
Выводы
Как оказалось, с задачами конвертации лучше справились бесплатные конвертеры. Если нужно конвертировать страничку с большим объемом графики, фреймов и javascript, то лучше использовать конвертеры, основанные на webkit. Если же страничка с минимальным количеством HTML-элементов, то со своей задачей хорошо справится htmldoc.
Примечание
Обзор по PHP конвертерам можно почитать тут. А тут можно почитать обзор по online конвертерам.
Существует несколько методов, с помощью которых можно конвертировать HTML в Word. При этом, отнюдь не обязательно скачивать и устанавливать сторонний софт (но и такой способ тоже имеется). Собственно, мы расскажем обо всех доступных вариантах, а то, каким из них воспользоваться, решать только вам.
Открытие и пересохранение файла в текстовом редакторе
1. Откройте папку, в которой находится HTML-документ.
3. HTML-файл будет открыт в окне Ворда точно в том же виде, в котором он бы отображался в HTML-редакторе или во вкладке браузера, но не на готовой веб-странице.
Примечание: Все теги, которые есть в документе, будут отображаться, но не будут выполнять своей функции. Все дело в том, что разметка в Ворде, как и форматирование текста, работает совсем по иному принципу. Вопрос лишь в том, нужны ли вам эти теги в конечном файле, а проблема в том, что убирать их все придется вручную.
4. Поработав над форматированием текста (если это необходимо), сохраните документ:
Таким образом вы сумели быстро и удобно преобразовать файл формата HTML в обычный текстовый документ программы Ворд. Это лишь один из способов, но отнюдь не единственный.
Использование программы Total HTML Converter
Узнать более подробно о функциях и возможностях HTML Converter, а также скачать ознакомительную версию этой программы можно на официальном сайте.
2. Запустите HTML Converter и, используя встроенный браузер, расположенный слева, укажите путь к HTML-файлу, который вы хотите преобразовать в Word.
3. Установите галочку напротив этого файла и нажмите на панели быстрого доступа кнопку со значком документа DOC.
Примечание: В окне справа вы можете увидеть содержимое файла, который вы собираетесь преобразовать.
4. Укажите путь для сохранения преобразуемого файла, если это необходимо, измените его имя.
7. Далее можно задать размеры полей.
9. Перед вами появится окно об удачном завершении преобразования, автоматически будет открыта папка, которую вы указали для сохранения документа.
Откройте конвертированный файл в программе Microsoft Word.
Если это требуется, отредактируйте документ, уберите теги (вручную) и пересохраните его в формате DOCX:
Помимо конвертирования HTML-документов, программа Total HTML Converter позволяет перевести веб-страницу в текстовый документ или любой другой, поддерживаемый формат файлов. Для этого в главном окне программы достаточно просто вставить в специальную строку ссылку на страницу, а затем приступить к ее конвертированию аналогично тому, как это описано выше.
Мы рассмотрели еще один возможный метод преобразования HTML в Ворд, но и это не последний вариант.
Использование онлайн-конвертеров
На безграничных просторах интернета есть немало сайтов, на которых можно конвертировать электронные документы. Возможность перевести HTML в Ворд на многих из них тоже присутствует. Ниже представлены ссылки на три удобных ресурса, просто выберите тот, который вам больше понравится.
Теперь вы можете открыть конвертированный документ в текстовом редакторе Майкрософт Ворд и выполнить с ним все те манипуляции, которые можно делать с обычным текстовым документом.
Примечание: Файл будет открыт в режиме защищенного просмотра, более детально о котором вы можете узнать из нашего материала.
-
Совет: Не забудьте сохранить документ, закончив работу с ним.
Вот теперь уж мы точно можем закончить. Из этой статьи вы узнали о трех различных методах, с помощью которых можно быстро и удобно преобразовать HTML-файл в текстовый документ Word, будь то DOC или DOCX. То, какой из описанных нами методов выбрать, решать вам.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Конвертируйте любой документ в чистый HTML. Этот бесплатный онлайн форматировщик кода поможет вам быстро и легко создавать свои документы. Вы можете одновременно просматривать и корректировать визуальный документ исходный код. Редактируйте одно из этих полей и изменения будут отражены в другом поле мгновенно, в то же время как вы печатаете.
Редактор WYSIWYG «что вы видите, что вы и получаете»
Работы в этом визуальном текстовом редакторе является очень интуитивной. Он ведет себя как Microsoft Word, Open office или любой другой редактор форматированного текста, и он позволяет вам просмотреть, как будут выглядеть элементы, когда вы опубликуете свою статью на сайте. Пожалуйста, обратите внимание, что внешний вид может немного отличаться, в зависимости от CSS-файла веб-сайта.
Редактор исходного кода
Редактор HTML кода с подчеркнутым синтаксисом обладает множеством полезных функций, таких как:
- Счетчик номера строки
- Выделение активной строки
- Выделение открывающих и соответствующих закрывающих тегов
- Автоматическое закрытие тегов
- подробнее см. ниже .
Варианты очистки:
- Встроенные стили – Удалить каждый style атрибут тега. Рекомендуется использовать отдельный файл CSS для стилизации.
- class & id – Удаляет все атрибуты class и id . Функция полезна если вы переносите статью с одного сайта на другой и хотите избавиться от чужеродных классов.
- Пустые теги – Удаляет теги, которые не содержат ничего или содержат только пробел.
- Теги с одним пробелом – Удаляет теги, которые содержат один пробел, такие как <p> </p>
- Повторяющиеся пробелы – Удаляет повторяющиеся пробелы, вызванные плохой практикой смещения текста вправо и настройки пропусков в тексте: <p> </p>
- Удалить комментарии – Избавиться от HTML-комментариев: <!-- . -->
- Атрибуты тега – Стирает все атрибуты тега, включая стили, классы и т. д. Этот параметр не влияет на src изображений и атрибут hrefссылок, поскольку что в противном случае эти теги станут бесполезными.
- В простой текст – Удаляет все теги, форматирование и оставляет простой текст.
Параметры редактора HTML
Откройте выпадающее ▼ меню, чтобы показать параметры очистки. Выбранные варианты выполняются после нажатия главной кнопки очистки HTML. Нажмите на красный значок треугольника на справа чтобы выполнить только один из них.
- Отменить – Восстановить документ в предыдущее состояние. Вернитесь на предыдущий этап, если вариант очистки не принес желаемого результата.
- Новая страница – Стереть весь документ, чтобы начать с чистого листа.
- Сжать – Табуляция и новые строки используются для того, чтобы сделать файл HTML более читабельным для человека, но не влияют на отображение в веб-браузере. Удалите эти ненужные знаки для минимизации размера файла и более быстрой загрузки страницы.
- Tree view – Задать отступ текста для выделения иерархии тегов. С этой опцией вы можете сделать сжатые документы вновь доступными для чтения.
- Кодировка символов – Решите, хотите ли вы кодировать специальные символы или нет. Например
- Демо-контент – Заполните приборную панель демо-контентом, который поможет вам экспериментировать с этим инструментом. Демо содержит заголовок, таблицу, изображения, пункты и другие элементы.
- Прокручивать редакторы вместе – По умолчанию два редактора прокручиваются вместе, если документ большой. Вы можете отключить эту функцию.
- Добавить тарабарский текст – Добавляет пункт"Lorem ipsum" в конец файла. Нажмите еще раз, чтобы добавить другой.
Нажмите здесь чтобы отредактировать этот текст или вставьте сюда ваш документ, чтобы преобразовать его в HTML 😁
Это демо позволяет протестировать возможности этого редактора. Введите текст в одном из полей и увидьте, как другое меняется в реальном времени!
Настройте параметры очистки и нажмите ▼ Очистить
Работайте с любым из редакторов и увидьте, как другой меняется в реальном времени:
Налево : Предварительный просмотр | Направо : Исходный код |
Посмотреть, как ваш документ будет выглядеть после публикации. | Настроить HTML-код с выделенным синтаксисом. |
Подписаться на членство
- Без рекламы
- Без ограничений
- Больше возможностей
Поделитесь с друзьями
Пожалуйста, отключите блокировщик рекламы
Читайте также: