Как разбить djvu файл на части
Можно сделать так:
1. Расшить книгу в TIFF
2. TIFF порезать на отдельные страницы (например, ScanKromsator'ом)
3. Отдельные страницы снова сшить в DJVU (например, Djvu Small)
Как проще -- не знаю.
Я использую такой трюк.
1. Печатаю двустраничную DJVU книгу принтером PDF Adobe Acrobat и получаю файл уже в PDF формате.
2. Далее снова печатаю уже новый файл тем же принтером, но подбираю в пункте "Масштабирование страницы" подпункт "разбиение всех страниц" и задаю масштаб больше 100% (напр. 110%). На вкладке просмотра "совмещенный оттиск" будет пунктиром поделена страница на 2 части. Подбором масштаба можно установить оптимальный размер одностраничного формата.
3. Полученный одностраничный файл PDF конвертирую в DJVU.
Можно сделать так:
1. Расшить книгу в TIFF
2. TIFF порезать на отдельные страницы (например, ScanKromsator'ом)
3. Отдельные страницы снова сшить в DJVU (например, Djvu Small)
Как проще -- не знаю.
Последний раз редактировалось Mikky 27.08.2015, 17:37, всего редактировалось 1 раз.
Можно еще так сделать - загружаем DjVu-файл в FineReader, ставим в настройках предобработки разрезание страниц ("Делить разворот"). Полученные страницы можно распознать и сохранить или в обратно DjVu, или в PDF.Плюс - был просто файл из сканов, имеем его же, но с текстовой подложкой, которую можно при необходимости копировать в другие документы.
-- "распечатать" дежавю, выбрав пункт "мелкомягкие-принтер" (будет создан многостраничный TIFF)
-- пропустить этот TIFF через ScanTailor. Он и развороты разрежет, и наклоны выровняет, и мусор типа полей уберёт (последнее, правда, придётся проконтролировать вручную). Есть недостаток: он, кажется, пытается распознавать буквы и делает это не всегда удачно. Впрочем, неудачи (типа путаницы между "и" и "н") случаются достаточно редко.
-- полученный набор картинок пересобрать обратно, да, через Дежавю Соло.
В общем, это работает. Но это я говорю как дилетант, у которого это несколько раз сработало.
А у меня другой вопрос. Как обрезать странички пэдээфа. (скажем, для того же расщепления разворотов)
Все известные мне программы их физически не обрезают, а просто уменьшают область видимости страничек. Что как-то не комильфо -- объём увеличивается вдвое. Несмертельно, конечно; по.
Есть недостаток: он, кажется, пытается распознавать буквы и делает это не всегда удачно. Впрочем, неудачи (типа путаницы между "и" и "н") случаются достаточно редко.Про Pdf ничего не скажу, но ScanTailor никакого распознавания текста не делает. Ошибки, скорее всего эффект Djvu, связанный с тем, что этот формат использует словарь для повторяющихся символов, и при плохом качестве сканов может их перепутать. Ключевые слова "эффект инь янь Djvu".
Последний раз редактировалось ewert 25.09.2015, 22:40, всего редактировалось 1 раз.
Да, наверное, это действительно эффект словаря.
Ещё добивка: тот самый портняжка (Tailor) иногда выставляет некорректные резаки, обрезая существенную часть странички. Ну так надо просто внимательно следить за результатами и при необходимости поправлять резаки вручную для каждой странички. А в целом -- программка полезная.
-- Пт сен 25, 2015 23:40:22 --
А, пардон. Дежавю Соло я давно уже не пытался пользоваться, только Djvu Small (но это, кажется, одна и та же утилитка, с точностью до графической оболочки).
А у меня другой вопрос. Как обрезать странички пэдээфа. (скажем, для того же расщепления разворотов)
Все известные мне программы их физически не обрезают, а просто уменьшают область видимости страничек. Что как-то не комильфо -- объём увеличивается вдвое. Несмертельно, конечно; по.
Обрезать страницы - A-PDF Crop ; Разрезать страницы на части - A-PDF Cut .
Увеличения размера файла "вдвое" - не наблюдается (размер изменяется в пределах нескольких процентов: может увеличиться, может уменьшиться - зависит от исходного файла).
Обрезать поля можно и в Adobe Acrobat : нюанс в том, что для сохранения результата обрезки нужно использовать не "Сохранить" (Save), а "Сохранить как" (Save as) с заданием другого имени файла. В этом случае информация об обрезке не сохраняется в файле и скачка в размере файла не наблюдается.
Нет, увы: все они ничего физически не удаляют, а лишь меняют область видимости. Но для этого есть и более разумные средства (в частности, с гораздо более грамотно организованным интерфейсом).
Видимо, средств, которые что-то удаляли бы, просто не существует. Такой уж это неприличный формат -- PDF.
Нет, увы: все они ничего физически не удаляют, а лишь меняют область видимости. Но для этого есть и более разумные средства (в частности, с гораздо более грамотно организованным интерфейсом).
Видимо, средств, которые что-то удаляли бы, просто не существует. Такой уж это неприличный формат -- PDF.
Если страницы PDF - растровые картинки (сканированная книга), то можно распечатать файл в TIFF или JPEG на каком-нибудь виртуальном принтере (подойдёт, например, PDFCreator), обрезать страницы, а затем пересобрать в PDF или DJVU.
В том-то и дело, что не растровые.
Не, ну я, конечно, тупо распечатываю и перевожу в дежавю (заодно убирая все поля, кроме пары миллиметров). Однако как-то обидно.
Читайте также: