Неизвестный формат файла изображения finereader

Обновлено: 07.01.2025

Подскажите . ABBYY FineReader не желает воспринимать сканер(Samsung SCX-4200) ,хотя его полностью видит, после начала сканирования
пишет "Автоподатчик пуст .Поместите изоброжение или документ в устройство подачи " , в чём может быть проблема ? При помощи стандартной проги сканирует без вопросов .

запусти файн ридер далее по вкладкам : сервис/опции/1.сканировать\открыть и переключи использовать интерфейс сканера. ок. И будет тебе счастье с Samsung SCX-4200:beer:

После сканирования и распознавания pdf в вордовском файле появилась куча разрывов. Как их убрать (разрыв раздела, разрыв страницы, разрыв колонки)?

выделить текст, нажать правой кнопкой мыши и выбрать "абзац", и там, проставить нужные значения. Лучше, с левой стороны всё по нулям проставить. А дальше,- видно будет

Но, всё-таки не всё понятно что было сканировано и что получилось и как?

"Несовпадение типов"
Но, скорее всего старая версия Ворда

Так что не стоит петь диферамбов девятке, как это делают на многих форумах и верить рекламе.
С первых же дней у меня было точно такое же впечатление

Восьмая обеспечивает и качество и скорость, что немаловажно, когда времени в обрез.
Что восьмёрка прекраснее девятки

Но, если уж быть справедливыми, у девятки есть то преимущество, что DejaVu распознаёт. И ещё одну вещь она делает неплохо,- выравнивание строк, если в книге кривоватые строки. Не всегда, правда, но всё же. иногда. Даже очень хорошо выравнивает. На фоне остальных недостатков вроде бы мелочь, но, иногда, приятная и полезная.

В FineReader перед распознанием можно как то автоматически выделять для распознавания четные или нечетные страницы?

Непонятно зачем это может понадобиться. Но ладно.
Кажется, это можно сделать только выделив страницы по отдельности
Нажать Ctrl и держа нажатой мышкой выделять нужные страницы
Потом нажать на кнопочку "Распознать"

Но, всё-таки не всё понятно что было сканировано и что получилось и как?
Проблема решилась просто : все разрывы после finereader-a были массово заменены на пробелы

Каждый знает, что такое PDF и DOC. Но всем ли известны форматы CR2 или, например, BSB? CHIP покажет, как распознать и открыть любой файл.

Что чем открывать Вы получили важное письмо, но вложенный файл не открывается: с ним не справляется ни одна программа из установленных на компьютере. Предстоят долгие и, возможно, безуспешные поиски приложения, предназначенного для отображения таких документов. Но CHIP приходит на выручку: наши советы и утилиты, размещенные на DVD, гарантированно помогут открыть любой файл.

Загадка: что это?

Уничтожение границ: открываем любой файл

Теперь у вас достаточно информации о файле, но вы все еще не можете его открыть, так как у вас либо нет нужной программы, либо ее соответствующей версии. В зависимости от расширения вам поможет один из четырех типов приложений, которые есть на нашем DVD: вьюверы используются для просмотра изображений, анализаторы предоставляют дополнительную информацию о файле, универсальные программы отображают любой документ, а конвертеры даже позволяют редактировать эти файлы.

Просмотрщики.

Для файлов, созданных средствами пакета Office, компания Microsoft предлагает различные вьюверы. Например, утилита Excel Viewer позволяет открыть таблицы с расширением XLS, даже если у вас нет соответствующего табличного процессора.

Эта программа распознает более 130 типов файлов, в том числе все распространенные форматы изображений, а также PDF и видео. После запуска утилиты активируйте панель «Навигация» в верхнем меню «Вид | Интерфейс | Показывать панель навигации». Затем найдите свой проблемный файл и кликните по нему в области предпросмотра. Если Universal Viewer знакомо это расширение, справа отобразится документ или изображение. Если же речь идет о системных файлах, ярлыках или чем-то еще в этом роде, вы увидите шестнадцатеричный код файла. Опытные пользователи могут таким образом изучить заголовок на наличие ссылок и проверить, не является ли документ трояном.

FileAlyzer помимо основной информации отображает параметры безопасности, шестнадцатеричные файлы и ADS-потоки Анализаторы.

Если у Universal Viewer не получается отобразить файл, возможно, вы имеете дело с формат-контейнером. К этой группе относятся используемые упаковщиками архивные файлы, например ZIP или ARC, а также видеоформаты (MKV).

Если у вас установлена программа FileAlyzer, кликните правой кнопкой мыши по неизвестному документу и выберите в контекстном меню строку «Analyze file with FileAlyzer».

В результате вы получите разнообразную информацию о файле, а в некоторых случаях данная утилита предлагает и функцию предварительного просмотра.

Универсалы. Чаще всего проблемы возникают с открытием мультимедийных форматов и связаны с существованием множества различных кодеков. Если вы не хотите тратить время на поиски нужного, просто воспользуйтесь универсальными программами — например, VLC media player (есть на нашем DVD). Этот плеер не требователен к ресурсам компьютера и поддерживает все мыслимые аудио- и видеоформаты.

Затем вы можете, также бесплатно, воспользоваться огромным количеством разных программ, независимых от платформы, которые часто могут помочь в адаптации файлов для сотовых телефонов или смартфонов и конвертации в нужный формат.

Free FLV Converter преобразует ролики стандарта Flash Video с YouTube в более распространенные видеоформаты Конвертеры. Если файл так и не открылся, просто преобразуйте его. Бесплатная программа Free FLV Converter способна конвертировать скачанный с YouTube ролик с расширением FLV в распространенный и более удобный формат — например, AVI. Это позволит воспроизводить фильм в популярных программах, в том числе Windows Media Player.

Но возможно и обратное: если вы хотите опубликовать в Сети отпускное видео, просто переведите его в формат Flash Video.

Сегодня существуют конвертеры практически для любых форматов. Если у вас не получилось сразу найти подходящую программу, введите в Google, например, запрос «convert jpg eps» (конечно, заменив расширения на нужные вам). В нашем случае поисковик представил в качестве результата австралийский сайт под названием jpeg2eps (rses.anu.edu.au), предлагающий мгновенную конвертацию таких файлов.

Связываем файлы с правильными приложениями

Переназначить ассоциацию любого типа файлов в Windows 7 можно вручную в контекстном меню Проводника При двойном щелчке по документу не всегда открывается нужное приложение. Если в Windows файлы неправильно соотнесены с программами, может случиться, что почтовый клиент Thunderbird начнет проигрывать Flash-ролик, а Word будет отображать файл с картинкой. В версии XP эта связь регулируется в меню «Сервис | Свойства папки | Типы файлов». В Vista придется в Проводнике кликнуть правой кнопкой мыши по нужному файлу, выбрать в контекстном меню «Свойства | Общие | Изменить» и в диалоговом окне указать необходимое приложение. Теперь файл прикреплен к данной программе. Будьте осторожны: если отменить эту связь, не создав новую, файл не откроется.

ExtMan отображает соответствия файлов и позволяет их редактировать Дополнительную помощь окажет бесплатная утилита ExtMan (на DVD). Этот маленький ассистент управляет связями файлов, так что вам не потребуется углубляться в настройки операционной системы.

Программа работает даже без установки. Дополнительным достоинством ExtMan является то, что вы сразу видите все связи и можете быстро перераспределять соответствия или удалять их.

После запуска найдите в списке нужное расширение и нажмите на «Delete extention» — связь будет удалена. Если вы хотите снова установить связь, перейдите к «Edit extention | Open | Edit» и найдите путь к соответствующей программе. В заключение нажмите на «Save» — ваша новая связь готова.

Набор специальных программ

Excel Viewer.

Отображает таблицы, даже если у вас не установлен табличный процессор Excel из пакета Microsoft Office.

ExtMan. Показывает в Windows Vista и 7 вкладку «Типы файлов», присутствовавшую в XP.

FileAlyzer. Предоставляет больше информации о файле, чем Windows.

Free FLV Converter. Преобразует видео с YouTube в распространенные видеоформаты для ПК и смартфонов.

IrfanView. Просмотрщик изображений самых разных типов.

Плагины для IrfanView. Практичные дополнения для просмотра дополнительных форматов.

После короткого рассказа о том, как устроен ABBYY FineReader (aka «теоретическая часть»), самое время перейти к применению полученных знаний. И да, котиков под катом нет: всё очень серьёзно.

Как пользователю поучаствовать в обработке документа

Чтобы не изобретать велосипед, начну с простой и понятной схемы из Справки (см. рисунок справа).

Теперь, зная список всех операций, посмотрим на примерах – что может пойти не по плану и как с этим бороться.

Хорошо распознаются только хорошие изображения

А что делать, когда изображения есть, но не очень хорошие? Улучшить прямо в FineReader всё что можно, а, если улучшить нельзя, — попытаться получить изображение заново, устранив проблему. Поскольку тема очень обширная, то при должном интересе будет отдельный пост про то, как подружиться с автоматическими и ручными инструментами обработки изображений прямо в FineReader. Пока же ограничусь замечанием, что изображение будет обработано лучше, если оно:

(после сканирования) не имеет выраженных геометрических искажений — перекоса или заметного изгиба страниц толстой книги у корешка двухстраничного разворота,
(после фотографирования, в дополнение к предыдущему) не имеет ещё и нелинейных геометрических искажений («подушка», «трапеция»), имеет равномерную фокусировку (а желательно и яркость) по всей площади, не имеет шумов от недостаточной освещённости, не имеет выраженной засветки от вспышки (особенно на глянцевой бумаге).

Этап настройки документа/проекта

Можно и нужно сразу указать язык текста, параметры предобработки изображений, некоторые параметры анализа и распознавания. Вот скриншот одной из вкладок диалога настроек.

Эти и прочие настройки подробно описаны в Справке

Этап анализа

Назначение областей разных типов

В пользовательском интерфейсе FineReader доступны области нескольких типов, для них есть разные варианты скрываемой панели свойств (внизу окна «Изображение») и контекстного меню (по щелчку правой кнопкой мыши):

Примеры правильно нарисованных зон распознавания

Реальный пример из проекта оцифровки Толстого — часть страниц имеет нумерацию строк (пронумерованы строки с номерами, кратными 10), не нужную в результате и затрудняющую вычитку/правку текста, если автоматический анализ включил эти номера в текстовую область колонки. Если страницы были почти одинаково выровнены на сканере или качественно обрезаны после сканирования, то перед анализом к нужной группе страниц можно применить шаблон блоков, где область (или области) распознавания просто не содержит не нужных нам частей страницы:

Помните, что в отличие от текстовой области область распознавания может превратиться в области разных типов, что бывало нужно и в этом проекте.

Эти параметры задаются на блок, так что выделять текст разного направления или разной инверсности в один блок – другая плохая идея.

В европейских языках в нормальной ориентации текста строки читаются сверху вниз (в блоке с повёрнутым текстом – от логического верха в сторону логического низа), но в случае иероглифических языков всё гораздо веселее – даже на одной странице одни области могут содержать текст в горизонтальной ориентации, а другие – в колоночной, причём иероглифы имеют одинаковую ориентацию во всех этих областях (если тема дальневосточных и ближневосточных языков интересна – просите отдельный пост про тамошние навороты).

Важные соображения

Распознавание и синтез видят только те фрагменты текста, которые оказались выделены в текстовые области или текстовые ячейки таблиц. Если кусок текста не выделен в блоки – распознаваться он не будет.
Аналогично и с картинками — если часть картинки оказалась вне области или одна целостная картинка оказалась разделена на несколько областей – скорее всего, в результате обработки будут проблемы.
Языки распознавания в FineReader задаются не для галочки – они влияют на очень многие механизмы, начиная уже с анализа: например, иероглифический (китайский, японский, корейский языки) или арабский текст имеют много особенностей, которые учитываются не всегда, а только при выборе соответствующих языков распознавания.

Особенности взаимодействия близкорасположенных или пересекающихся областей

Пересечение картиночных областей друг с другом – практически всегда ошибка, хотя и менее критичная для обработки именно текста. Такие случаи тоже желательно исправлять.

Примеры правильного использования картинок в таблице

Обратите внимание, что с помощью галочки в панели свойств области (внизу) ячейки из левой колонки таблицы сделаны картинками.

Текстовая область на фоне «картиночной» области — тоже важный инструмент: на фоне обычных картиночных областей могут находиться подписи к ним, на «фоновых» картиночных областях может располагаться и основной («колоночный») текст документа, а также таблицы.

Примеры правильного использования текстовых областей на фоне картинок

Маленькие хитрости для облегчения работы с блоками

Описанные соглашения отражены в поведении редактора блоков. Например, если вы рисуете новый или растягиваете имеющийся блок так, что он полностью или почти полностью перекрывает другие блоки — эти другие блоки автоматически удаляются.

Логичность/нелогичность выделения областей

Тут самое время подумать — для каких целей и какого формата документ хочется получить в результате обработки. Вот некоторые соображения, влияющие на количество и характер исправлений разметки блоков в сложных случаях:

Вариант 1: нам нужен только текст (возможно, мы этого не понимаем, но дело обстоит именно так)

нет «мусорных» областей, где в качестве текста или таблиц распознаются (мусором) элементы картинок или элементов оформления страницы.
области логично выделяют строки, не допуская попадания символов в более чем одну область и неоправданного дробления строк на более чем одну область.
то, что с точки зрения человека является таблицами в оригинале, должно быть выделено в табличные области. Это влияет как на качество распознавания (например, базовые линии строк в разных ячейках могут быть не выровнены по вертикали), так и на удобство поиска и копирования фрагментов текста в выходном документе.

Если отдельные картинки не должны копироваться из выходного PDF-документа – то такие области можно из документа исключить вовсе (не создавать новые и не оставлять найденные автоматикой, как минимум – удалять нелогично найденные картинки, а если не лень – то и все).

Я надеюсь шире и глубже раскрыть тему «разумности» картинок в статье про сохранение документов — если такая будет интересна читателям данного материала.

Вариант 2: нужно всё и сразу

Если документ, включающий не одно лишь текстовое содержимое (в одну или две колонки), предполагается сохранить сразу как электронную книгу в форматах FB2/e-pub или в любой промежуточный редактируемый формат (Вордовый или HTML) для дальнейшего редактирования и производства электронной книги, то осмысленное выделение таблиц и картинок становится особенно важно.
Среди прочего нужно определиться с тем, что делать с группами рядом расположенных картинок, и что делать с подписями к картинкам, как рядом стоящими, так и накладывающимися на картинки. Подробнее разберём эту тему в «Практикуме», на реальных примерах.

Не работает сканирование по сети через Fine Reader. С какой программы можно еще сканировать и сохранять в pdf ?

Добрый день, при печати на p2135dn есть вертикальная черная полоса (есть мысли, что требуется замена Фотобарабана Kyocera Mita DK-170) и рандомные черные пятная при печати на fs-c2126mfp+, а тут не понятна причина, что смотреть (т.к. провел тех. обслуживание по мануалу) и проблема сохранилась.

finereader не удалось открыть изображение возможно файл поврежден, ecosys 2040dn.

Драйвера обновил. Что со старым драйвером, что с новым выскакивает ошибка.

Григорий, на фото пятен не видно, полоса проверьте фотобарабан и тефлон

Александр, куосеры не очень любят файнридер или наоборот. 1 в настройках выберите чтобы сканировал с драйверами куосеры. А не со встроенными файнридеровскими. 2 сканируйте сначало в пдф а потом отправляйте пдф в Файн ридер

как оказалось в мануале этого нет, дозвонился до тех поддержки, в поле адрес отправителя в самом внизу формы настройки прописывается smpt сервер

Читайте также: