Где содержатся копии печатных книг в архиве в специальных помещениях в электронных библиотеках
Системы электронного документооборота или, сокращенно, ЭДО используются многими компаниями ежедневно. Нередко сложности возникают с хранением постепенно растущего количества документации.
Узнаем о том, что такое электронный архив, чем он отличается от традиционного бумажного аналога, как сформировать такой архив и как учитывать документы в нем. Кроме того, рассмотрим другие важные вопросы работы с системами ЭДО и цифровыми архивами.
Бумажный архив – возможные проблемы пользователей
Сложности, возникающие у компаний, пользующихся бумажными архивами:
С утратой документов организации сталкиваются и в процессе переноса бумажного архива, и при продолжительном хранении документации, и даже до поступления бумаг.
Чаще всего для того, чтобы отыскать необходимые документы в бумажном архиве, требуется потратить множество времени и сил. В особенности, если нужна документация, поступившая в организацию десятки лет назад. Нередко случается, что у компании есть несколько бумажных архивов в разных регионах. В этом случае процедура поиска осложняется многократно.
- Необходимость покупки или оплаты аренды площади под архив
Бумажный архив должен быть где-то расположен. Не у всех предприятий есть свободная площадь под его организацию. Приходится месяц за месяцем отдавать деньги за аренду помещения.
- Опасность уничтожения бумаг в ходе пожара, другого чрезвычайного происшествия
Затопление, пожар и другие ЧП обернуться потерей ключевых документов компании. Восстановить некоторые бумаги уже не получится. Чаще всего резервные копии документации в бумажном виде не создаются.
Если в документ необходимо внести изменение, например, в документацию по отпускам сотрудников, создать историю корректировки бумаги не выйдет. Потребуется тратить время на оформление повторного документа.
- Невозможность использования одного бумажного документа несколькими пользователями
Ели нескольким работникам одновременно предстоит воспользоваться одним и тем же документом, переводить бумагу в электронный формат нужно будет обязательно.
Мы перечислили только основные минусы классических архивов, с учетом которых их все чаще заменяют электронными аналогами.
Электронный архив – что это, и какие плюсы имеет?
Цифровой архив можно сравнить с хранилищем, в которое из системы электронного документооборота и других виртуальных источников поступают документы. Поток документации архивируется и упорядочивается, разбивается в соответствии с определенными нормами.
Нормы устанавливаются предприятием и его нормативами, а также ГОСТом Р 54989-2012.
Организовать электронный архив можно следующими способами:
- Хранилище архива и системы документооборота – хранение осуществляется со стороны провайдера ЭДО. Условия доступа и другие подробности обсуждаются с поставщиком услуги;
- Облачное хранилище – хранение документации в электронном формате проводится на стороннем сервере, доступ к которому на заранее согласованных условиях предоставляется через интернет;
- Локальный архив – хранение электронной документации выполняется с помощью пользовательского сервера.
Независимо от выбранного метода организации, вы получите ряд преимуществ:
Удостоверять право на льготное налогообложение, включая нулевую ставку налога на добавленную стоимость, будет легче.
Электронный архив работает так, что изменить файлы и получить доступ к ним может лишь автоматизированная система. Пользователи могут только читать документацию. Документы хранятся на информационном носителе, с помощью которого можно выполнять резервные копии на иных носителях. Сервера будут располагаться на различном физическом оборудовании. При проблемах одного сервера, например, при затоплении машины, с восстановлением документов с помощью резервных копий не возникнет никаких сложностей.
Опасность несанкционированного доступа к информации отсутствует. Так как права по доступу можно разграничивать так, как это необходимо.
- Возможность быстрого ответа на вопросы налоговиков
Отыскать нужные документы для предоставления в налоговую службу можно будет действительно быстро и просто.
С расширением предприятия увеличивается объем документов и, как следствие, необходимое под эти документы пространство. Если ваш архив существует в электронном формате, для его увеличения потребуется купить еще один носитель данных и подсоединить его в общей системе архива.
Еще один плюс – возможность указания периода годности документации. По истечению заданного срока, документ будет стираться самой системой автоматически.
- Эффективность и простота использования архива
Нужная электронная бумага будет доступна после пары щелчков мышкой. Вся документация станет располагаться в одной масштабной системе. Архив даст возможность структурирования, сортировки документов по определенным признакам, например, по названию, по дате занесения в базу.
- Отсутствие необходимости в аренде или покупке площади
Реальное помещение под архив документов вам не потребуется.
Формирование цифрового архива – пошаговое руководство
Если вы решили организовать на своем предприятии электронный архив, вам потребуется провести предварительную подготовку. Советуем придерживаться той последовательности действий и выполнять те этапы, которые мы сейчас перечислим.
Решение вопроса с функциональностью архива
Подумайте над тем, что должна «уметь» ваша система:
- Доступные пользователям функции;
- Метод хранение документов;
- Источники поступления информации и т.д.
Вы должны примерно понимать, какой станет сформированная вами система.
Проанализируйте работу своего предприятия
Определите, какие документы будут поступать в архив на хранение и какие бумаги следует подвергнуть оцифровке прежде всего.
Составьте план приоритетов блоков
Разработайте план, в котором будет указана очередность внедрения блоков в цифровую систему. В блоках могут содержаться документы разного типа.
Оцените имеющийся бумажный архив
В случае необходимости, можно постепенно сканировать бумажный архив. Как правило, оцифровке подвергают бумаги, оформленные в течение последнего года. Так как потребность в них возникает чаще всего.
Внесите оцифрованные документы
После того, как информация будет оцифрована, ее нужно будет внести в систему и приступать к работе.
Как работать с электронными документами в цифровом архиве?
Есть множество нормативной документации, которая устанавливает определение термину «электронный документ» и указывает на то, как он должен взаимодействовать с системой документооборота. Если вы не хотите создавать себе трудности, разбираясь с формальностями, и желаете получить электронный архив в сокращенное время, советуем обратиться к нашим специалистам.
Перед тем, как документация будет передана в цифровой архив, осуществляется оценка ее ценности – также по регламентированным нормам. Критериями оценки являются:
- Степень сохранности;
- Метод содержания;
- Возможность длительного хранения и т.д.
Главная стадия формирования электронного архива – внесение упорядоченной документации на цифровые носители. В данном вопросе также есть ряд требований – они предъявляются к соответствию носителей стандартам ГОСТа, к программному обеспечению (должно быть лицензированным), к шифрованию и форматам записи файлов, и т.д.
Завершающая стадия – проверка носителей, на которых уже находятся документы, формирование и отправка файлов в систему на хранение.
Как электронная документация учитывается в цифровом архиве?
Электронная документация учитывается в цифровых архивах по единицам – делам. У каждого дела есть собственный учетный номер, становящийся частью шифра. Шифр и определенные сведения по учету можно наносить на вкладыш чехла носителя. Информация шифра архива:
- № единицы хранения в соответствии с описью;
- № описи дел;
- № фонда архива.
Информация вкладыша электронного носителя:
- Название предприятия;
- Название подразделения;
- Данные об ограничении доступа;
- Время записи файла на цифровой носитель;
- № описи.
Требования, в соответствии с которыми цифровая документация должна поступать в электронные архивы, установлены TR 18492 и ГОСТом Р 54989-2012. В соответствии с регламентами, нужно формировать опись с перечислением документов, которые входят в конкретное дело. Саму опись следует прикладывать к делу, впоследствии с ее помощью можно будет искать документы для уничтожения или, например, необходимой обработки, изменения. Все описи нужно объединять в одном реестре, благодаря чему осуществлять в будущем поиск необходимых документов также можно будет в сокращенные сроки.
Передавая документы в электронный архив, свое действие нужно заносить в учетную книгу поступления носителей. Факты хранения должны значится в книге учета дел (единиц хранения). Отметим, что любые записи, включая перечисленные сейчас, можно заносить в электронном формате. В таком случае электронный архив будет целиком автоматизированным. Это весьма удобно: все документы, в том числе бумаги по бухучету, смогут поступать в отсканированной форме. При желании, их всегда можно будет перевести в бумажный вид, не столь удобный в использовании, однако в ряде случаев необходимый. Напоследок отметим, что все усилия по оцифровке документов и формированию электронного архива полностью окупают себя в сокращенные сроки.
В соответствии с теорией хранения цифровой информации необходимо осуществлять хранение электронных мастер-копий и рабочих копий не менее чем в двух экземплярах каждый, записанных на различные носители [94] информации, которые хранятся на физическом удалении друг от друга.
Рекомендованные комбинации носителей информации для хранения электронных копий различного назначения:
Электронные мастер-копии: Сервер [95] /CD-R ; Сервер/ DVD-R; Съемные жесткие диски/CD-R; Съемные жесткие диски/DVD-R , Сервер/DVD-R/магнитная лента, Сервер/DVD-R/Система хранения данных (СХД).
При использовании сервера обязательным является формирование RAID-массивов.
Учитывая, что экземпляр внешнего носителя с записанными электронными мастер-копиями (контрольный экземпляр) должен храниться, как правило, в отделе обеспечения сохранности документов, в рекомендуемые комбинации носителей информации для хранения электронных мастер-копий обязательно должны включаться CD-R или DVD-R диски (компакт или оптические диски с однократной записью информации).
В случае если в архиве отсутствуют сервера, возможно осуществлять хранение электронных мастер-копий на CD-R / DVD-R дисках, записанных в нескольких (не менее чем в 2-х) экземплярах.
Категорически не допустимо хранить электронные мастер-копии архивных документов на жестких дисках компьютеров, особенно, если компьютеры включены в локальную сеть архива и/или имеют доступ к сети Интернет.
Электронные рабочие копии: CD-R или DVD-R.
В целях обеспечения интенсивной работы допустимо хранить электронные рабочие копии записанными также на сервер и/или съемные жесткие диски.
Электронные копии второго и последующих поколений: CD-R или DVD-R.
4.2. Хранение цифровой информации
на встроенных носителях – цифровые архивы
Эталонная модель системы хранения цифровой информации (цифрового архива)разработана Международной организацией по стандартизации – International Standardization Organization (ISO) в стандарте 14721:2003 – Reference Model for an Open Archival Information System (OAIS) [96] . Данный стандарт определяет эталонную модель открытой информационной системы, предназначенной для долгосрочного хранения информации. Цель этого стандарта – стандартизировать систему для хранения информации, как её цифровую, так и физическую структуру.
Логическая схема эталонной модели системы хранения цифровой информации включает полный диапазон архивных функций сохранения информации, включая подготовку информации к хранению, осуществление описания информации, собственно хранение, управление информацией, управление доступом и распространение. Она также описывает миграцию цифровой информации на новые носители и форматы, модели данных используемые для представления информации, роль программного обеспечения в сохранении информации, а также обмен цифровой информацией между ее владельцами.
Безусловно, данная модель является на сегодняшний день наиболее оптимальным средством организации хранения, использования и управления хранением и использованием цифровых ресурсов.
Однако ее реализация требует значительных затрат, наличия оборудования, специалистов, разработанной нормативно-правовой и технологической базы, что в настоящий момент отсутствует в большинстве архивных учреждений.
Внедрение цифровых архивов, тем не менее, является стратегической целью, поскольку без них наращивание объемов электронной информации и обеспечение качественного управления ею невозможно.
4.3. Обеспечение сохранности электронных копий,
записанных на внешние носители информации
Внешние носители информации (компакт и оптические диски) необходимо хранить в индивидуальных защитных коробках – первичных средствах хранения – в негерметичных футлярах.
В футлярах диски размещаются рабочей стороной вниз. При этом должно быть исключено свободное перемещение электронного носителя внутри футляра.
Все надписи, этикетки, маркировка и пр. информация, позволяющая идентифицировать носитель и его содержание, распечатываются на принтере и наклеиваются на защитную коробку-футляр.
Футляры с электронными носителями размещаются вертикально в ящиках специализированных шкафов или в коробках, боксах на полках стеллажей, шкафов. Расстояние между футлярами должно быть достаточным для того, чтобы электронные носители можно было свободно помещать и доставать из ящика или коробки.
При размещении футляров и коробок с электронными носителями необходимо располагать их таким образом, чтобы были видны учетные номера единиц хранения.
Хранение внешних носителей информации должно быть организовано в соответствии с Правилами организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в государственных и муниципальных архивах, музеях и библиотеках, организациях Российской академии наук.
Хранение ЭФП должно осуществляться в специально отведенном для этого помещении. Постоянное хранение ЭФП должно осуществляться в темноте. Оптические диски не должны подвергаться воздействию прямых солнечных лучей.
Хранение ЭФП осуществляется при t +8 – +18 ° С и относительной влажности воздуха 45–65 %.
При очистке и ручной обработке электронные носители разрешается брать только в перчатках за кромки или защитный корпус.
При проведении уборки применяемые средства (вода, антисептики и т.п.) не должны попадать на электронные носители.
При использовании документов на внешних электронных носителях (дисках), их перемещении, транспортировке, проведении специальной обработки запрещается перегибать, царапать, бросать электронные носители, касаться их рабочей поверхности голыми руками, ставить на них тяжелые и горячие предметы.
4.4. Организация контроля наличия и технического состояния носителей
Проверка наличия и физического состояния внешних носителей производится не реже 1 раза в год.
Контрольная проверка (на считывание) должна проводиться после каждого перемещения электронного носителя, включая его выдачу во временное пользование (в читальный зал).
проверка фактического наличия единицы хранения электронных копий,
проверка их соответствия данным учетных документов,
оценка физического состояния сохранности носителя.
Техническая проверка электронных носителей включает проверку читабельности информации с помощью программных и технических средств, записанной на носителе и оценку качества образов документа на мониторе.
Заключительную оценку качества отдельных изображений целесообразно проводить с использованием принтера с высоким разрешением.
По итогам проверки наличия и технического состояния электронных носителей составляется Акт проверки наличия и физического состояния электронных копий и Акт технической проверки электронных носителей
Акт технических проверок составляется на каждую единицу хранения (электронный носитель).
Акты технических проверок электронных носителей составляются в 2-х экземплярах.
Мероприятия, реализуемые в рамках контроля наличия и технического состояния носителей, относятся к проблеме информационной безопасности. Все процедуры и документация должны быть подробно описаны в Регламенте информационной безопасности, или в специально разработанном Регламенте проведения контроля состояния информационных ресурсов и носителей информации.
[95] Под термином «сервер» в данном пункте подразумеваются также системы хранения информации и электронные библиотеки.
[96] Reference Model for an Open Archival Information System (OAIS). Blue Book, Январь 2002.
Накопленный российскими библиотеками опыт позволяет четко сформулировать ответы на три главных вопроса оцифровки библиотечного фонда: зачем сканировать, что сканировать, как сканировать.
Почему библиотека является наиболее ярким образом системологии – фундаментальной науки, изучающей организацию процессов и явлений в мире? Ответ кроется в фонде и справочно-поисковом аппарате библиотеки. Для обычного читателя книги на полках и есть фонд, но это не совсем так. Библиотечный фонд – это сложная по структуре совокупность документов, представленных на различных носителях информации, соответствующая определенным отраслям знаний и связанная со специализированным поисковым механизмом на основе карточного каталога.
Даже размещение журналов на стеллажах библиотеки основываются на научном подходе: информетрический закон Брэдфорда объясняет закономерность распределения статей по изданиям и тем самым позволяет с большой вероятностью спрогнозировать востребованность материалов, исходя из специфики информации.
Иначе говоря, библиотекам удалось создать идеальную систему классификации и структурирования информации, которая позволила решить проблему хранения и поиска огромных объемов данных из любых источников. Для этого были разработаны специализированные библиотечные классификаторы, регламентирующие распределение и расстановку фондов, методы организации систематических каталогов, стандарты оформления и учета документов.
Об оцифровке
Когда мы говорим об оцифровке книг любой библиотеки, то, помимо сохранности оригиналов и обеспечения аутентичности электронной копии, необходимо помнить о сохранении идентичности структуры классификации и поиска информации в бумажном и электронном фонде. Другими словами, сканирование книг требует обязательного создания электронного каталога и формирования индексно-поисковой базы данных с максимальной полнотой наполнения.
Проекты по созданию электронных ресурсов библиотек
являются одними из самых сложных и насыщенных с точки зрения трудозатрат,
применяемых методологий и технического исполнения.
Возникает естественный вопрос – зачем? Зачем при такой сложности реализации подобных проектов затевать оцифровку библиотечных материалов, ведь «книги могут храниться веками», да и «вообще в библиотеку уже никто не ходит»?
Это ошибочное мнение. В последние годы библиотеки активно меняются, внедряют современные технологии и стандарты обслуживания для удовлетворения потребностей нового поколения читателей, воспитанных на свободе использования цифрового контента. Принимаются программы по переоснащению, в практику работы вводятся индексы эффективности деятельности, создаются единые каталоги, региональные и краеведческие электронные коллекции. В 2015 г. запущена Национальная электронная библиотека (НЭБ), для развития которой проводится регулярная оцифровка фондов российских библиотек.
Не стоит забывать и о сохранности бесценных знаний и культурных ценностей, накопленных в книгохранилищах по всей стране. Для этих целей оцифровка – самый эффективный способ сохранения изданий и обеспечения безопасного доступа к содержащейся в них информации.
Электронный каталог
Проект в одной крупной библиотеке продолжался с 2003 по 2011 гг. В ходе проекта было выполнено сканирование и индексирование более 2 млн карточек систематического каталога на русском и иностранных языках. В АБИС перенесены данные по 17 полям с каждой карточки.
Основа основ автоматизации современных библиотек – создание электронного каталога и наполнение автоматизированной библиотечно-информационной системы (АБИС). АБИС необходима для автоматизации учета фондов. А полноценный электронный каталог значительно увеличивает эффективность и скорость поиска информации, значительно повышая общее качество обслуживания читателей.
Как правило, в библиотеке ведутся несколько видов каталогов: алфавитный, в котором все карточки расставлены по алфавиту; систематический, где карточки расставлены по отраслям знаний. Существуют каталоги, разделяющиеся по охвату фонда: генеральный или отдельных частей фонда; по назначению: читательский или служебный; по многим другим признакам: краеведческий, предметный и т.д.
При большом количестве фондов
оцифровка всего каталога – довольно длительный процесс,
который обычно проводится поэтапно.
Основа каталога – это библиотечная карточка, содержащая информацию об издании, индексы классификации, номер книги (ISBN) и другие данные. Ввиду большого объема специфической информации, карточка является сложнейшим документом для извлечения индексных данных. Еще больше затрудняют обработку информации записи на иностранных языках, рукописный текст или диакритические знаки (различные надстрочные, подстрочные, реже внутристрочные символы).
Одна библиографическая запись может содержать до 24 разных полей. Перенос записей в систему напрямую с бумажных носителей нецелесообразен из-за низкой скорости и риска потери/пропуска ключевой информации, поэтому работы по созданию электронного каталога подразумевают обязательное предварительное сканирование библиотечной картотеки, формирование и проверку индексной базы данных перед загрузкой в АБИС.
Даже в небольшой библиотеке количество карточек исчисляется тысячами единиц. В таких условиях искать собственные кадровые и технические ресурсы и самостоятельно заниматься формированием электронного каталога практически невозможно, поэтому для экономии времени и денег привлекаются профессиональные подрядчики, которые специализируются на обработке библиотечной информации и готовы гарантировать итоговый результат.
Типовой технологический процесс создания электронного каталога
Оцифровку целесообразно производить на территории библиотеки, чтобы не изымать библиотечные карточки из использования и не нарушать работу с читателями. Процесс делится на несколько этапов:
Экспертиза. Оценивается физическое состояние карточек и объемов картотеки. Определяется состав библиографического описания и требуемый формат машиночитаемых записей. Исходя из полученных данных, составляется дальнейшая технологическая цепочка работ. На перечень работ и методы извлечения данных влияют нюансы в написании символов, формате и даже составе материала (картон, бумага). Ниже приведены возможные типы карточек:
Современное оборудование позволяет достигать скорости сканирования 170 карточек в минуту, при этом выбор профессионального сканера позволяет избежать повреждения самих карточек.
- добавочная карточка. Особенность: печатные и рукописные символы,
- разделитель. Особенность: отличный от стандартного формат карточки,
- ссылочная карточка. Особенность: только рукописные символы,
- описание. Особенность: старорусский текст.
Сканирование. Поточное сканирование бумажных карточек осуществляется на высокоскоростных документных сканерах. Стандартные требования к оцифровке: разрешение 300 dpi, черно-белый режим сканирования, формат файлов TIFF или JPEG. Большинство карточек типового размера 130х80 мм, но встречаются до формата А6 (148х105 мм) включительно. Иногда перед сканированием производится склейка поврежденных карточек. Часто проводится двустороннее сканирование карточек, где на обратной стороне содержатся инвентарные номера, разбивка по филиалам. Незначимые карточки-разделители не сканируются.
После оцифровки бумажный массив картотеки приводится в исходное состояние.
Все последующие работы проводятся с полученными
графическими образами карточек.
Обязательно должны проводиться поворот перекошенных изображений, удаление фона, проявление слабоконтрастных символов и т.д.
Свойства электронных копий должны исключать потерю информации и не ухудшать читаемость документа по сравнению с бумажным оригиналом. В случае плохого состояния исходного материала допускается использование программных средств улучшения качества изображений.
Вся обработка изображений выполняется в автоматическом режиме. Возможна ручная коррекция геометрии образов, очистка от шумов и следов сгиба при необходимости обработки небольшого количества поврежденных документов.
Даже в случае набора текста на печатной машинке, далеко не все символы распознаются корректно. Автоматическое распознавание рукописного текста, карандашных пометок и карточек, созданных до середины 20 века практически невозможно.
Количество графических образов должно совпадать с числом листов бумажного массива. Нормой стало сканирование в порядке следования карточек каталога. Пропуск страниц считается браком.
Ретроконверсия: ввод информации с отсканированных карточек и формирование базы данных. Карточки могут содержать машинопечатный и рукописный текст, карандашные пометки, нечеткие символы и иметь другие особенности заполнения.
В редких случаях, при хорошем качестве документа, содержащего печатный текст, можно использовать программные средства распознавания для автоматического извлечения определенных полей карточки.
Поэтому данные с библиотечных карточек в основном вводятся вручную
и проходят многоуровневую систему контроля качества.
Перед ретроконверсией производится сепарация (сортировка) изображений с целью группировки отдельных частей массива по типам карточек и другим признакам индексирования (сцепка составных карточек, создание блоков данных для томов, разделение по языкам и т.д.). Производится разметка блоков для удобства извлечения данных оператором.
На выходе формируется база данных в требуемом для библиотеки формате (RUSMARC, UNIMARK, MARC21 и др.). В некоторых случаях при создании электронного каталога предметом обработки могут служить напрямую графические образы книг. Тогда к работе привлекаются операторы, владеющие знаниями правил составления библиографических описаний.
Требования к минимальному проценту ошибок в базе данных очень высоки, так как это напрямую влияет на качество поиска информации в электронном каталоге. Поэтому после ввода данных присутствует этап проверки по различным параметрам опытными верификаторами.
Для ускорения процесса ретроконверсии используется технология заимствования,
упрощающая ввод информации за счет автоподбора заполнения полей
на основе ранее введенных данных.
Сканирование книг
Многие библиотеки уже обладают профессиональными планетарными сканерами для ежедневной оцифровки книг. Но собственными силами в основном сканируется поступающая литература. Для массовой качественной оцифровки обычно заказываются аутсорсинговые услуги. Так, в одной крупной федеральной библиотеке с 2008 по 2014 гг. оцифровано более 16,5 млн страниц библиотечных и архивных фондов силами привлеченного подрядчика.
После создания электронного каталога или параллельно этому процессу библиотеки решают задачи по обеспечению сохранности и доступности книжного фонда путем оцифровки книг. Работы по оцифровке проводятся для наполнения национальных электронных проектов, создания коллекций редких книг и полнотекстовых ресурсов, собраний тематических иллюстрированных материалов и много другого.
Библиотеки могут проводить работы по оцифровке фондов самостоятельно. Например, в крупных библиотеках организованы целые отделы сканирования, располагающие парком профессионального оборудования.
Важным аспектом являются характеристики цифровых копий. Если решаются локальные задачи, библиотека может самостоятельно определять требования к выходным электронным ресурсам. Но при реализации национальных проектов, где используются фонды различных библиотек, необходим общий стандарт, регламентирующий основные характеристики работы.
При создании НЭБ электронные ресурсы, созданные техническим исполнителем
и библиотеками самостоятельно, имели разные параметры оцифровки,
что усложняло работу по обработке и загрузке цифрового контента.
Поэтому отраслевым экспертным советом были подготовлены «Рекомендации по оцифровке материалов из фондов библиотек»*, которые показывают принцип создания электронных библиотечных ресурсов. В рекомендациях указаны три вида цифровых копий. Мастер-копия – эталонная копия оригинала в полиграфическом качестве (разрешение не ниже 600 dpi). Пользовательская копия – для создания электронных коллекций и предоставления читателям (разрешение не ниже 300 dpi). Служебная копия используется для внутренних задач библиотеки и размещения на web-сайтах (разрешение не ниже 150 dpi).
Особенности сканирования книг
При оцифровке книг этапы работ повторяют процесс создания электронного каталога. Действует библиотека самостоятельно или нанимает подрядчика, но так или иначе в первую очередь необходимо определить цель проекта и провести экспертизу книжного фонда для понимания стоимости и трудоемкости работы. В дальнейшем формируется состав подлежащих оцифровке изданий, согласовываются технические требования, и производится окончательная оценка проекта.
Рассмотрим несколько особенностей оцифровки книг, которые влияют на стоимость и сроки проектов. Большое значение имеет формат и состояние книг, а также объем бумажного фонда. Исходя из этих особенностей, определяется вид сканирующего оборудования и технологии оцифровки.
Ветхая, рваная бумага, а также толстый переплет многих книг позволяет применять только бесконтактное сканирование – профессиональные планетарные (книжные) сканеры. Использование планшетных сканеров исключено.После сканирования полученные цифровые копии проходят процесс программной коррекции, приводятся к наиболее удобному для чтения качеству изображений. Зачастую при использовании профессиональных книжных сканеров для этого достаточно встроенных программных средств обработки. После получения массива цифровых копий при необходимости составляются библиографические описания отсканированных изданий.
Отдельно стоит выделить работы по высококачественному сканированию коллекций редких книг, книжных памятников, фолиантов и других ценных экземпляров. Для этого используются специализированные комплексы высококачественного сканирования, обеспечивающие уникально высокие показатели оптического разрешения.
Особенности формирования полнотекстовых PDF-книг
Но цифровых копий порой бывает недостаточно. Существуют задачи по превращению изображения в полноценную электронную книгу. На основе графических образов формируются электронные книги в формате PDF. Этот формат наиболее универсален и позволяет осуществлять полнотекстовый поиск и навигацию по оглавлению и гиперссылкам. Электронные книги, не ограниченные авторским правом, можно публиковать в интернете или давать «защищенный» доступ в читальном зале библиотеки*.
Для создания таких книг проводится полнотекстовое распознавание с дальнейшей верификацией текста и проверкой орфографии. Для окончательной вычитки документа привлекаются профессиональные корректоры.
В результате макетирования формируется электронная книга,
полностью идентичная бумажному оригиналу — с точным расположением страниц,
иллюстрациями, сохранением языка и стиля.
Оцифровка книг и каталогов библиотек, особенно при существенном объеме, разнородности фондов по формату и состоянию оригиналов, – сложнейший производственный процесс, осуществить который качественно могут только специализированные компании, обладающие всей необходимой инфраструктурой и большим опытом в создании электронных ресурсов.
Сохранение культурного наследия, формирование знаний и создание информационной среды сегодня в числе приоритетных задач государства и общества. Их решение неразрывно связано с развитием библиотечного дела. В этой связи утверждаются государственные программы и реализуются ИТ-проекты, призванные обеспечить доступность научной, научно-популярной и образовательной литературы широкому кругу читателей. О применении новых технологий, инновационных подходов, проектах, способствующих проникновению знаний, в том числе в самые отдаленные уголки страны, Александр Вислый, генеральный директор Российской государственной библиотеки (РГБ) рассказал корреспонденту PC Week/RE Ольге Звонаревой.
PC Week: Расскажите, пожалуйста, когда стартовала оцифровка книг и с чем она была связана?
Александр Вислый: Эта работы стартовала в и началась она по просьбе ученых с оцифровки диссертаций. Дело в том, что перед защитой возникает необходимость проверить, насколько текст совпадает с уже опубликованными диссертационными работами. Проблема в том, что для ознакомления с ними иногороднему научному работнику приходилось оформлять командировку, приезжать и искать нужную работу в стенах библиотеки. То есть реальная стоимость прочтения одной диссертации включала покупку билетов, проживание в столице несколько дней, поездки в читальный зал библиотеки. Выход из ситуации — оцифровка диссертаций и предоставление доступа к ним посредством виртуальных читальных залов.
PC Week: Это был отдельный проект?
А. В.: Да, это был проект «научный поиск». Теперь проверить свою работу на похожесть с другими можно на нашем сайте, там есть такая услуга. И, надо сказать, что проект не потерял своей актуальности. Дело в том, что ученые советы по всей стране стали требовать от диссертантов документального подтверждения отсутствия совпадений с текстами других работ. Фактически пришли к тому, что защитить диссертацию, не проверив ее на плагиат, уже нельзя. Сейчас в электронном виде есть все диссертации, начиная с 1999 г. Это порядка 840 тыс. работ, включая авторефераты.
PC Week: В чем специфика и проблемы оцифровки книжных изданий?
А. В.: Основная сложность связана не с технологиями, не с людьми и даже не с финансами. Основная проблема касается авторского права. Согласно ГК РФ произведения становятся общественным достоянием через 70 лет после смерти его создателя. То есть по истечении этого времени можно оцифровывать книгу без согласия правообладателя. Новые книги, которые выходят в печатном виде, оцифровывать нельзя, если нет договора с правообладателем, которым не всегда является автор. Поэтому основная проблема лежит в юридической сфере.
PC Week: Располагает ли РГБ возможностью хранить большой объем оцифрованного массива изданий?
А. В.: Этот вопрос обсуждается давно, в том числе на высшем уровне. И не далее как на днях меня спрашивали: если будет издан документ, который обяжет хранить все 100% ежегодно издаваемых книг, сумеем ли мы обеспечить их электронное хранение? Отвечаю, да, есть такая возможность. И ничего это не стоит. Оборудования для этого хватает. Была бы возможность получить книги.
PC Week: Каким образом современный пользователь получает доступ к электронному массиву книг? Он должен прийти в библиотеку?
А. В.: Необязательно прийти и необязательно в нашу. Согласно части ГК РФ библиотека может выдавать в безвозмездное пользование и без извлечения прибыли экземпляры произведений в цифровой форме в помещении библиотеки, исключая возможность создания их цифровой копии. Но там не сказано, что выдавать нужно в помещении той библиотеки, где хранится цифровая копия книги. Поэтому если человек пришел в томскую областную библиотеку, а электронная копия книги, которая ему нужна, хранится в РГБ, то, сев за компьютер, на котором установлена защита от копирования в томской библиотеке, он вполне может ее прочитать. Эта схема работает.
PC Week: Это стало возможным благодаря проекту виртуальных залов?
А. В.: Да. Сейчас создано более 600 виртуальных залов, где можно читать книги. Первый такой читальный зал появился в 2004 г. Этот проект реализовывали своими силами, никто отдельных денег на это не выделял. Все сделано в рамках текущего финансирования.
PC Week: Возможен ли удаленный доступ к материалам вне стен библиотеки?
А. В.: В законе сказано, что читать можно, находясь в помещении библиотеки. Если считать, что домашняя библиотека — это такая же библиотека, как любая другая, тогда это не противоречит ГК РФ. Но с такой формулировкой не согласны издатели и правообладатели. Поэтому вопрос спорный, и на эту тему идут серьезные дискуссии.
PC Week: Есть ли вариант технического решения этой проблемы?
А. В.: Есть, если обеспечить доступ, исключающий возможность перемещения книги с сервера. Таким образом, пользователь, к примеру, может читать книгу постранично, получая каждую страницу по запросу, к примеру, на свой iPad. Потом следующую и т. д. То есть файл книги при этом продолжает находиться на сервере, и можно утверждать, что книга не покидала помещение библиотеки целиком. Однако против такой трактовки будет еще больше возмущений со стороны издателей и правообладателей. Потому что, реализуя такой механизм, получается, что пользователю достаточно зарегистрироваться в библиотеке и иметь устройство, через которое можно почитать книгу в Интернете. Эти коллизии будут продолжаться до того момента, пока мы не начнем вносить точные формулировки в федеральный закон «О библиотечном деле» и параллельно с этим в часть ГК РФ.
PC Week: Как быстро возможны эти изменения?
А. В.: Процесс этот долгий и наверняка займет не один год, но заниматься этим необходимо, потому что картина получается абсурдная. Сегодня пользователь может открыто читать все, что пиратским образом размещено в Интернете, но при этом нет гарантии, что тексты, выложенные там, один в один совпадают с текстом книги.
PC Week: Какие еще возникают трудности при оцифровке?
А. В.: Есть еще организационные сложности, связанные с координацией оцифровки. Библиотек в стране, включая библиотеки вузов, которые сами осуществляют оцифровку, достаточно много. И никакого смысла в том, что одна и та же книга по математическому анализу будет оцифрована в нескольких библиотеках одновременно, нет. Необходимы условия, при которых будет обеспечена однократная оцифровка книги и возможность пользоваться ею другим библиотекам. Это вопрос межведомственный, и выходом может быть создание межведомственного совета. Пока его нет, но мы к этому движемся.
PC Week: Есть ли возможность сделать электронное копирование?
А. В.: Это важный вопрос. Библиотека готова поделиться взятыми за это деньгами с правообладателем. Но есть сложность. Каким образом отдать автору, указанному на книге, деньги? Как его найти? Для взаимодействия нужен договор с правообладателем, налаженный процесс приема-передачи отчетных финансовых документов. Выходом могло бы стать появление специализированного авторского общества, которому библиотека будет перечислять деньги для авторов. Схема понятна,более того, она работает в музыкальной и киноиндустрии, где сообщество функционирует без заключения договоров с правообладателями. Однако для авторов литературных произведений существование таких аккредитованных авторских обществ не предусмотрено нашим законодательством. И в этом тупик.
PC Week: Каким образом отбираются книги для проекта Национальной электронной библиотеки (НЭБ)?
А. В.: Есть Указ Президента о том, что в НЭБ нужно включать 10% от всех изданных за год книг. К примеру, если в год издаётся 100 тыс. наименований, то 10 тыс. надо оцифровать. Но это в принципе невозможно, если говорить о взаимодействии с одним издательством. В одном случае издательство просто не захочет продать права на 10 тыс. наименований, в другом — выставит огромную цену. Поэтому нашими сотрудниками отбирается список литературы из 50 тыс. книг последних лет издания на основании трех параметров. Во-первых, эти книги должны быть востребованы пользователями нашей библиотеки. Во-вторых, книги должны быть научно-образовательной направленности. И в-третьих, они должны соответствовать профилю наиболее выпускаемых на сегодня книг. Далее этот список публикуется на сайте. Объявляется конкурс на заключение авторских договоров и оцифровку. Издательство, выигравшее его, приносит на дисках порядка 10 тыс. электронных копий. Плюс лицензионное соглашение на право использования. После этого копии идут в отдел технического контроля, где сотрудники библиотеки должны пролистать и проверить каждую печатную книгу: не пропущены ли страницы принесенной электронной копии, не перевернута ли страница и т. д. Далее после библиографического описания электронная копия включается в нашу электронную БД. И только тогда к ней будет обеспечен доступ читателей. Применительно к издаваемым сегодня книгам это единственный путь. Другого нет.
PC Week: Сколько книг и в каком формате уже оцифровано в рамках проекта?
А. В.: С момента действия указа было отобрано и оцифровано порядка 30 тыс. книг. Это PDF-файлы с возможностью осуществлять полнотекстовый поиск.
PC Week: В чем разница проектов РГБ от НЭБ?
А. В.: Проекты внутри РГБ — оцифровка и предоставление доступа — относятся к контенту РГБ. Но есть еще немалое количество электронных копий книг в Российской национальной библиотеке и Президентской библиотеке, расположенных в Санкт-Петербурге, в других библиотеках страны. НЭБ — это проект, суть которого заключается в объединении всего имеющегося электронного массива. И человек, который зашел на сайт НЭБ, получает доступ к материалам и РГБ, и других библиотек.
PC Week: Когда он стартовал?
А. В: Уже два года ведутся работы над ПО. В настоящее время идет процесс его передачи от разработчика к организации, которая в дальнейшем будет поддерживать ПО и выполнять функции оператора. Оператором назначена РГБ. А пока проект работает как бета-версия.
PC Week: Вы начинали этот проект?
А.В.: Мы начинали его совместно с Российской национальной библиотекой, потом подключилась Государственная публичная научно-техническая библиотека (ГПНТБ). Так как никакого серьезного финансирования не было, проект подразумевался на основе договоренностей. С этими библиотеками мы договорились о том, что если читатель пришел в РНБ в Санкт-Петербурге, то он пользуется электронными ресурсами не только этой библиотеки, но и РГБ и ГПНТБ. По сути дела это большой читальный зал трех библиотек. Надо сказать, что проект довольно долго развивался в таком направлении и продолжает в этом режиме работать. Но в Министерстве культуры два года назад, наверное, правильно решили, что нужно уходить от подобного «междусобойчика» к проекту, который должен работать для всех библиотек.
Сегодня в проекте участвует 27 региональных библиотек. В этом году мы планируем довести их число до сотни. И численность библиотек, которые могут получить доступ, — до тысячи.
PC Week: На каких условиях библиотека может участвовать в проекте НЭБ?
А. В: Самое главное — это желание участвовать в проекте и техническая оснащенность. На самом деле это непростое решение для библиотеки — предоставить свои ресурсы во всеобщее пользование. И, как правило, текущая техническая составляющая вузовских библиотек не позволяет предоставлять контент в виде распределенного ресурса. Им проще собрать весь оцифрованный материал и передать нам в РГБ. Сейчас у нас есть специальное подразделение, которое работает с библиотеками, консультирует и объясняет, как стать участником НЭБ. А с 27 действующими участниками работали сотрудники Президентской библиотеки.
PC Week: В этом проекте основные сложности также связаны с правообладателем?
А. В.: Только с ним. Нужно добиться, чтобы из 100 человек, пришедших на портал НЭБ, хотя бы 95 нашли искомую книгу. А для этого необходимо собрать достаточный объем современной литературы.
PC Week: Каков порядок доступа к НЭБ?
А. В.: Сегодня действует весьма сложная система регистрации именно из-за того, что возникают коллизии с авторским правом. И с этим связано большое число недовольств. Но ничего не поделаешь — таков нынешний закон. Если он поменяется — можно будет сделать упрощенную процедуру регистрации.
PC Week: Возможна ли в дальнейшем авторизация через портал госуслуг или ЕСИА?
PC Week: Насколько, на ваш взгляд, высока заинтересованность государства в реализации проекта?
А. В.: На самом деле чем дальше, тем все больше заинтересованности и внимания к проекту. Думаю, что чиновники и высокое руководство осознали проблему библиотечного дела. Ведь если художественная литература сегодня издается большими тиражами, то научная и образовательная — тиражом в Сидя в Москве, мы это мало ощущаем. Но каким образом тираж в 200 экземпляров может попасть хоть в сколько-нибудь значимое число региональных, муниципальных, сельских библиотек, которых в стране 40 тыс.? Никаким. Единственный вариант — оцифровывать. И тогда главной задачей будет подключение библиотек к Интернету. Другой возможности широкого распространения книг в стране нет.
PC Week: Скажите, законопроект, касающийся предоставления наравне с бумажным электронного варианта книги, способствует решению проблемы, связанной с площадями для хранения?
А. В.: Нам бы такой вариант серьезно помог. Это было бы идеальным вариантом библиотеки будущего. И проблема с помещениями стояла бы не так остро, как теперь. По закону мы получаем по два экземпляра каждой издаваемой книги и обязаны хранить их вечно. Но тут снова все упирается в правообладателей и издателей, опасения которых связаны с возможностью попадания полученного электронного варианта в открытый доступ. И где-то их опасения могут оправдаться, потому что ни одна библиотека не будет строить системы защиты, равные, к примеру, установленным в банках. Так что до тех пор, пока одна сторона готова к переменам, а другая нет, обсуждения этого вопроса в Думе могут идти до бесконечности. Такова объективная реальность.
PC Week: Спасибо за беседу.
Читайте также: