|
|
Сканирование
книг, карт и других широкоформатных оригиналов |
Задача создания электронных копий изданных в "докомпьютерную
эру" книг и географических карт является весьма актуальной
в наши дни.
Оцифровка таких бумажных оригиналов может ограничиваться созданием
файлов- изображений каждой страницы оригинала в том или ином графическом
формате (растровом - JPEG, TIFF, BMP, или компактном PDF-формате).
ОЦИФРОВКА КНИГ
В
большинстве случаев, полученные при оцифровке книг электронные "картинки"
страниц обрабатываются программой оптического распознавания символов
(OCR), чтобы получить аналог книги в текстовом формате. Большинство
программ оптического распознавания - таких, как, например, ABBYY
Fine Reader, "читают" отсканированные тексты на многих
языках, сохраняя форматирование и шрифт оригинала и без проблем
справляясь с таблицами. Графические вставки в тексте при этом сохраняются
в оригинальном виде.
Для сканирования используются обычные планшетные
сканеры, специальные документ-сканеры
и планетарные (книжные)
сканеры.
Книги на планшетном сканере сканируются "лицом вниз",
что создает ряд проблем. Как и при ксерокопировании книги, полученное
при этом изображение содержит широкую темную полосу на месте сгиба
страниц в переплете. Если полоса перекрывает текст, то он становится
нечитаемым на изображении. Полученные изображения часто отображают
перекосы и сгибы страниц из-за сложности корректного позиционирования
книги "лицом вниз" на стекле планшета.
Толстые книги непригодны для такого сканирования вообще, так как
их невозможно развернуть в плоскость сканирования, не повредив чрезмерной
деформацией переплет. Кроме того, попытки максимально распрямить
разворот толстой книги на стекле сканера могут окончиться для стекла
весьма плачевно.
Обычный планшетный сканер офисного класса позволяет сканировать
книги толщиной до 2-3 сантиметров с реальной скоростью порядка 1
разворота (т.е. 2 страницы) в минуту. Для интенсивной оцифровки
книг традиционный планшетный сканер - недорогое, но малоэффективное
и медленное решение.
При этом сканер обычного формата А4 позволит отсканировать книги
формата не более, чем А5 (15 х 21 см). Для сканирования книг большего
формата, чем этот, придется использовать значительно более дорогой
сканер формата А3.
Значительно ускорит работу специальный документ-сканер, имеющий
скоростную планшетную часть - как, например, Fujitsu
fi-4220C2, fi-4340C
(формат А4) или fi-4640S,
fi-5750C (формат А3).
Оцифровка книг с планшета документ-сканера позволяет получить реальную
скорость сканирования до 20-25 страниц в минуту. При этом оператор
для сканирования каждой пары страниц каждой раз перелистывает очередную
страницу и укладывает книгу разворотом вниз, стараясь разместить
ее на стекле без перекосов.
Автоподатчик скоростного
документ-сканера позволит увеличить скорость до многих десятков
страниц в минуту, но книгу для этого придется расшить на отдельные
страницы. Для такого высокоскоростного автоматического сканирования
мы рекомендуем применять документ-сканеры Fujitsu
fi-5110C, fi-4120C2 (формат А4) или fi-4530C, fi-4860 Ultra,
M4099D (формат А3).
Наиболее профессиональным решением проблемы сканирования книг является
применение специализированных книжных
("планетарных") сканеров Zeutschel и Kodak .
Такие сканеры позволяют без проблем обрабатывать "лицом вверх"
книги практически любой толщины и любого формата. Специальное программное
обеспечение компенсирует пространственные искажения, возникающие
из-за того, что сканирующая головка находится на большом удалении
от плоскости страницы. Также компенсируется кривизна изгиба листов
возле корешка книги. Система подсветки книжного сканера исключает
появление темной полосы на сгибе страниц, а также обеспечивает равномерное
освещения всего поля листа сканируемого оригинала. Переплет и листы
книг при сканировании на книжном сканере не деформируются и не повреждаются.
Опционно поставляются специальные держатели книг, не допускающих
раскрытия их переплета более, чем на 120-150 градусов.
СКАНИРОВАНИЕ ГЕОГРАФИЧЕСКИХ КАРТ
Технология сканирования географических карт ничем не отличается
от сканирования любых других большеформатных цветных оригиналов.
С этой задачей во многих случаях успешно справляются широкоформатные
протяжные сканеры с достаточной разрядностью цвета - например, цветные
модели Contex
При работе с ветхими и с раритетными географическими картами и
другими ценными архивными оригиналами большого формата протяжные
широкоформатные сканеры создают повышенный риск повреждения такого
оригинала. Поэтому для таких случаев мы рекомендуем использовать
планетарные ("книжные") сканеры Zeutschel и Kodak большого
формата.
Как и все малосерийное электронное оборудование, эти сканеры недешевы,
однако их применение полностью оправдано при больших объемах работ,
сканировании оригиналов большой толщины или большого формата, а
также при оцифровке раритетных изданий, требующих особо бережного
обращения.
Кроме того, отсутствие в конструкции книжных сканеров подвижных
узлов и механизмов делает значительно долговечнее и "выносливее"
сканеров других типов.
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
При
сканировании оригиналов, состояние которых существенно ухудшилось
вследствие длительного хранения или повреждения, возникает задача
улучшения качества результирующего изображения. Мы рекомендуем использовать
для этой цели программное обеспечение Kofax.
Для распознавания текстов и их передачи в стандартные текстовые
файлы *.txt, *.rtf, *doc применяется хорошо зарекомендовавшее себя
на рынке программное обеспечение оптического распознавания ABBYY
Fine Reader.
Это позволяет редактировать документы или сохранять в форматах MS
Word, MS Excel и других, а также проводить быстрый сквозной поиск
нужного документа или его фрагмента в массиве архива, например,
по ключевым словам, фразам и т.д. ("контекстный поиск").
ХРАНЕНИЕ ИЗОБРАЖЕНИЙ
На сегодняшний день, наиболее полно передать характеристики отсканированного
оригинала можно, сохранив его цветное 48-bit изображение в виде
TIFF-файла без компрессии.
Однако размер цветной страницы документа формата А4 в таком формате
достигает десятков мегабайт. Поэтому на практике для сохранения
страниц книг и других бумажных оригиналов наши пользователи чаще
используют более компактный jpeg-формат, допускающий большое сжатие.
Мы рекомендуем для такой цели PDF- формат, который становится очень
популярным в наши дни. Он обеспечивает максимально компактное сохранение
цветных образов страниц книги со всеми их реквизитами и графикой.
Размер файлов при этом обеспечивает их удобное хранение, копирование
и пересылку по электронной почте.
Для автоматической оцифровки расшитых оригиналов в PDF-формате
мы предлагаем разработанную специально для этой цели модель скоростного
сканера Fujitsu ScanSnap!
Полученные в результате оцифровки бумажных оригиналов электронные
документы индексируются, т.е. им присваиваются атрибуты - адрес,
имя, описание и т.д. Хранятся они в электронном виде на различных
носителях - жестких дисках, CD, DVD, стримерах, магнитооптических
дисках
Выбор носителя и уровень резервирования информации зависят от:
требований к надежности и безопасности хранения информации, зависящих
от важности информации, критичности ее утери, реальных условий хранения,
вероятности тех или иных физических воздействий и т.д.
периодичности (частоты) обращения к информации в архиве
требуемой скорости считывания информации с носителя
заданного календарного срока гарантированного хранения информации
в электронном архиве
допустимых габаритов архива и площади выделенного под электронный
архив помещения
финансовых возможностей заказчика
Наиболее
эффективную защиту электронной архивной информации обеспечивает
хранение ее на магнитооптических (МО) дисках. Этот носитель максимально
долговечен и устойчив к износу, механическим ударам, всевозможным
излучениям, включая рентгеновское и радиоактивное, высоким температурам
и другим "форс-мажорным" физическим факторам.
Для записи-считывания хранения важной и особо ответственной электронной
информации мы предлагаем МО-дисководы и МО-диски Fujitsu.
PIRIT Systems обеспечивает эффективные и оптимальные по соотношению
цена-технические параметры решения по оцифровке книг, географических
карт и других архивных материалов и созданию электронных архивов.
Обращайтесь к нам!
|