DjVu (от франц. "уже виденное" - deja vu) - графический формат, соответствующий технологии сжатия изображения, созданное для журналов, книг, статей, рукописей и другой отсканированной документации, распознавание которой не дает хорошего результата из-за наличия в документах схем, формул, таблиц, рисунков, диаграмм и подобных элементов. Сжатие в этом случае происходит с потерями, однако качества достаточно для того, чтобы передавать не только содержание, но оригинальное оформление, исправления, пятна, кляксы и даже цвет бумаги. Сохранение всего перечисленного бывает важно для исторических документов и не только.
Удобной особенностью формата является его оптимизация, позволяющая просматривать документ еще до того, как он полностью скачался. В файлах djvu может быть добавлен текстовый слой (называется OCR-слой), наличие которого делает возможным поиск текста по файлу. Кроме того, возможно добавление ссылок и оглавления для упрощения навигации по файлу. В основу djvu-формата положены технологии AT&T Labs. Специальная технология разделяет отсканированное изображение на три слоя. Первый слой передний план несет данные о цвете деталей, не вошедших в задний план. Второй слой - задний план - содержит иллюстрации и данные о текстуре и особенностях страницы. Третий слой это однобитовая маска, она черно-белая. Именно в ней находится сам текст и другие подобные детали. Каждый слой сжимается по своим алгоритмам.
Комментарии
Отправить комментарий