Вход



Поиск по сайту
Google на mf.grsu.by

  
Главная страница >> Учебный процесс >> Книги в формате DjVu >> Что такое DjVu?

At this time books in DjVu format are accessible just in a local network of the Grodno State University.
External users for reception of books from our library it is necessary for you to be registered. The registered users can receive 1 book of times in a week under the application by E-mail.


В настоящее время книги в формате DjVu доступны только в локальной сети Гродненского государственного университета.
Внешним пользователям для получения книг из нашей библиотеки необходимо зарегистрироваться. Зарегистрированные пользователи могут получить 1 книгу раз в неделю по заявке на E-mail.


Для работы с книгами формата DjVu установите на своем компьютере специальный PlugIn
For work with DjVu books please install special Plug-In
Что такое DJVU и как с ним работать

Что такое DJVU и как с ним работать

 

Д.Герасимчук aka dimkacom( d.gerasimchuk@grsu.by )

 

 

 

Введение

Формат DJVU

Сравнение PDF и DJVU

Технологии формата DJVU

Особенности формата DJVU

Программное обеспечение

Плагины

 

 

Введение

 

За последние пять лет Интернет стал общепризнанным каналом распространения разнообразной текстовой и графической информации. Электронные газеты и журналы стали столь же обычными как и традиционные. Многие издания выходят в электронном виде раньше, чем на бумаге. Этому способствует повсеместное внедрение верстки на компьютере и использование формата PDF фирмы Adobe, ставшего стандартом "де-факто" для распространения электронных публикаций, в том числе и радиолюбительских - радиосхем, справочных таблиц и т.п.

 

Архивация графических файлов с возможностью последующей их пересылки по Сети используется как альтернатива PDF формату. Однако любая закачка архивных файлов графики, особенно технических занимает много времени даже на хороших каналах связи. Прежде, чем этот файл можно просмотреть - его необходимо скачать! До разархивации файла нельзя наверняка сказать - это то, что было необходимо, или же это совершенно другой файл. Может не устроить качество изображения или полнота материала, не говоря уже об объеме и потраченном времени на скачивание.

 

Каждый, кому часто приходилось сканировать черно-белые схемы и пересылать их через Интернет, наверное, обращал внимание на относительно низкий коэффициент сжатия информации для файлов с подобными изображениями. Разработчики программного обеспечения искали путь, позволяющий увеличить коэффициент сжатия графической информации. И в качестве решения был предложен формат DJVU.

 

Формат DJVU

 

Новый графический формат DjVu, разработанный фирмой AT&T, в первую очередь предназначен для размещения в Интернет отсканированных изображений. Это могут быть справочные книги, рукописи, принципиальные схемы телевизоров, радиоприемников, усилителей и других устройств.

 

Технологию DjVu обеспечивает для файлов с черно-белыми монохромными изображениями сжатие порядка 500:1. Выигрыш в размере файла по сравнению с форматом GIF составляет в среднем 20 раз. Суть технологии DjVu заключается в автоматическом разбиении изображения на несколько участков (например, текст, логотип фирмы и растровая фотография), для каждого из которых выбирается оптимальный для данного графического образа алгоритм сжатия. Право на коммерческое использование технологии DjVu продано компании LizardTech.

 

Новая технология сжатия позволит решить проблему публикации в Интернете радиосхем, чертежей, графиков, которые раньше имели слишком большое время загрузки. Для того чтобы иметь возможность просматривать радиосхемы в новом формате, необходимо установить специальный plug-in в Internet Explorer или Netscape Navigator. При этом сделан он очень интересно. Дело в том, что, в отличие от обычных программ-просмотрщиков, DjVu не расшифровывает сжатый файл полностью, а только ту его часть, которую в данный момент демонстрирует. Это позволяет просматривать файлы огромного размера и разрешения даже на очень слабых компьютерах.

 

Демонстрировать эти схемы plug-in может постепенно - по мере скачивания: в течение пары секунд можно полностью увидеть макет страницы, еще через пару секунд можно прочитать текст, а подождав еще чуть-чуть - появляются картинки.

 

Конечно, web-сервер и так имеет то же самое - сначала текст, потом постепенно картинки, но то, что мы увидим с помощью DjVu - это полностью графика, а не комбинация распознанного текста и картинок!

 

Формат DjVu позволяет быстро просмотреть материал в открытом виде, и уже потом решить, стоит ли его сохранять. Сразу можно оценить содержание материала, ограничившись просто его просмотром, не сохраняя файл на своем компьютере. Если учесть, что страница черно-белой графики с текстом формата А4 занимает в формате DjVu около 30 кб, а в цвете около 60 кб, то становится ясной экономия времени и денег.

 

 

 

Сравнение PDF и DJVU

 

Если же сравнить DjVu с популярным PDF форматом, то и здесь есть преимущества - обычно у пользователей установлен только Acrobat Reader. Загрузка файла для в Reader возможна только для просмотра, без его сохранения. Имеется возможность "сохранить объект как...", но просмотреть файл можно только после полного скачивания, что не очень удобно. В DjVu это совмещено - при использовании бесплатного plag-in'а можно сначала посмотреть файл, а уже потом, щелкнув правой кнопкой мыши, сохранить его при надобности. Использование формата DjVu - это экономия при достаточном качестве. Достаточно объективная оценка качества по сравнению с уже известными форматами показывает, что незначительное ухудшение качества на цветных изображениях полностью окупается степенью сжатия, а на черно-белых изображениях вообще не заметно.

 

Возможные конкуренты в виде tiff, gif, jpg сильно проигрывают в объеме. Думается, что в ближайшие годы этот способ займет достойное место в Интернет. Радиолюбители могут смело его применять для пересылки схем, фотографий и всего прочего, при существенной экономии времени и денег.

 

Основная идея формата, вокруг которой и нарастали остальные возможности, опирается на том понятии, что текст и картинки не являются равнозначными составляющими документа. Для текста существует большое количество компрессионных методов, причем процент сжатия информация довольно велик. Но, к сожалению, данные методы не могут архивировать графику.

 

В DjVu применяется специальная технология, отделяющая от сканированного образа весь текст и сжимающая его, сохраняя первоначальное качество. Картинки же переводятся в 100 dpi и подвергаются сжатию по технике вейвлетов (очень популярный ныне метод, использующийся для он-лайновой декомпрессии данных). Дополнительно происходит обработка фоновых частей образа - так удается исключить из конечного файла фрагменты изображения, которые просто не видны (к примеру, стоят за картинками или за текстом).

 

Каждая картинка поддается некоторым преобразованиям, призванным сократить размер файла. Прежде всего, она разделяется на несколько слоев, из которых можно затем ее реконструировать. А чаще всего деление происходит на подложку, маску и передний план. Для этого используется довольно простой алгоритм: растровый файл просматривается пиксель за пикселем. Все светлые точки автоматически причисляются к фону, темные - к маске или переднему плану. Все пиксели, выводимые на экран, получают цвет на базе логических вычислений, построенных на значениях соответствующих цветов из всех слоев. Такое разделение помогает наиболее эффективно сжимать графику. Маска, имеющая обычно всего один цвет, архивируется по методу сжатия документов факсимильных аппаратов, называемому JB2. Идея такого разделения не нова, впервые ее предложила корпорация Xerox, использующая подобный подход при создании формата XIFF.

 

Отдельно следует упомянуть законность публикации на сайте отсканированного текста. Скорее всего, юридическое решение проблемы еще является делом будущего.

 

Технологии формата DJVU

 

В основе формата DjVu лежат несколько технологий разработанных в AT&T Labs. Это: алгоритм отделения текста от фона на отсканированном изображении, вейвлетный алгоритм сжатия фона IW44, мощный алгоритм сжатия черно-белых изображений JB2, эффективный универсальный алгоритм сжатия ZP, алгоритм распаковки "по запросу", алгоритм "маскировки" изображений. Первые четыре алгоритма обеспечивают чрезвычайно высокую степень сжатия. Типичным является преобразование TIFF файла размером 25 Мб (формат А4 отсканированный на цветном сканере 300 dpi) в DjVu файл размером 80 кб, без видимой на глаз потери качества. Для черно-белого изображения, размер DjVu файла может получиться еще меньше - примерно 30 кб. Возможно дальнейшее повышение коэффициента сжатия, вплоть до отношения 1000:1, правда потеря качества становится довольно заметной. Таким образом, на стандартную дискету 1,44 Мб можно разместить 15-20 изображений высокого качества. Дополнительно заметим, что искажения вносимые вейвлетным сжатием существенно менее заметны по сравнению с искажениями в JPEG файлах.

 

Алгоритмы распаковки позволяют показать часть изображения, не разворачивая всю картинку в оперативной памяти, а также легко масштабировать изображение. Это позволяет быстро просмотреть файл даже на относительно слабой машине - компьютер с процессором 486 и 16 Мб ОЗУ. Еще одной интересной особенностью алгоритмов распаковки является инкрементальное восстановление изображения. При просмотре через Интернет вначале выводится только текст, затем фон в низком разрешении и только потом фон в высоком разрешении. Это позволяет быстро оценить документ, не скачивая его полностью.

 

Отделение текста от фона чрезвычайно повышает его разборчивость, особенно, если текст напечатан на цветной бумаге или расположен поверх рисунка. Возможен и отдельный просмотр фона, причем алгоритм "маскировки" восстанавливает те части фона, которые были закрыты текстом.

 

Изображения не содержащие текста могут быть преобразованы в формат IW4, который соответствует части формата DjVu ответственной за хранение фона.

 

Особенности формата DJVU

 

AT&T объявила о дальнейшем развитии формата - DjVu 2.0. В новой версии предусмотрено объединение нескольких изображений в один файл, с возможностью "перелистывания" страниц, а также нанесения на изображение так называемых "горячих точек", участков изображения служащих гиперссылками.

 

Тем, кого пока не удовлетворяет формат DjVu как таковой, можно порекомендовать набраться терпения и "скачивать" оригинальное изображение, хотя вряд ли это целесообразно. Но из уважения к приверженцам традиционных методов, на нашем сайте будут присутствовать материалы в двух форматах (GIF и DjVu), за исключением тех случаев, когда исходный файл уже был в формате DjVu. При наличии соответствующего софта всегда имеется возможность "разжать" DjVu в стандартные графические форматы (BMP, например), однако, полученные файлы будут занимать объем до 30-40 Мб.

 

 

 

 

Особенно нужно отметить возможность навигации по файлу с помощью гиперссылок. Ссылки предоставляют возможность как навигации по файлу, так и возможность перейти на адрес в сети Internet.

Также нужно особо тметить возможность хранения, например книги, в формате DJVU в виде отдельных станиц, что значительно сократит обьем передаваемой информации пользователю так как не надо передавать весь файл целиком.

 

Программное обеспечение

 

Программное обеспечение для формата DJVU представлено в большом количестве. Наибольшую популярность имеет программное обеспечение от LizardThech. В частности продуктов DJVU Solo и plugin’ов для браузеров.

DJVU Solo

Solo представляет возможность разработчикам без особых усилий создать DJVU файл. Solo поддерживает все распространенные графические форматы файлов (jpeg, gif, tiff, bmp). Дает возможность делать ссылки как для навигации внутри документа, так и на различные URL адреса. Ссылкой можго сделать любую часть страницы (изображение, таблица, схема), причем любого размера и формы.

Добавление страницы в уже созданный файл DJVU осуществляется простой вставкой и сохранением документа.

В отличие от большинства имеющихся программных средств Solo обладает большей автоматизацией действий.

 

Плагины

 

Для просмотра созданных файлов LizardTech предлагает плагин DjVu Browser Plug-in для Internet Explorer и Netscape Navigator.

Также в виде опции компания предлагает плагин DjVu iFilter для поиска внутри документа DJVU и плагин ExpressView for PocketPC для просмотра файлов на КПК PocketPC.

 

 

 

Ссылки

 

http://www.lizardtech.com/ - сайт разработчика программного обеспечения для DJVU

http://djvu-lib.narod.ru/index-all.html/ - математическая библиотека(файлы, документация о формате, программы)

http://www.shitov.ru/djvu/ - все о DJVU

http://www.rus-linux.net/zen/djvu_abstract/djvu_abstract.html - DjVu: Краткое техническое введение

http://caoki.narod.ru/progs/djvu.htm

http://www.radio.ru/faq/djvu/ - FAQ о DJVU

 

 

 

 

 

 

 


 

At this time books in DjVu format are accessible just in a local network of the Grodno State University.
External users for reception of books from our library it is necessary for you to be registered. The registered users can receive 1 book of times in a week under the application by E-mail.



В настоящее время книги в формате DjVu доступны только в локальной сети Гродненского государственного университета.
Внешним пользователям для получения книг из нашей библиотеки необходимо зарегистрироваться. Зарегистрированные пользователи могут получить 1 книгу раз в неделю по заявке на E-mail.


 

Full name (Полное имя):
Your country (Страна):
E-mail (Почтовый адрес):
Status (Статус):
The name of the book (Название книги):
Link on our site (Ссылка на книгу на сайте):
Comments (Коментарии):
  
За содержание страницы отвечает Гончарова М.Н.
©
Кафедра СПиКБ, 2002-2017