DjVu – El formato de mis apuntes

19 Nov

El formato

DjVu es un formato de compresión de imágenes que fue diseñado para trabajar con documentos escaneados (ver Wikipedia ES). Aunque es un formato abierto, nunca se ha hecho tan popular como el PDF y desgraciadamente, existen pocas aplicaciones para trabajar con él.

Visores (en Linux y Windows)

En Linux, el visor de documentos por defecto de muchas distribuciones, Evince, soporta este formato. En Windows existen varias alternativas, aunque el que suelo utilizar es un visor llamado WinDjView (aunque se basa en DjVuLibre).

Curiosamente, WinDjView permite hacer anotaciones y resaltar el texto (o zonas) de las imágenes de cada página, lo que es esencial para mí. Sin embargo, su mayor virtud es también su mayor defecto, ya que estas anotaciones se guardan de forma separada al documento (en el registro de Windows!!), lo que hace que no sean compatibles con Evince o cualquier otro visor. Esto es un problema si, como yo, te mueves entre diferentes ordenadores con diferentes sistemas operativos, ya que las anotaciones sólo están disponibles en el equipo en el que se crearon.

En cuanto a las ventajas del formato, destaca sin duda el menor tamaño de archivo (manteniendo la calidad) comparado con la versión PDF del mismo documento. Por poner un ejemplo,  mis apuntes escaneados hasta ahora sobre el libro de Leestma, para la asignatura de Informática, ocupan 2.18MB en DjVu y 22.9MB en PDF.

WinDjView puede descargarse desde la página de su autor : WinDjView. El autor proporciona el software a través de un instalador albergado en la página del proyecto en SourceForge (unos 4.8MB). El paquete de instalación contiene también plugins para el navegador y supongo que alguna otra cosa útil, pero si lo único que necesitas el programa, WinDjView.exe puede ejecutarse tal cual (esto es útil en entornos donde no se permite la instalación de aplicaciones) . Puedes descargar WinDjVu.exe (sólo el ejecutable, 1.7MB) desde mi cuenta en Box.net.

Otras aplicaciones

Document Express with DjVu

Sólo conozco una aplicación comercial para crear y editar ficheros DjVu (del estilo de Adobe Acrobat para PDF). Su principal inconveniente es que es de pago, aunque no es cara (unos 39eur). Curiosamente, Document Express fue desarrollado por Lizardtech (y de hecho, todavía aparece en la página de productos de la web en castellano, www.Lizardtech.es). Sin embargo, si intentas descargar la versión trial, se te redirige a la web de Caminova para Document Express with DjVu.

DjVuToy y PdgCntEditor

Encontré estas dos pequeñas joyas buscando por internet (en concreto, en este foro de PlanetDjVu) DjVuToy es “la navaja suiza definitiva” para tratar ficheros DjVu: permite crearlos de forma automática a partir de imágenes en diversos formatos, editarlos, convertirlos a PDF y mucho más en apenas 1.5MB.

En cuanto a PdgCntEditor, se trata de un programa mucho más específico: crear el índice  del contenido del DjVu (con estructura de árbol)

Los dos programas son absolutamente portables y la dirección de descarga es:

El autor de estas magníficas aplicaciones mantiene una página web en chino simplificado: http://www.comicer.com/stronghorse/software/index.htm#DjVuToy (aunque aquí puede ayudarnos Google Translate)

IrfanView y otros visualizadores de imágenes

Como el formato DjVu no dejan de ser imágenes empaquetadas, algunos visualizadores de imágenes permiten visualizar este tipo de ficheros. Mi visualizador de imágenes favorito para Windows, IrfanView, soporta este tipo de formato a través del pack de plugins iv-formats.zip.

Creación y edición de ficheros DjVu artesanal

Mihail Radu Solcan, desde Rumania, tiene algunos artículos curiosos sobre la edición de ficheros DjVu totalmente manual desde Linux. En la letra D de sus Notes on Computing podemos encontrar varios artículos de técnicas relacionadas con el reconocimiento de caracteres en ficheros DjVu, la inserción de notas en ficheros DjVu así como el procesamiento de ficheros de imagen para convertirlos en DjVu (y viceversa) desde la línea de comandos.

DjVuZone tiene un tutorial incompleto sobre la creación, presentación y hosting de ficheros DjVu en la web.

En cualquier caso la información de ese tutorial me sirvió como punto de partida para empezar a crear los DjVU a partir de documentos escaneados, como explico en Escanear documentos y convertirlos a DjVu (Paso a paso)… Aunque claro, eso fue antes de descubrir DjVuToy

Resumen

El formato DjVu puede considerarse un formato “de nicho”. Al estar enfocado únicamente para tratar con documentos escaneados, su utilización se reduce a bibliotecas y otros fondos documentales que pretenden digitalizar contenidos para publicarlos en la web.

Dentro del mundo académico, el formato DjVu tiene un hueco precisamente por lo eficaz que es comprimiendo imágenes, especialmente en blanco y negro (como libros, por ejemplo). Dado que todavía es difícil encontrar versiones electrónicas de muchos libros -en concreto en educación superior-, la única alternativa ha sido escanear libros físicos. Las imágenes con los textos escaneados pueden procesarse mediante OCR, (Reconocimiento Óptico de Caracteres) lo que permite que el texto del libro escaneado sea “buscable”. Esto, unido a un menor tamaño ha hecho que sea posible encontrar los textos universitarios más comunes en las redes de intercambio (especialmente en inglés).

Motivaciones personales

A nivel personal, yo utilizo los libros en formato DjVu por dos motivos:

  1. Independencia (de los plazos de préstamo de la biblioteca): Solicito el libro en la biblioteca, lo escaneo y lo convierto a formato DjVu. A partir de ese momento ya no es necesario que vuelva a la biblioteca de la UNED. Puede parecer frívolo, pero me evito un desplazamiento de 1h en coche (media hora de ida, media hora de vuelta) y sobretodo, del suplicio de buscar aparcamiento junto al centro de la UNED de Terrassa. (En general, tardo mucho más tiempo en encontrar aparcamiento que en todo el proceso de entrar en la biblioteca, buscar el libro que necesito y realizar la retirada  del libro en el mostrador)
  2. Comodidad digital (menos peso que acarrear de un lado a otro): Al tener el libro en formato electrónico, siempre tengo disponibles tantos libros como necesito. Para la asignatura de Mecánica Estadística, por ejemplo, son 4: el libro base, el libro de problemas, el libro de tablas y fórmulas más un libro de bibliografía complementaria. Y eso sólo para una asignatura. El formato electrónico me permite llevar todos esos libros conmigo en el portátil, además de los apuntes… Aunque cada asignatura es diferente y en Informática sólo se necesita el Leestma, son 850 páginas que pesan casi 2Kg. Más el portátil para poder realizar los ejercicios…

Por supuesto, hay que realizar un balance entre el tiempo y el esfuerzo que lleva escanear un libro y las ventajas que podemos obtener con ello. En el caso del libro base de la asignatura de Informática, el Leestma, no me salía a cuenta perder tiempo escaneando (850 pags!); por ello, he utilizado un método mixto: primero, hacer un resumen a mano y después escanear el resumen.

Anuncios

Una respuesta to “DjVu – El formato de mis apuntes”

Trackbacks/Pingbacks

  1. XMind – Mapas mentales « Estudiando Física en la UNED - 24 noviembre, 2010

    […] Anteriormente comentaba que mis apuntes están en formato DjVu. En realidad, esto no es del todo cierto, ya que depende de la asignatura, como apuntaba al final de la sección del apartado Motivaciones Personales. […]

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: