A Digitalização de livros é um processo pelo qual se capturam as imagens das página de um livro em papel, com recurso a um digitalizador que as convertem em formatos digitais. É uma técnica habitualmente utilizada por bibliotecas digitais, como o Google Book Search, o Projeto Gutenberg, o Distributed Proofreaders, ou a Biblioteca Nacional Digital.
Geralmente, após a digitalização das páginas, estas são submetidas a um reconhecimento óptico de caracteres (OCR) através do qual se geram documentos de texto (em formato TXT, RTF, PDF, ou outros) para facilitar a busca de conteúdos e a leitura em computadores e PDA.
O processo de digitalização pode ser manual, automático (ou robotizado) ou parcialmente automático. Um protótipo de um scanner-robô, pesquisado pela empresa austríaca Treventus venceu na Cebit 2007, o Grande Prêmio" do European Information and Communication Technology Award.[1].
Existem grupos especializados de digitalização de livros, tanto empresarias, quanto amadores que se dedicam a construção de seus próprios digitalizadores de livros artesanais.[2]
Digitalização destrutiva
Neste tipo de digitalização, a lombada do livro é cortada fora, transformando o livro numa pilha de papéis que é rapidamente digitalizada por um digitalizador comum, com ganhos de qualidade e rapidez em relação ao processo com um livro inteiro.
Digitalização não destrutiva
Este tipo de digitalização evita a destruição do livro, com digitalizadores específicos para livros que evitam áreas escuras e minimizam os riscos de o livro ser danificado ou a imagem digitalizada ficar distorcida.[3] Estes tipos de digitalizadores também procuram estender a área útil do digitalizador o mais próximo possível da borda, para assim permitir que o livro possa ficar com um dos lados suspensos, enquanto a página de interesse é digitalizada.
Pesquisadores da Universidade de Tóquio criaram um digitalizador de livros experimental [4] que inclui um digitalizador de superfície tridimensional e que possibilita que imagens de uma superfície curva sejam planificadas através de software, possibilitando digitalizar imagens tão rápidas quanto o operador possa virar as páginas do livro - por volta de 200 páginas por minuto.
Equipamentos para a digitalização de livros
No mercado diversos modelos competem pelo melhor desempenho no que se refere à digitalização de documentos e livros. A agilidade, design e principalmente a facilidade do uso do aparelho são fatores que determinam a escolha desse ou daquele equipamento. Na digitalização de livros em especial, destacam-se no mercado os produtos da marca Joyusing. Esses dispositivos utilizam recursos ópticos poderosos e resoluções de imagem que garantem um arquivo de boa qualidade e altamente legível. Além disso, contam com o recurso de OCR que permite o reconhecimento de caracteres, o que transforma as páginas dos livros digitalizados em páginas com conteúdo pesquisável.
Referências
- ↑ Conrad Gruber: Nie mehr Umblättern – Treventus: Erfolgsstory mit Scanroboter. Em: MONITOR online. Junho 2006. (em alemão)
- ↑ «Página do DIY Book Scanner (Faça Você Mesmo seu Digitalizador de Livros)» (em English)
- ↑ «Vectorscan, manual de digitalização de livros.» (PDF)
- ↑ «"Superfast Scanner Lets You Digitize Book By Flipping Pages", IEEE Spectrum, March 17, 2010» (em English)