|
Traitement de l'image ou du fichier obtenu
Toute une liste d'étapes opérationnelles suivent la numérisation. De telles procédures peuvent se produire à n'importe quel point de la chaîne de numérisation, depuis immédiatement après la numérisation jusqu'avant son utilisation finale. Il peut exister des modifications personnalisées appliquées seulement à certains fichiers, ou des traitements de l'image de masse automatisés de tous les fichiers (traitement par lot). Il peut exister des opérations menées en une seule fois, ou répétées selon les fréquences nécessaires.
Exemples d'opérations de traitements d'image/de fichier :
- Edition, retouche, amélioration - inclue des étapes telles que détramage, redressement (deskewing), netteté, utilisation de filtres habituels et réglage de la profondeur de bit. Dans certains cas, le logiciel de numérisation effectue ces tâches. Dans d'autres cas, des outils d'édition d'image séparés (p.ex. Adobe Photoshop, Corel Photo-Paint, ImageMagick) sont utilisés.
- Compression - Parfois effectuée par le firmware dédié du scanner ou par le matériel dédié dans l'ordinateur. La compression peut être également menée via un logiciel uniquement, bien que le matériel dédié soit plus rapide et doit être envisagé lors de la création d'un grand nombre de fichiers ou de très gros fichiers.
- Conversion de formats de fichiers - le format de numérisation original peut ne pas être adapté à toutes utilisations requises, et doit alors être converti.
- Redimensionnement - il est fortement probable que les scans capturés à de très hautes résolutions ne seront pas adaptées à l'affichage sur écran. Le redimensionnement (c'est à dire la réduction de la résolution à travers la disposition des bits) est souvent nécessaire afin de créer des images livrables sur le web. Voir Présentation.
- ROC (Reconnaissance Optique des Caractères ou OCR) - conversion du texte numérisé en texte lisible par ordinateur pouvant être recherché ou indexé.
Les facteurs à considérer lors du choix d'un format de fichier sont :
- l'utilisation souhaitée (projection, impression, archivage, visualisation à l'écran,...)
- Profondeurs de bit supportées
- Techniques de compression supportées
- Gestion de la couleur
- Formats de fichier standard ou propriétaire
- Assistance Technique (Navigateur web, capacités du matériel et de l'affichage de l'utilisateur final)
- Résolution fixe ou multiple
- Caractéristiques supplémentaires, p. ex. Entrelacement, transparence
Bien qu'il existe une multitude de formats de fichiers disponibles, le tableau des formats de fichiers images récapitule les attributs importants des formats de fichiers principalement utilisés actuellement.
En dépit de l'intérêt procuré par l'utilisation de formats alternatifs pour les fichiers originaux, le format TIFF reste le standard de facto. Pour les images d'accès, les formats GIF et JPEG restent les plus couramment utilisés. Le format PDF, bien qu'il ne soit pas techniquement un format raster, est largement utilisé pour imprimer et visualiser les documents multi-pages contenant des fichiers images. Le PDF offre également une fonction zoom permettant plusieurs visualisations de l'image. Le format PNG a été homologué par le Consortium du WWW, le World Wide Web Consortium (W3C) pour l'utilisation sur le web, et il est possible que le PNG remplace le GIF en ce qui concerne l'accès via le réseau, au fur et à mesure de son acceptation par les navigateurs web.
Etant donné que des images de plus en plus volumineuses et complexes sont destinées à être accédées via le web, on constate un intérêt accru pour les formats de fichiers et les schémas de compression supportant plusieurs résolutions, tels que FlashPix, LuraWave, JTIP et la compression wavelet (par ondelettes) comme le MrSID de LizardTech ou l'Enhanced Compressed Wavelet de ER Mapper. Le format JPEG 2000 utilise également la compression wavelet et supporte plusieurs résolutions. Le DjVu est un format récent optimisé pour les documents numérisés. Il offre une compression efficace des images au trait (utilisant JB2, une variante du JBIG2) ainsi que des images couleurs avec la compression wavelet. Malheureusement, tous ces formats exigent de l'utilisateur qu'il télécharge et installe des plug-ins afin de pouvoir les visualiser sur le web.
Le tableau suivant dresse une comparaison des tailles de fichiers résultant de divers programmes de compression appliqués à une carte géographique couleur 24 bits de 8,45 par 12,75 pouces à 300 dpi.

Tableau : Comparaison Compression / Taille de Fichier
Type de Compression
|
Taille du Fichier
|
Rapport de Compression
|
| TIFF non compressé |
28,4 Mo
|
--
|
| TIFF-LZW |
21,2 Mo
|
1:1,34
|
| GIF (8 bit) |
4,0 Mo
|
1:6
|
| JPEG-faible (qualité maximum) |
10,4 Mo
|
1:2,7
|
| JPEG-élevée (qualité minimum) |
1,2 Mo
|
1:24
|
| PNG |
20,8 Mo
|
1:1,37
|

Effets de la Compression Destructive sur les Documents Textuels/au Trait
(cliquez sur les images pour observer une vue agrandie)
L'image de gauche a été sauvegardée en format GIF, et celle de droite en JPEG. Les artéfacts de compression sont particulièrement visibles autour des caractères à bords nets dans la vue agrandie de l'image de droite. Avec l'aimable autorisation de Bob Rosenberg, The Edison Papers Project.
|