Article de reference

scanner d'images

Un scanner à plat ( Epson Perfection V850 Pro) avec son couvercle ouvert. Les documents ou les images sont placés face vers le bas sur la vitre (le plateau). Un scanner d'images...

Un scanner à plat ( Epson Perfection V850 Pro) avec son couvercle ouvert. Les documents ou les images sont placés face vers le bas sur la vitre (le plateau).

Un scanner d'images (souvent abrégé en scanner ) est un appareil qui numérise des images, du texte imprimé, de l'écriture manuscrite ou un objet et les convertit en image numérique . Le type de scanner le plus courant à la maison et au bureau est le scanner à plat , sur lequel le document est placé sur une vitre. Un scanner à défilement , qui fait défiler la page sur un capteur d'image à l'aide de rouleaux, peut être utilisé pour numériser une page à la fois ou plusieurs pages simultanément, comme avec un chargeur automatique de documents . Un scanner portable est une version mobile du scanner d'images, utilisable sur toute surface plane. Les numérisations sont généralement téléchargées sur l' ordinateur auquel le scanner est connecté, bien que certains scanners puissent les enregistrer sur des supports de stockage externes ( cartes mémoire , clés USB , etc. ).

Les scanners modernes utilisent généralement un dispositif à transfert de charges (CCD) ou un capteur d'image par contact (CIS) comme capteur d'image, tandis que les scanners à tambour , développés plus tôt et toujours utilisés pour une qualité d'image optimale, utilisent un tube photomultiplicateur (PMT). Les caméras de documents , qui utilisent des caméras haute résolution standard ou spécialisées, photographient les documents en une seule prise.

Histoire

Précurseurs

Télécopie et photo télégraphique

Les scanners d'images sont considérés comme les successeurs des premiers télécopieurs et appareils de transmission de photos par fil . Contrairement aux scanners, ces appareils servaient à transmettre des images sur de longues distances plutôt qu'à les traiter et à les stocker localement. La première tentative de télécopieur fut brevetée en 1843 par l'horloger écossais Alexander Bain, mais ne fut jamais commercialisée. Dans son invention, un stylet métallique relié à un pendule balayait une plaque de cuivre comportant une image en relief. Lorsque le stylet entrait en contact avec une partie en relief de la plaque, il envoyait une impulsion via deux fils conducteurs vers un récepteur contenant une électrode reliée à un autre pendule. Une feuille de papier imprégnée d'une solution électrochimiquement sensible se trouvait sous l'électrode et changeait de couleur à chaque impulsion. Un engrenage entraînait la plaque de cuivre et le papier simultanément à chaque oscillation du pendule ; avec le temps, on obtenait une reproduction parfaite de la plaque de cuivre. Dans le système de Bain, il est essentiel que les pendules de l'émetteur-récepteur et du récepteur soient parfaitement synchronisés, sinon l'image reproduite sera déformée.

En 1847, le physicien anglais Frederick Bakewell mit au point le premier télécopieur fonctionnel. Similaire à celui de Bain, son appareil utilisait un tambour rotatif recouvert d'une feuille d'étain sur laquelle était appliquée une encre non conductrice. Un stylet balayait le tambour et envoyait une impulsion électrique via deux fils conducteurs lorsqu'il touchait un point conducteur de la feuille. Le récepteur contenait une électrode en contact avec une feuille de papier traité chimiquement, qui changeait de couleur à la réception de l'impulsion ; on obtenait ainsi une reproduction en contraste inversé (blanc sur bleu) de l'image originale. Le télécopieur de Bakewell connut un succès légèrement supérieur à celui de Bain, mais souffrait des mêmes problèmes de synchronisation. En 1862, Giovanni Caselli résolut ce problème avec le pantélégraphe , le premier télécopieur mis en service de façon régulière. Largement basé sur la conception de Bain, il assurait une synchronisation complète en encadrant les pendules de l'émetteur-récepteur et du récepteur entre deux régulateurs magnétiques, qui se magnétisent à chaque oscillation du pendule et se démagnétisent lorsque le pendule atteint les maxima et minima de chaque oscillation.

En 1893, l'ingénieur américain Elisha Gray présenta le télégraphe , le premier télécopieur à succès commercial. Ce dispositif utilisait des barres de liaison qui, au niveau du récepteur, permettaient de scanner le papier selon les axes x et y et de l'imprimer uniquement lorsque le stylet se déplaçait sur le tambour émetteur-récepteur. Compatible avec le papier à lettres standard, il devint populaire dans les entreprises et les hôpitaux. En 1902, l'ingénieur allemand Arthur Korn introduisit le phototélégraphe, un télécopieur utilisant une cellule au sélénium photosensible pour numériser le document à copier, remplaçant ainsi le tambour métallique et le stylet. Ce modèle connut un succès commercial encore plus important que celui de Gray et servit de base aux télécopieurs à fil (ou téléphotographie) utilisés par les journaux du monde entier dès le début du XXe siècle.

Scanners analogiques

Avant l'avènement du traitement numérique de l'image au milieu du XXe siècle, le terme « scanner » désignait à l'origine les équipements analogiques utilisés dans les presses offset . Ces scanners analogiques présentaient des conceptions variées selon leur usage : certains numérisaient des images stockées sur film transparent couleur sur des plaques de séparation des couleurs permettant l'impression en série de l'image originale ; d'autres servaient à convertir des plaques cyan, magenta et jaune (CMJ) en plaques cyan, magenta, jaune et noir (CMJN) afin de produire des tirages aux couleurs plus foncées et plus riches – un procédé alors connu dans le métier sous le nom de correction colorimétrique (sans lien avec le sens cinématographique moderne ). La conversion du CMJ au CMJN était une opération très manuelle qui impliquait des techniques telles que le masquage . Les scanners analogiques ont largement automatisé ce processus.

En 1937 , Alexander Murray et Richard Morse inventèrent et brevetèrent le premier scanner couleur analogique chez Eastman Kodak. Leur machine était un scanner à tambour qui numérisait une diapositive couleur placée dans le tambour. Une source lumineuse était positionnée sous le film, et trois photocellules , équipées de filtres rouge, vert et bleu, lisaient chaque point de la diapositive pour convertir l'image en trois signaux électroniques. Dans la conception initiale de Murray et Morse, le tambour était relié à trois tours qui gravaient directement des points de trame CMJN sur trois cylindres offset. Les droits du brevet furent vendus à Printing Developments Incorporated (PDI) en 1946. PDI perfectionna le système en utilisant un tube photomultiplicateur pour imager les points du négatif. Le signal ainsi amplifié était ensuite transmis à un ordinateur dédié qui convertissait les signaux RVB en valeurs CMJN corrigées. Ces signaux étaient ensuite envoyés à quatre tours qui gravaient des points de trame CMJN sur les cylindres offset.

En 1948, Arthur Hardy, de la société Interchemical Corporation, et F. L. Wurzburg, du Massachusetts Institute of Technology, inventèrent le premier scanner d'images analogique à plat couleur , destiné à la production de plaques lithographiques aux couleurs corrigées à partir d'un négatif couleur. Dans ce système, trois plaques de couleurs séparées (en valeurs CMJ) sont préparées à partir d'un négatif couleur par gravure pointilliste et placées sur le plateau du scanner. Au-dessus de chaque plaque se trouvent des projecteurs à faisceau lumineux , fixés rigidement et équidistants , qui focalisent un faisceau lumineux sur un coin de la plaque. L'ensemble du plateau, avec les trois plaques, se déplace horizontalement d'avant en arrière pour atteindre les coins opposés de la plaque ; à chaque oscillation horizontale du plateau, celui-ci descend d'un cran pour couvrir toute la surface verticale de la plaque. Pendant ce temps, le faisceau lumineux focalisé sur un point donné de la plaque est réfléchi et renvoyé vers une cellule photoélectrique adjacente au projecteur. Chaque cellule photoélectrique est reliée à un processeur d'images analogique qui évalue la réflectance des valeurs CMJ combinées à l'aide des équations de Neugebauer et envoie un signal à un projecteur de lumière placé au-dessus d'une quatrième plaque lithographique non exposée. Cette plaque reçoit une gravure pointillée à tons continus , corrigée en couleur, correspondant aux valeurs cyan, magenta ou jaune. La quatrième plaque est remplacée par une autre plaque non exposée, et le processus se répète jusqu'à l'obtention de trois plaques corrigées en couleur (cyan, magenta et jaune). Dans les années 1950, la Radio Corporation of America (RCA) a repris le brevet de Hardy et Wurzburg et a remplacé le système projecteur-cellule photoélectrique par un tube de caméra vidéo focalisant l'image sur un point précis de la plaque.

Utilisation en imagerie numérique

La première image jamais numérisée sur ordinateur, celle du fils nouveau-né de Russell A. Kirsch , Walden (1957)

Le premier système d'imagerie numérique fut le système Bartlane en 1920. Nommé d'après ses inventeurs, Harry G. Bartholomew et Maynard D. McFarlane, ce système utilisait des plaques de zinc gravées d'une image issue d'un négatif projeté à cinq niveaux d'exposition différents, correspondant à cinq niveaux de quantification. Les cinq plaques étaient fixées sur un long cylindre rotatif motorisé, cinq contacts équidistants balayant chaque plaque à partir de la même position initiale. Le système Bartlane était initialement utilisé exclusivement par télégraphe, le code Baudot à cinq bits servant à transmettre l' image numérique en niveaux de gris . En 1921, le système fut modifié pour une utilisation hors ligne : une perforatrice à bande de papier à cinq bits perforait les trous selon que ses connexions aux contacts étaient pontées ou non. On obtenait ainsi une image numérique stockée à cinq niveaux de gris. La reproduction de l'image était réalisée par une lampe passant sur les perforations, exposant cinq intensités lumineuses différentes sur un négatif.

Le premier scanner à enregistrer ses images numériquement sur un ordinateur était un scanner à tambour construit en 1957 au National Bureau of Standards (NBS, devenu plus tard le NIST) par une équipe dirigée par Russell A. Kirsch . Il utilisait un tube photomultiplicateur pour détecter la lumière en un point donné et produisait un signal amplifié qu'un ordinateur pouvait lire et stocker en mémoire. L'ordinateur de prédilection à l'époque était le SEAC ; la résolution horizontale maximale que le SEAC pouvait traiter était de 176 pixels. La première image numérisée sur cette machine était une photographie de Walden, le fils de Kirsch, âgé de trois mois.

En 1969, Dacom a lancé le télécopieur 111, le premier télécopieur numérique à utiliser la compression de données grâce à un ordinateur intégré. Il était doté d'un plateau à plat et d'une alimentation continue, capable de numériser des feuilles jusqu'au format Lettre en monochrome 1 bit (noir et blanc).

La série de scanners Autokon a été la première à proposer des scanners à plat conçus pour le traitement d'images numériques ; le modèle présenté ici est le 1000/DE, un modèle successeur sorti en 1988.

Le premier scanner à plat utilisé pour le traitement numérique d'images fut la gamme Autokon , lancée par ECRM Inc. en 1975. Le modèle initial, l'Autokon 8400, utilisait un faisceau laser pour numériser des pages jusqu'à 28 x 35,5 cm (11 x 14 pouces) à une résolution maximale de 1 000 lignes par pouce . Bien qu'il ne puisse numériser qu'en monochrome 1 bit, son processeur intégré offrait des fonctionnalités telles que la tramage, le masquage flou , le réglage du contraste et la correction des distorsions anamorphiques . L'Autokon 8400 pouvait être connecté soit à un enregistreur de film pour créer un négatif destiné à la production de plaques, soit à un ordinateur central ou un mini-ordinateur pour un traitement d'image plus poussé et le stockage numérique. La gamme Autokon s'est développée au cours des deux décennies suivantes et a connu une large diffusion dans la presse et le prépresse .

En 1977, Raymond Kurzweil , de sa start-up Kurzweil Computer Products, a lancé la machine de lecture Kurzweil, le premier scanner à plat doté d'un capteur d'image CCD (dispositif à transfert de charges ). La machine de lecture Kurzweil a été conçue pour aider les personnes aveugles à lire des livres non traduits en braille . Elle comprenait un scanner d'images et un mini-ordinateur Data General Nova , ce dernier assurant le traitement d'images, la reconnaissance optique de caractères (OCR) et la synthèse vocale .

Les premiers scanners pour ordinateurs personnels sont apparus au milieu des années 1980, avec le ThunderScan pour Macintosh en décembre 1984. Conçu par Andy Hertzfeld et commercialisé par Thunderware Inc., le ThunderScan intègre un capteur d'image spécialisé dans un boîtier en plastique de la même forme que la cartouche de ruban encreur de l'imprimante ImageWriter d' Apple . Le ThunderScan s'insère dans le porte-ruban de l'ImageWriter et se connecte simultanément à l'ImageWriter et au Macintosh. Le chariot de l'ImageWriter, contrôlé par le ThunderScan, se déplace de gauche à droite pour numériser une ligne à 200 ppp (points par pouce) à la fois, le retour chariot permettant d'avancer le scanner le long du document à numériser. Premier scanner pour Macintosh, le ThunderScan a connu un succès commercial, mais sa vitesse était très lente et il ne pouvait numériser que des documents en monochrome 1 bit. En 1999, Canon a perfectionné cette idée avec l'IS-22, une cartouche qui s'adaptait à ses imprimantes à jet d'encre pour les convertir en scanners à feuilles.

Début 1985, Datacopy lançait le premier scanner à plat pour IBM PC , le Datacopy modèle 700. Basé sur un capteur CCD, le modèle 700 pouvait numériser des documents au format lettre à une résolution maximale de 200 ppp en monochrome 1 bit. Le modèle 700 était fourni avec une carte d'interface spéciale pour la connexion au PC, et une carte logicielle OCR ainsi qu'un progiciel étaient disponibles en option. En avril 1985, LaserFAX Inc. présentait un scanner à plat couleur à capteur CCD, le SpectraSCAN 200 (rebaptisé ultérieurement SpectraFAX 200), pour IBM PC. Le SpectraSCAN 200 fonctionnait en plaçant des filtres de couleur sur le capteur CCD et en effectuant quatre passages (trois pour chaque couleur primaire et un pour le noir) par numérisation afin d'obtenir une reproduction couleur. Le SpectraSCAN 200 nécessitait entre deux et trois minutes pour numériser une impression au format lettre à 200 ppp ; son équivalent en niveaux de gris, le DS-200, ne prenait que 30 secondes pour effectuer une numérisation de même taille et de même résolution. Le SpectraSCAN fut le premier scanner à plat capable de numériser en couleur.

Le premier scanner à plat relativement abordable pour ordinateurs personnels est apparu en février 1987 avec le ScanJet de Hewlett-Packard , capable de numériser des images en niveaux de gris 4 bits (64 nuances) à une résolution maximale de 300 ppp. Début 1988, le ScanJet représentait 27 % des ventes totales de scanners en valeur, selon Gartner Dataquest . En février 1989, la société a lancé le ScanJet Plus, qui portait la profondeur de couleur à 8 bits (256 nuances) pour seulement 200 $ de plus que le ScanJet original (1 990 $, soit l'équivalent de 5 169 $ en 2025). Ce lancement a entraîné une chute drastique des prix des scanners en niveaux de gris aux caractéristiques équivalentes ou inférieures. Le nombre de développeurs tiers produisant des logiciels et du matériel compatibles avec ces scanners a connu une augmentation spectaculaire, contribuant ainsi à populariser le scanner auprès des utilisateurs d'ordinateurs personnels. En 1999, le prix moyen d'un scanner couleur avait chuté à 300 $ (équivalent à 580 $ en 2025). Cette année-là, Computer Shopper a déclaré que 1999 était « l'année où les scanners sont enfin devenus un produit de consommation courante ».

Types

plateau

Un scanner à plat ( HP ScanJet IIC ) avec son couvercle fermé

Un scanner à plat est un type de scanner doté d'une surface en verre ( plateau ) sur laquelle repose immobile l'objet à numériser. L'élément de numérisation se déplace verticalement sous le verre, numérisant soit la totalité du plateau, soit une portion prédéterminée. Le logiciel pilote de la plupart des scanners à plat permet à l'utilisateur de pré-numériser ses documents : il s'agit d'effectuer une numérisation rapide à basse résolution afin de déterminer la zone à numériser (voire la totalité du document) avant de procéder à une numérisation à plus haute résolution. Certains scanners à plat intègrent un système d'alimentation automatique de documents (ADF) qui utilise le même élément de numérisation que le plateau.

Ce type de scanner est parfois appelé scanner à réflexion , car il fonctionne en projetant une lumière blanche sur l'objet à numériser et en mesurant l'intensité et la couleur de la lumière réfléchie, généralement ligne par ligne. Ils sont conçus pour numériser des tirages ou d'autres supports plats et opaques, mais certains disposent d'adaptateurs pour transparents qui, pour diverses raisons, ne sont généralement pas adaptés à la numérisation de films.

Feuilles

Un chargeur automatique de documents ( Fujitsu ScanSnap iX500)

Un scanner à défilement, également appelé chargeur de documents est un type de scanner qui utilise des rouleaux motorisés pour faire défiler une feuille de papier à la fois devant un élément de numérisation fixe (deux éléments de numérisation pour les scanners recto verso ) . Contrairement aux scanners à plat, les scanners à défilement ne sont pas conçus pour numériser des documents reliés tels que des livres ou des magazines, ni pour traiter des supports plus épais que du papier d'imprimante ordinaire . Certains scanners à défilement, appelés chargeurs automatiques de documents (CAD), peuvent numériser plusieurs feuilles en une seule session , tandis que d'autres n'acceptent qu'une seule page à la fois . Certains scanners à défilement sont portables , alimentés par batterie et disposent de leur propre mémoire interne, transférant ensuite les numérisations enregistrées vers un ordinateur

portable

Un scanner portable ( Logitech ScanMan Color)

Un scanner portable est un type de scanner qui doit être déplacé manuellement sur la surface de l'objet à numériser. La numérisation de documents de cette manière exige une main stable, car une vitesse de balayage irrégulière produit des images déformées. Certains scanners portables sont équipés d'un voyant lumineux qui s'allume si l'utilisateur déplace le scanner trop rapidement. Ils possèdent généralement au moins un bouton qui lance la numérisation ; l'utilisateur doit le maintenir enfoncé pendant toute la durée de l'opération. D'autres scanners portables sont dotés de commutateurs permettant de régler la résolution optique , ainsi que d'un rouleau qui génère une impulsion d'horloge pour la synchronisation avec l'ordinateur. Les anciens scanners portables étaient monochromes et utilisaient une matrice de LED vertes pour éclairer l'image ; les modèles plus récents numérisent en monochrome ou en couleur, selon les besoins. Un scanner portable peut également comporter une petite fenêtre permettant de visualiser le document en cours de numérisation. Comme les scanners portables sont beaucoup plus étroits que la plupart des formats de documents ou de livres courants, le logiciel (ou l'utilisateur final) devait combiner plusieurs « bandes » étroites de documents numérisés pour produire le document final.

Des scanners à main et des stylos scanners peu coûteux, portables , alimentés par batterie ou USB, généralement capables de numériser une zone aussi large qu'une lettre normale et beaucoup plus longue, restent disponibles en 2024. Certaines souris d'ordinateur peuvent également numériser des documents.

Tambour

Un scanner à tambour ( Hell Chromagraph DC 300) en fonctionnement

Un scanner à tambour est un type de scanner utilisant un cylindre rotatif transparent, entraîné par un moteur (le tambour), sur lequel est fixé, par collage ou autre moyen, un tirage, un négatif, une diapositive ou tout autre objet plat. Un faisceau lumineux, soit projeté sur le support à numériser, soit réfléchi par celui-ci, est focalisé sur une série de miroirs qui le dirigent vers le tube photomultiplicateur (PMT) du scanner. Après une rotation complète, le faisceau lumineux descend d'un cran. Lors de la numérisation de supports transparents, comme les négatifs, le faisceau est dirigé depuis l'intérieur du cylindre vers le support ; pour les supports opaques, le faisceau, provenant du dessus, est réfléchi par la surface du support. Avec un seul PMT, trois passages de l'image sont nécessaires pour une numérisation RVB en couleur. Avec trois PMT, un seul passage suffit.

Les tubes photomultiplicateurs des scanners à tambour offrent une plage dynamique supérieure à celle des capteurs CCD. De ce fait, les scanners à tambour peuvent extraire davantage de détails des zones d'ombre très sombres d'une diapositive que les scanners à plat utilisant des capteurs CCD. La plage dynamique plus réduite des capteurs CCD (comparativement aux tubes photomultiplicateurs) peut entraîner une perte de détails dans les zones d'ombre, notamment lors de la numérisation de films transparents très denses. Les scanners à tambour sont également capables de restituer des détails précis à plus de 10 000 dpi, produisant ainsi des numérisations à plus haute résolution que n'importe quel scanner CCD.

Aérien

Un scanner de livres à plat (série CZUR ET) avec lasers pour l'étalonnage

Un scanner à défilement vertical est un type de scanner dont l'élément de numérisation est placé dans un boîtier fixé au sommet d'un montant vertical, au-dessus du document ou de l'objet à numériser, lequel repose immobile sur une table à l'air libre. Chinon Industries a breveté un type spécifique de scanner à défilement vertical en 1987, utilisant un miroir rotatif pour refléter le contenu de la table sur un capteur CCD linéaire. Bien que très flexible – permettant de numériser non seulement des impressions et des documents bidimensionnels, mais aussi tout objet 3D, quelle que soit sa taille – le modèle Chinon exigeait un éclairage uniforme de l'objet à numériser et était plus complexe à installer.

Un type plus moderne de scanner à défilement vertical est la caméra de documents (également appelée scanner vidéo), qui utilise un appareil photo numérique pour numériser un document en une seule image. La plupart des caméras de documents diffusent une vidéo en direct du document et sont généralement réservées à la projection de documents devant un public, mais elles peuvent également remplacer les scanners d'images, en capturant une seule image du document sous forme de fichier image. Les caméras de documents peuvent même utiliser les mêmes API que les scanners lorsqu'elles sont connectées à un ordinateur. Un scanner planétaire est un type de caméra de documents à très haute résolution utilisé pour la numérisation de certains documents fragiles. Un scanner de livres est un autre type de caméra de documents, associant un appareil photo numérique à une zone de numérisation définie par un tapis pour faciliter la numérisation de livres. Certains modèles plus avancés de scanners de livres projettent un laser sur la page pour le calibrage et la correction logicielle de l'inclinaison.

Film

Un scanner de films (Reflecta DigitDia 6000) conçu pour numériser des diapositives

Un scanner de films , également appelé scanner de diapositives ou scanner de transparents, est un type de scanner à plat spécialisé, conçu spécifiquement pour la numérisation de négatifs et de diapositives . Un scanner de films classique fonctionne en faisant passer un faisceau lumineux très concentré à travers le film et en mesurant l'intensité et la couleur de la lumière qui en résulte. Les scanners de films dédiés les plus abordables sont disponibles à moins de 50 dollars et peuvent suffire pour des besoins modestes. Au-delà, leur prix augmente progressivement, avec des niveaux de qualité et des fonctionnalités avancées, dépassant souvent les 10 000 dollars.

Portable

Illustration d'un scanner de cartes de visite portable

Les scanners d'images sont généralement utilisés avec un ordinateur qui les contrôle et stocke les numérisations. Des petits scanners portables, à alimentation feuille à feuille ou manuels , fonctionnant sur batterie et dotés d'une capacité de stockage, permettent une utilisation sans ordinateur ; les numérisations enregistrées peuvent être transférées ultérieurement. Nombre d'entre eux peuvent numériser aussi bien des petits documents, tels que des cartes de visite et des tickets de caisse , que des documents au format lettre.

logiciels de numérisation

Les appareils photo haute résolution intégrés à certains smartphones permettent de numériser des documents de qualité acceptable en prenant une photo avec l'appareil du téléphone, puis en la traitant avec une application de numérisation. De nombreuses applications de ce type sont disponibles pour la plupart des systèmes d'exploitation mobiles . Elles permettent notamment de blanchir le fond, de corriger la perspective (par exemple, pour un document rectangulaire), de convertir le document en noir et blanc, etc. Beaucoup de ces applications peuvent numériser des documents de plusieurs pages en effectuant des prises de vue successives et les exporter sous forme de fichier unique ou de fichiers multipages. Certaines applications de numérisation pour smartphones permettent d'enregistrer les documents directement sur des services de stockage en ligne comme Dropbox et Evernote , de les envoyer par e-mail ou par fax via des passerelles e-mail-fax.

Les applications de numérisation pour smartphones peuvent être globalement divisées en trois catégories :

  1. Applications de numérisation de documents principalement conçues pour traiter des documents et produire des fichiers PDF, et parfois JPEG.
  2. Applications de numérisation de photos qui produisent des fichiers JPEG et qui possèdent des fonctions d'édition utiles pour les photos plutôt que pour les documents ;
  3. Des applications de lecture de codes QR semblables à des codes-barres qui recherchent ensuite sur Internet des informations associées au code.

Éléments de numérisation

Dispositif à transfert de charge (CCD)

Les scanners équipés de capteurs CCD ( dispositifs à transfert de charge ) nécessitent un système complexe de miroirs et de lentilles pour reproduire une image, mais cette complexité permet d'obtenir une numérisation de bien meilleure qualité. Grâce à leur profondeur de champ beaucoup plus importante, les capteurs CCD sont plus tolérants lors de la numérisation de documents difficiles à positionner parfaitement à plat sur la vitre (comme les livres reliés).

Capteur d'image de contact (CIS)

Unité de numérisation avec CIS. A : assemblée, B : démontée ; 1 : boîtier, 2 : conducteur de lumière, 3 : lentilles, 4 : puce avec deux LED RVB, 5 : CIS

Les scanners équipés de capteurs d'images par contact (CIS) sont conçus pour être en contact quasi direct avec le document à numériser et ne nécessitent donc pas l'optique complexe des scanners CCD. Cependant, leur profondeur de champ est nettement inférieure, ce qui entraîne des numérisations floues si le document n'est pas parfaitement plaqué contre la vitre. Grâce à leur faible consommation d'énergie, les scanners CIS peuvent être fabriqués à moindre coût et sont généralement beaucoup plus légers et moins épais que les scanners CCD.

Tube photomultiplicateur (PMT)

Les scanners équipés de tubes photomultiplicateurs (PMT) sont presque exclusivement des scanners à tambour .

Qualité de numérisation

Les scanners couleur lisent généralement les données de couleur RVB (rouge-vert-bleu) de la matrice. Ces données sont ensuite traitées par un algorithme propriétaire afin de corriger les variations d'exposition, puis envoyées à l'ordinateur via l' interface d'entrée/sortie du périphérique (généralement USB ; auparavant, il s'agissait de SCSI ou d'un port parallèle bidirectionnel pour les anciens modèles).

La profondeur des couleurs varie en fonction des caractéristiques de la matrice de balayage, mais elle est généralement d'au moins 24 bits. Les modèles haut de gamme offrent une profondeur de couleurs de 36 à 48 bits.

Un autre critère de sélection d'un scanner est sa résolution , mesurée en pixels par pouce (ppi), parfois plus précisément en échantillons par pouce (spi). Plutôt que d'utiliser la résolution optique réelle du scanner, seule donnée pertinente, les fabricants préfèrent se référer à la résolution interpolée, bien supérieure grâce à l' interpolation logicielle . En 2009, un scanner à plat haut de gamme pouvait atteindre une résolution de 5 400 ppi, tandis que les scanners à tambour offraient une résolution optique comprise entre 3 000 et 24 000 ppi.

La résolution effective désigne la résolution réelle d'un scanner et est déterminée à l'aide d'une mire de résolution. La résolution effective de la plupart des scanners à plat grand public est considérablement inférieure à la résolution optique indiquée par le fabricant.

Les fabricants annoncent souvent des résolutions interpolées allant jusqu'à 19 200 ppp ; mais de tels chiffres n'ont que peu de valeur significative car le nombre de pixels interpolés possibles est illimité, et cela n'augmente pas le niveau de détail capturé.

La taille du fichier créé augmente avec le carré de la résolution ; doubler la résolution quadruple la taille du fichier . Il est essentiel de choisir une résolution compatible avec les capacités de l’équipement, préservant suffisamment de détails et n’entraînant pas un fichier trop volumineux. Pour une résolution donnée, la taille du fichier peut être réduite grâce à des méthodes de compression avec perte, telles que le JPEG, au prix d’une légère perte de qualité. Si la meilleure qualité possible est requise, il convient d’utiliser une compression sans perte ; des fichiers de qualité réduite et de taille plus petite peuvent être générés à partir d’une telle image, au besoin (par exemple, une image destinée à être imprimée sur une page entière et un fichier beaucoup plus léger pour être affiché sur une page web à chargement rapide).

La pureté de l'image peut être altérée par le bruit du scanner, les reflets parasites, une conversion analogique-numérique de mauvaise qualité, les rayures, la poussière, les anneaux de Newton , les capteurs flous, un mauvais fonctionnement du scanner et un logiciel inadapté. Les scanners à tambour sont réputés pour produire les reproductions numériques les plus pures du film, suivis des scanners haut de gamme utilisant les capteurs Kodak Tri-Linear de plus grande taille.

Le troisième paramètre important pour un scanner est sa plage dynamique (également appelée plage de densité). Une plage de densité élevée signifie que le scanner est capable d'enregistrer les détails dans les ombres et les hautes lumières en une seule numérisation. La densité d'un film est mesurée sur une échelle logarithmique de base 10 et varie entre 0,0 (transparent) et 5,0, soit environ 16 diaphragmes. La plage de densité correspond à l'espace occupé sur l'échelle de 0 à 5, et Dmin et Dmax désignent les valeurs de densité minimale et maximale sur un film négatif ou positif. La plage de densité d'un film négatif peut atteindre 3,6 d, tandis que celle d'un film diapositive est de 2,4 d. Après développement, la plage de densité d'un négatif couleur est de 2,0 d grâce à la compression des 12 diaphragmes en une plage de densité réduite. Dmax sera la valeur la plus élevée pour les ombres sur un film diapositive et la plus élevée pour les hautes lumières sur un film négatif. Certains films diapositives peuvent avoir une Dmax proche de 4,0d avec une exposition correcte, tout comme les films négatifs noir et blanc.

Les scanners à plat grand public ont une plage dynamique de 2,0 à 3,0, ce qui peut s'avérer insuffisant pour numériser tous les types de films photographiques , car la densité maximale (Dmax) se situe souvent entre 3,0 et 4,0 d pour les films noir et blanc traditionnels. Les films couleur, grâce au couplage des colorants et à l'élimination de l'argent de l'émulsion, compriment leurs 12 diaphragmes (sur 16 possibles) en seulement 2,0 d. Le Kodak Vision 3 offre 18 diaphragmes. De ce fait, les films négatifs couleur sont les plus faciles à numériser, et ce, sur la plus large gamme de scanners. Les films noir et blanc traditionnels, en conservant l'argent nécessaire à la formation de l'image après développement, présentent une plage dynamique presque deux fois supérieure à celle des films couleur. Leur numérisation est donc plus complexe et nécessite un scanner avec une plage dynamique d'au moins 3,6 d, ainsi qu'une densité maximale (Dmax) comprise entre 4,0 et 5,0 d. Les scanners à plat haut de gamme (de laboratoire photo) peuvent atteindre une plage dynamique de 3,7 et une densité optique maximale (Dmax) d'environ 4,0 dB. Les scanners de films dédiés ont une plage dynamique comprise entre 3,0 et 4,0 dB. Les scanners de documents de bureau peuvent avoir une plage dynamique inférieure à 2,0 dB. Les scanners à tambour ont une plage dynamique de 3,6 à 4,5 dB.

Pour la numérisation de films,Le nettoyage infrarouge est une technique permettant d'éliminer les effets de la poussière et des rayures sur les images numérisées à partir de films ; de nombreux scanners modernes intègrent cette fonctionnalité. Elle consiste à scanner le film avec de la lumière infrarouge ; les colorants des émulsions des films couleur classiques sont transparents à cette lumière, contrairement à la poussière et aux rayures qui la bloquent. Le logiciel du scanner utilise les informations visibles et infrarouges pour détecter les rayures et traiter l'image afin d'en atténuer considérablement la visibilité, en tenant compte de leur position, de leur taille, de leur forme et de leur environnement. Les fabricants de scanners utilisent généralement des noms spécifiques pour cette technique. Par exemple,Epson,Minolta,Nikon,Konica Minolta,Microteket d'autres utilisentDigital ICE, tandis queCanonutilise son propre système,FARE(Film Automatic Retouching and Enhancement). PlustekutiliseLaserSoft ImagingiSRD. ​​Certains développeurs de logiciels indépendants conçoivent des outils de nettoyage infrarouge.

En combinant des images en couleur et des modèles 3D, les scanners portables modernes permettent de reproduire fidèlement des objets électroniquement. L'ajout d'imprimantes 3D couleur autorise une miniaturisation précise de ces objets, avec des applications dans de nombreux secteurs et professions.

Pour les applications de numérisation, la qualité de la numérisation dépend fortement de la qualité de l'appareil photo du téléphone et du cadrage choisi par l'utilisateur de l'application.

Connectivité

Une photographie est numérisée sur un ordinateur au service photo du Detroit News au début des années 1990.

Les numérisations doivent presque toujours être transférées du scanner vers un ordinateur ou un système de stockage de données pour traitement ou archivage. Deux points essentiels se posent : (1) la connexion physique du scanner à l’ordinateur et (2) la manière dont l’application récupère les données du scanner.

Connexion directe

La taille d'un fichier numérisé peut atteindre environ 100 Mo pour une image non compressée 24 bits de 23 × 28 cm (légèrement plus grande qu'une feuille A4 ) à 600 ppp . Les fichiers numérisés doivent être transférés et stockés. Les scanners peuvent générer ce volume de données en quelques secondes ; une connexion rapide est donc indispensable.

Les scanners communiquent avec leur ordinateur hôte à l'aide de l'une des interfaces physiques suivantes, classées approximativement de la plus lente à la plus rapide :

  • Port parallèle – La connexion via un port parallèle est la méthode de transfert la plus lente. Les premiers scanners disposaient de connexions par port parallèle dont le débit était limité à 70 kilo-octets par seconde . Le principal avantage de la connexion par port parallèle résidait dans son coût et sa simplicité d'utilisation : elle permettait d'éviter l'ajout d'une carte d'interface à l'ordinateur.
  • GPIB – Bus d'interface à usage général. Certains scanners à tambour, comme le Howtek D4000, disposaient d'une interface SCSI et GPIB. Cette dernière est conforme à la norme IEEE-488, apparue au milieu des années 1970. L'interface GPIB n'a été utilisée que par quelques fabricants de scanners, principalement pour les environnements DOS/Windows. Pour les systèmes Apple Macintosh, National Instruments proposait une carte d'interface GPIB NuBus .
  • L'interface SCSI (Small Computer System Interface) est rarement utilisée depuis le début du XXIe siècle et n'est prise en charge que par les ordinateurs dotés d'une interface SCSI, soit sur carte, soit intégrée. Au cours de l'évolution de la norme SCSI, les débits ont augmenté. Les interfaces USB et FireWire, largement disponibles et faciles à configurer, ont progressivement supplanté le SCSI.
  • Bus série universel (USB) – Les scanners USB permettent des transferts de données rapides. La norme USB 1.1, bien qu'ancienne, offrait un débit de 1,5 mégaoctet par seconde (plus lent que le SCSI), tandis que les normes USB 2.0 et 3.0, plus récentes, permettent en pratique des débits supérieurs à 20/60 mégaoctets par seconde.
  • FireWire – Également connu sous le nom d'IEEE-1394, FireWire est une interface dont la vitesse est comparable à celle de l'USB 2.0. Les vitesses FireWire possibles sont de 25, 50, 100, 400 et 800 mégabits par seconde, mais les appareils peuvent ne pas prendre en charge toutes les vitesses.
  • Interfaces propriétaires – Des interfaces sur mesure étaient utilisées sur certains des premiers scanners, qui utilisaient une carte d'interface propriétaire plutôt qu'une interface standard.

Connexion indirecte

Au début des années 1990, des scanners à plat professionnels étaient disponibles via un réseau informatique local . Cette solution s'est avérée utile aux éditeurs, aux imprimeries, etc. Son utilisation a ensuite considérablement diminué avec la baisse du coût des scanners à plat, rendant le partage superflu.

À partir de 2000, des appareils multifonctions tout-en-un sont apparus, adaptés aussi bien aux petits bureaux qu'aux particuliers, offrant des fonctions d'impression, de numérisation, de copie et de télécopie dans un seul appareil pouvant être mis à la disposition de tous les membres d'un groupe de travail.

Les scanners portables alimentés par batterie stockent les numérisations sur une mémoire interne ; celles-ci peuvent ensuite être transférées sur un ordinateur soit par connexion directe, généralement USB, soit, dans certains cas, en retirant une carte mémoire du scanner et en la branchant à l’ordinateur.

Interface de programmation d'applications

Un logiciel de traitement d'images matricielles doit pouvoir communiquer avec un scanner. Il existe de nombreux scanners différents, utilisant souvent des protocoles différents. Afin de simplifier la programmation, des interfaces de programmation (API) ont été développées. L'API offre une interface uniforme avec le scanner. Ainsi, l'application n'a pas besoin de connaître les spécificités du scanner pour y accéder directement. Par exemple, Adobe Photoshop prend en charge la norme TWAIN ; en théorie, Photoshop peut donc acquérir une image depuis n'importe quel scanner équipé d'un pilote TWAIN.

En pratique, des problèmes surviennent souvent lors de la communication entre une application et un scanner. Il peut s'agir de défauts dans l'implémentation de l'API, soit de l'application, soit du fabricant du scanner (ou des deux).

L'API est généralement implémentée sous forme de bibliothèque dynamique . Chaque fabricant de scanner fournit un logiciel qui traduit les appels de procédure de l'API en commandes primitives adressées à un contrôleur matériel (tel qu'un contrôleur SCSI, USB ou FireWire). La partie de l'API côté fabricant est communément appelée pilote de périphérique , mais cette appellation est inexacte : l'API ne s'exécute pas en mode noyau et n'accède pas directement au périphérique. En réalité, la bibliothèque API du scanner traduit les requêtes de l'application en requêtes matérielles.

Les API courantes des logiciels de numérisation incluent :

  • TWAIN – Une API utilisée par la plupart des scanners. Initialement destinée aux équipements bas de gamme et à usage domestique, elle est désormais largement utilisée pour la numérisation de grands volumes.
  • SANE (Scanner Access Now Easy) est une API libre et gratuite permettant d'accéder aux scanners. Initialement développée pour les systèmes d'exploitation Unix et Linux , elle a été portée sur OS/2 , macOS et Microsoft Windows . Contrairement à TWAIN, SANE ne gère pas l'interface utilisateur. Cela permet les numérisations par lots et un accès réseau transparent sans intervention du pilote de périphérique.
  • Acquisition d'images Windows (WIA) – Une API fournie par Microsoft pour une utilisation sur Microsoft Windows .
  • ImageCaptureCore - Une API Cocoa utilisée par les appareils Apple, remplaçant les services ImageCapture basés sur Carbon .
  • Spécification d'interface d'image et de scanner (ISIS) – Créée par Pixel Translations, qui utilise encore SCSI-2 pour des raisons de performance, ISIS est utilisée par des machines de grande taille, à l'échelle d'un département.

Applications groupées

Bien qu'aucun scanner ne soit fourni avec un logiciel autre qu'un utilitaire de numérisation, de nombreux modèles sont livrés avec un logiciel. Généralement, en plus de l'utilitaire de numérisation, un logiciel de retouche d'images matricielles (comme Photoshop ou GIMP ) et un logiciel de reconnaissance optique de caractères (OCR) sont fournis. Ce dernier convertit les images de texte en texte standard, modifiable à l'aide des logiciels de traitement de texte courants ; la précision est rarement parfaite.

Données de sortie

Certains scanners, notamment ceux conçus pour numériser des documents imprimés, fonctionnent uniquement en noir et blanc, tandis que la plupart des scanners modernes fonctionnent en couleur. Dans ce dernier cas, le résultat de la numérisation est une image RVB non compressée, qui peut être transférée dans la mémoire d'un ordinateur. Le rendu des couleurs varie d'un scanner à l'autre en raison de la réponse spectrale de leurs capteurs, de la nature de leur source lumineuse et des corrections appliquées par le logiciel de numérisation. Bien que la plupart des capteurs d'image aient une réponse linéaire, les valeurs de sortie sont généralement compressées gamma . Certains scanners compressent et améliorent l'image grâce à un micrologiciel intégré . Une fois sur l'ordinateur, l'image peut être traitée avec un logiciel de retouche d'images matricielles (tel que Photoshop) et enregistrée sur un périphérique de stockage (tel qu'un disque dur ).

Les numérisations peuvent être enregistrées sans compression dans des formats d'image tels que BMP ; compressées sans perte dans des formats tels que TIFF et PNG ; compressées avec perte dans des formats tels que JPEG ; ou encore intégrées à un PDF ou converties en graphiques vectoriels . Un logiciel de reconnaissance optique de caractères (OCR) permet de convertir une image numérisée de texte en texte modifiable avec une précision raisonnable, à condition que le texte soit net et utilise une police et une taille compatibles avec le logiciel. La fonction OCR peut être intégrée au logiciel de numérisation, ou le fichier image numérisé peut être traité avec un logiciel OCR externe.

Utilisations spécifiques

Traitement des documents

Les exigences en matière de traitement de documents diffèrent de celles de la numérisation d'images. Elles comprennent la vitesse de numérisation, l'alimentation papier automatique et la possibilité de numériser automatiquement le recto et le verso d'un document. En revanche, la numérisation d'images requiert généralement la capacité de traiter des objets fragiles et/ou tridimensionnels, ainsi qu'une résolution de numérisation bien supérieure.

Les scanners de documents sont équipés de chargeurs de documents, généralement plus grands que ceux que l'on trouve parfois sur les photocopieurs ou les scanners multifonctions. La numérisation s'effectue à grande vitesse, de 20 à 420 pages par minute, souvent en niveaux de gris, bien que de nombreux scanners prennent en charge la couleur. Beaucoup de scanners permettent de numériser les deux faces de documents recto verso (fonctionnement recto verso). Les scanners de documents sophistiqués disposent d'un micrologiciel ou d'un logiciel qui nettoie les numérisations de texte en temps réel, éliminant les marques accidentelles et accentuant la netteté du texte ; cette méthode serait inadaptée à la numérisation photographique, où les marques sont difficiles à distinguer des détails fins. Les fichiers créés sont compressés lors de leur création.

La résolution utilisée est généralement de 150 à 300 ppp, bien que le matériel puisse être capable d'une résolution de 600 ppp ou plus ; cela produit des images de texte suffisamment nettes pour la lecture et la reconnaissance optique de caractères (OCR), sans les exigences plus élevées en matière d'espace de stockage requises par les images à plus haute résolution.

Les documents numérisés sont souvent traités par reconnaissance optique de caractères (OCR) afin de créer des fichiers modifiables et consultables. La plupart des scanners utilisent des pilotes ISIS ou TWAIN pour numériser les documents au format TIFF, permettant ainsi leur intégration dans un système de gestion documentaire qui se chargera de leur archivage et de leur récupération. La compression JPEG avec perte, très efficace pour les images, est déconseillée pour les documents texte, car les contours droits et obliques apparaissent crénelés, tandis que le texte noir (ou d'une autre couleur) sur fond clair se compresse bien avec les formats de compression sans perte.

Bien que l'alimentation papier et la numérisation puissent être automatisées et rapides, la préparation et l'indexation restent indispensables et nécessitent une intervention humaine importante. La préparation implique une inspection manuelle des documents à numériser afin de vérifier qu'ils sont en bon état, dépliés et exempts d'agrafes ou de tout autre élément susceptible de bloquer le scanner. Par ailleurs, certains secteurs, comme le juridique et le médical, peuvent exiger que les documents comportent une numérotation Bates ou une autre marque permettant d'identifier le document et d'indiquer la date et l'heure de la numérisation.

L'indexation consiste à associer des mots-clés pertinents aux fichiers afin de faciliter leur recherche par contenu. Ce processus peut parfois être partiellement automatisé, mais il nécessite souvent une intervention manuelle d' opérateurs de saisie . Une pratique courante consiste à utiliser la technologie de reconnaissance de codes- barres : lors de la préparation, des feuilles de codes-barres contenant les noms des dossiers ou les informations d'index sont insérées dans les fichiers, dossiers et groupes de documents. Grâce à la numérisation par lots automatique, les documents sont enregistrés dans les dossiers appropriés et un index est créé en vue de son intégration dans les systèmes de gestion documentaire.

En juin 2011 , le ministère de la Culture, des Sports et du Tourisme de Corée du Sud a publié une interprétation stipulant que la numérisation d'un livre par un tiers non titulaire des droits d'auteur ou propriétaire de l'ouvrage constitue une violation du droit d'auteur . Par conséquent, en Corée du Sud, les propriétaires de livres se rendent dans des salles de numérisation pour faire numériser eux-mêmes leurs ouvrages .

La numérisation de livres est une forme spécialisée de numérisation de documents. Les difficultés techniques proviennent généralement de la reliure des livres, parfois fragiles et irremplaçables, mais certains fabricants ont développé des machines spécialisées pour y remédier. Des mécanismes robotisés spécifiques sont souvent utilisés pour automatiser le feuilletage et la numérisation des pages.

Autres utilisations

Les scanners à plat ont été utilisés comme dos numériques pour les appareils photo grand format afin de créer des images numériques haute résolution de sujets statiques. Un scanner à plat modifié a été utilisé pour la documentation et la quantification des chromatogrammes sur couche mince (CCM) détectés par extinction de fluorescence sur des couches de gel de silice contenant un indicateur ultraviolet (UV). Le ChromImage est présenté comme le premier densitomètre commercial à scanner à plat . Il permet l'acquisition d'images de plaques CCM et la quantification des chromatogrammes à l'aide du logiciel Galaxie-TLC. Outre leur utilisation comme densitomètres, les scanners à plat ont également été transformés en colorimètres par différentes méthodes. L'analyseur de couleurs trichromatique est présenté comme le premier système distribué utilisant un scanner à plat comme appareil colorimétrique tristimulus.

Les scanners à plat peuvent également être utilisés pour créer directement des œuvres d'art, selon une pratique connue sous le nom de scanographie .

Dans le domaine de la recherche biomédicale, les dispositifs de détection pour les puces à ADN sont également appelés scanners. Ces scanners sont des systèmes à haute résolution (jusqu'à 1 μm/pixel), similaires aux microscopes. La détection est réalisée à l'aide de capteurs CCD ou de tubes photomultiplicateurs.

En pathologie , les scanners sont utilisés pour capturer des lames de verre contenant des tissus provenant de biopsies et d'autres types d'échantillonnage, permettant diverses méthodes de pathologie numérique telles que la télépathologie et l'application de l'intelligence artificielle à l'interprétation.