définition de la numérisation

Nous vivons dans un monde numérique, certains diront que par nature (au niveau des particules, c'est discontinu), tandis que d'autres diront cela parce que nous avons besoin de représenter la réalité d'une manière compréhensible pour nos machines, les ordinateurs. Dans tous les cas, nous sommes en train de tout digitaliser (ou presque).

La numérisation est un processus par lequel quelque chose de réel (physique, tangible) est transféré aux données numériques afin qu'il puisse être manipulé par un ordinateur (de nature, à son tour, numérique), le modélisant, le modifiant et en tirant parti pour d'autres objectifs différents de son rôle ou de sa fonction d'origine.

Autrement dit, nous passons d'une réalité continue (ou que nous voyons au niveau macroscopique en tant que tel), à une réalité discontinue, composée de bits (zéros et uns).

La numérisation nécessite la lecture, généralement au moyen d'outils technologiques, du modèle original pour collecter des données qui seront plus tard utiles pour reconstruire l'objet au format numérique à l'intérieur de l'ordinateur.

Le terme s'applique à différentes technologies à des fins légèrement différentes.

Par exemple, la numérisation d'un document manuscrit sur papier peut consister en une numérisation et une interprétation ultérieure à l'aide d'un programme OCR (Optical Character Recognizer), ou simplement en numérisation.

Si on s'en tient à la première partie, la numérisation, on obtient un document lisible à l'écran et imprimable, qui peut être manipulé comme une image, mais que l'on ne pourra pas éditer sous forme de texte. En revanche, si nous autorisons un Logiciel reconnaissez ce qui est écrit, nous aurons un texte manipulable.

Et cet exemple me permet d'introduire un nouveau concept: la numérisation peut contenir des erreurs concernant ce que nous, les êtres humains, interprétons.

Sans aller plus loin, dans le cas du document numérisé puis interprété, une mauvaise écriture de l'auteur du texte peut conduire le programme OCR à interpréter un l là où un i doit aller, ou vice versa, ou à mal interpréter un autre caractère .

Cela nécessite une révision du texte et sa correction par un relecteur humain.

Le processus de numérisation peut être appliqué à de nombreuses facettes de la vie et de la nature. Par exemple:

  • Ondes sonores, telles que la voix ou la musique, à manipuler ou simplement reproduites au format numérique, transmises sur Internet et stockées.
  • Image. Les mêmes appareils photo numériques intègrent un capteur qui capture ce qui est vu à travers l'objectif sous forme de bits, avec des données correspondant à la position et à la couleur.
  • Signaux radio ou autres types d'ondes sans fil qui, comme la voix, peuvent être analysés et même manipulés.
  • Plans de construction ou, même, données sur des bâtiments déjà construits sans avoir les plans (à l'aide d'outils et de techniques spéciaux), pour l'élaboration ultérieure de modèles tridimensionnels qui peuvent être manipulés à des fins d'architecture, de design d'intérieur, ...
  • L'obtention de signaux numériques à partir de l'analogique (numérisation) offre des avantages, tels que la reproduction sans perte de qualité, et sa manipulation pour le convertir en quelque chose de différent.

    Bien que nous ayons déjà commenté sa manipulation, la reproduction sans perte de qualité consiste en ce que l'on peut faire autant de copies que l'on veut sans que cela signifie qu'elles se détériorent.

    Avez-vous déjà essayé de faire des copies d'une cassette à une autre, et une copie de la copie et ainsi de suite? Il arrivait toujours un moment où l'une des copies commençait à sonner franchement mal, car étant analogique, l'enregistrement dégradait progressivement certains aspects. En fait, deux copies du même original n'étaient jamais exactement les mêmes.

    D'autre part, les données numériques sont facilement copiées sans perte de qualité, car un 1 aura toujours la même valeur, tout comme un 0.

    Le problème de la numérisation se trouve toujours dans les ressources qui lui sont allouées: il faut prélever suffisamment d'échantillons pour que l'information discrète soit aussi proche que possible de la même information en format continu.

    C'est ce qu'on appelle le taux d'échantillonnage, et il consiste à prélever le nombre maximum d'échantillons numériquement quantifiables dans un laps de temps minimum.

    Une fois les données obtenues sous forme numérique à la suite de la lecture, on peut les laisser telles quelles (format RAW, «raw» en anglais), ou utiliser un algorithme de compression avec ou sans perte pour réduire sa taille et la rendre plus gérables et transférables via les réseaux télématiques, bien que cela se fasse généralement au prix d'une perte de qualité.

    Photo: Fotolia - Rozmarin