next up previous contents
Next: Commandes. Up: Les bases Previous: Bases binaire, octale, décimale   Table des matières  

3.2 Fichiers.

Le fichier est un composant de base de tous les ordinateurs. Il contient un seul bloc continu de données. Toute donnée -quel que soit son type- peut être contenue dans un fichier et, il n'y a pas de donnée qui ne puisse y être stockée. Par ailleurs, il n'y a pas de donnée qui soit stockée ailleurs que dans un fichier. Un fichier contient des données d'un même type; par exemple, une image est enregistrée dans un seul fichier. Durant sa préparation, ce livre a été enregistré dans un seul fichier. Il est peu commun que différents types de fichiers (par exemple un texte et des images) se trouvent ensemble dans le même fichier car cela n'est pas très commode. Un ordinateur peut contenir typiquement de l'ordre de 10.000 fichiers très variés. Chaque fichier possède un nom. Un nom de fichier sur une machine LINUX ou UNIX peut comporter jusqu'à 256 caractères.

Usuellement, le nom de fichier est explicite. Vous pourriez nommer une des lettres de votre correspondance à une amie ainsi: Mary_Jones.lettre. A partir de maintenant, si vous voyez une police de caractères comme celle-ci, il s'agira de mots pouvant être interprétés hors écran. Le nom que vous choisissez n'a pas d'importance du point de vue de l'ordinateur et il pourrait être une autre combinaison de chiffres et de lettres. Cependant, vous ferez référence à ces données-là à l'aide de ce nom de fichier-là lorsque vous souhaiterez traiter ce fichier. Aussi, préférerez-vous que le nom de fichier soit aussi descriptif que possible. [...]

Quel que soit le type de fichier, toutes les données contenues dans ce dernier consistent en une suite de nombres. La taille du fichier n'est que la longueur de la liste de ces nombres. Chaque nombre est appelé un octet (byte). Chaque octet contient 8 bits. [NdT: Le terme bit est une contraction de binary digit (ou nombre binaire)]. Chaque bit vaut 1 ou 0 et donc, il y a:
$\underbrace{2\,\times2\,\times2\,\times2\,\times2\,\times2\,\times2\,\times2}_{8\, bits}=\underbrace{256}_{1\, octet}$combinaisons possibles. Donc, un octet ne peut contenir qu'un nombre inférieur ou égal à 255. Il n'y a pas de type de données qui ne puisse être représenté par une liste d'octets.

La lettre à Mary sera encodée sous forme d'octets pour être enregistrée sur le disque de l'ordinateur. Nous savons tous qu'une image de télévision n'est qu'un ensemble de points (pixels) qui balayent l'écran de gauche à droite. De la même manière, une image peut être représentée dans un fichier, c'est-à-dire comme une séquence d'octets où chacun de ceux-ci est interprété comme un niveau de brillance: 0 pour le noir, 255 pour le blanc. Dans le cas de la lettre à Mary, la convention est d'enregistrer A comme 65, B comme 66, etc. Chaque caractère de ponctuation a son équivalent numérique.

Une table de correspondance appelée jeu de caractères ou table de caractères permet d'établir le lien entre lettres et nombres. Le jeu de caractères le plus répandu à ce jour est le jeu de caractères ASCII qui est l'acronyme d'American Standard Code for Information Interchange. Le tableau 3 montre le jeu de caractères ASCII entre les caractères et leur équivalent hex, décimal et octal.


Tableau 3: Jeu de caractères ASCII.





next up previous contents
Next: Commandes. Up: Les bases Previous: Bases binaire, octale, décimale   Tables des matières  
1-01-2006