Représentation d'un texte

Site de M.Vandevelde, professeur à l'ICTFF.

Cette partie reprend des notions abordées en classe de seconde SNT.

Le code ASCII

Le première version du code ASCII (American Standard Code for Information Interchange) a été publié en 1963.

Combien de bits minimum faut-il pour coder les caractères ASCII ?

On souhaite coder "L'oie bleue" en cade ASCII.

Écrire les codes ASCII (en base 10) de chaque lettre en les séparant du signe moins sans espace.

réponse :

Le code ISO-8859-1

Le première version de ce code appelé aussi Latin-1 a été publié en 1986.

A noter que ce code permet d'avoir notament le codage des caractères accentués ce qui n'est pas le cas avec le code ASCII.

Combien de bits minimum faut-il pour coder les caractères en ISO-8859 ?

Le code UNICODE

Plusieurs code sont apparus pour représenter les caractères spécifiques à chaque langue, sans être compatibles entre eux.
En effet, le même nombre décimal représentant un caractère dans une langue ne correspondait pas à celui d'une autre langue.

C'est la raison de la mise en place du codage UNICODE en 1991.

Il existe 3 codages différents : UTF8 - UTF16 - UTF32.

Combien d'octet(s) sont nécessaires pour coder la lettre é en UTF32 ?
Combien d'octet(s) sont nécessaires pour coder la lettre é en UTF8 ?

Les bases de données utilisent de nombreux champs de données pour mémoriser l'information.

Lorsque les champs sont créés, il faut définir le type de données, et indiquer pour les champs mémorisant les caractères le code utilisé comme le montre l'exemple ci-dessous :

codageCaractereExemple

Combien d'octets faut-il pour coder "Le ciel est sombre" en code UNICODE ?
Réponse :

 Tester en python les fonctions chr() et ord().