3 ASCII y binario

Toda la información que se almacena en un ordenador puede encontrarse en formato ASCII o binario, que son los dos formatioos básicos de codificación de información en un ordenador. La forma natural, desde el punto de vista de la máquina, es almacenar la información en formato binario; y la forma natural para el usuario es hacerlo en formato ASCII. Ambos sistemas utilizan el byte como unidad mínima de información capaz de almacenar 256 valores diferentes (normalmente números entre 0 y 255).

El formato ASCII (American Standard Code for Information Interchange) se basa en un sistema de codificación que asigna a cada carácter alfanumérico (A-Z, a-z, 0-9) o de control (retorno de carro, paso de línea, etc.) un valor entre 0 y 255. De este modo al almacenar un texto utilizaremos un byte por carácter más algunos bytes de control, el problema surge a la hora de almacenar números.

Cuando almacenamos un número en ASCII lo que se hace es utilizar un byte para almacenar cada una de los dígitos que lo componen (incluyendo un byte para el punto en los decimales) más algún carácter de separación entre números (espacio, coma, retorno de carro). En la figura 33 aparece el carácter que correspondende a cada uno de los 256 valores.

Figura 33: Codigo ASCII
Image asciitable Image extended

Por ejemplo el número 274.96 utilizaría 6 bytes [50][55][52][46][57][54] y la palabra SIG 3 [83][73][71].

La codificación ASCII tiene la ventaja fundamental de que puede leerse con cualquier editor o procesador de textos o con la orden type de MS-DOS o cat de Unix. Proporciona a los usuarios menos avezados una sensación de seguridad, que en algunos casos está fundamentada. Sin embargo tiene tres desventajas fundamentales:

En el formato binario se establece en primer lugar el número de bytes que van a hacer falta para almacenar una variable. Esto incluye saber cual será el valor mínimo, máximo y la precisión de los decimales en caso de valores no enteros. Si en un byte pueden almacenarse 256 valores distintos, el número de valores que pueden almacenarse en n bytes se obtiene como 256n. De este modo en el formato raster, todas las celdillas ocuparán el mismo número de bytes.


alonso 2006-02-13