domingo, 20 de abril de 2008

DATOS Y DIGITALIZACIÓN

DATOS

Los datos son números, letras o símbolos que describen objetos, condiciones o situaciones. Son el conjunto básico de hechos referentes a una persona, cosa o transacción de interés para distintos objetivos, entre los cuales se encuentra la toma de decisiones. Desde el punto de vista de la computación, los datos se representan como pulsaciones o pulsos electrónicos a través de la combinación de circuitos (denominados señal digital). Pueden ser:

1- Datos alfabéticos (las letras desde A a la Z).
2- Datos numéricos (por ej. del 0 al 9)
3- Datos simbólicos o de caracteres especiales (por ej. %, $, #, @, &, etc.)

Esos datos, cuando se trabaja en una computadora, son convertidos en números dígitos que, a su vez, son representados como pulsaciones o pulsos electrónicos.

En la actualidad para comunicarnos, expresarnos y guardar nuestra información, usamos el sistema de numeración decimal y el alfabeto, según se trate de valores numéricos o de texto. Una computadora como funciona con electricidad, reconoce dos clases de mensajes: cuando hay corriente eléctrica el mensaje es sí y cuando no hay corriente, el mensaje es no. Para representar un valor dentro de una computadora se usa el sistema de numeración binario, que utiliza sólo dos dígitos: el cero (0) y el uno (1). La computadora utiliza un conjunto de ocho (8) dígitos binarios (0 y 1) para representar un carácter, sea número o letra. Cada conjunto de 8 dígitos binarios se denomina byte y cada uno de los ocho dígitos del byte se llama bit, como contracción de su nombre en inglés Binary Digit. (formulado por Claude Elwood Shanon en 1948, que significa “dígito binario”).

El bit es la unidad de medida de información mínima por excelencia. Un bit puede brindar sólo dos clases de información: prendido – apagado, si – no, uno – cero. Digitalizar consiste en traducir toda la realidad a unos y ceros. La transición digital se produce en tanto todos los aspectos de la realidad se convierten en un conjunto de bits, de manera que puedan ser preservados, manipulados y distribuidos a través de una herramienta común: la computadora.


Una vez convertidos en bits, la información puede ser procesada y manipulada con gran rapidez por las computadoras, puede reproducirse infinitamente sin pérdidas de calidad respecto del original y puede ser transportada y distribuida a la velocidad de la luz.



En el Sistema Binario sólo se emplean dos dígitos, con dos posibles valores 0 ó 1, equivalente a encendido – apagado, si – no, etc. En la siguiente tabla se muestra la comparación entre sistema binario y decimal:

Binario Decimal Binario Decimal Binario Decimal
0 0 101 5 1010 10
1 1 110 6 1011 11
10 2 111 7 1100 12
11 3 1000 8 1101 13
100 4 1001 9 1110 14



Para medir la cantidad de información que se puede almacenar, o que está almacenado en algún dispositivo, se utilizan los siguientes múltiplos del Byte: La abreviatura b se utiliza para

bits y B para bytes.
* Nibble o cuarteto – Es el conjunto de cuatro bits (1001).
* Byte u octeto – Es el conjunto de ocho bits (10101010).
* Kilobyte (Kb) – Es el conjunto de 1024 bytes (1024 * 8 bits). 210
* Megabytes (Mb) – Es el conjunto de 1024 Kilobytes (10242* 8 bits). 220
* Gigabytes (Gb) – Es el conjunto de 1024 Megabytes (10243 * 8 bits). 230
* Terabyte (Tb) – Es el conjunto de 1024 Gigabytes (10244 * 8 bits). 240
* Petabyte (Pb) – Es el conjunto de 1024 Terabyte (10245 * 8 bits) 250
* Exabyte(Eb) – Es el conjunto de 1024 Petabyte (10246 * 8 bits) 260
* Zettabyte (Zb) - Es el conjunto de 1024 Exabyte (10247 * 8 bits) 270
* Yottabyte (Yb) - Es el conjunto de 1024 Zettabyte (10248* 8 bits) 280

Los datos constan de los siguientes elementos:
* Nombre: que permite distinguirlo de los restantes elementos.
* Tamaño: define los caracteres o números que se pueden utilizar para definir su valor.
* Tipo: describe si el elemento está constituido por caracteres alfabéticos, numéricos o símbolos especiales.

Las fuentes de obtención de datos pueden provenir de los siguientes medios:
* Internos: Son provistos dentro de la organización (por distintos sectores o del propio personal de la empresa)
* Externos: Son aquellos que provienen fuera de la organización (provisto por clientes, bancos, proveedores, etc.)

La jerarquía de los datos:


Jerarquía Representación Ejemplos
Bit Que representa 0 ó 1
Carácter Byte (Símbolos, Números o Letras) 10101010
Campo Conjunto de caracteres López
Registro Conjunto de campos López/Juan/San Martín
Archivo Conjunto de Registros

López/Juan/San Martín

Garcia/Luis/San Andrés

Tabla Conjunto de registros de igual estructura

López/Juan/San Martín

Garcia/Luis/San Andrés

Base de datos Archivos relacionados

Archivo de clientes

Archivo de proveedores

Archivo de personal




Representación interna de datos

Los caracteres (números, letras y caracteres especiales) para almacenarlos o ingresarlos al sistema electrónico y tenerlos en algún área de entrada en memoria, se codifican en binario siguiendo algún formato de transformación en byte según un esquema de codificación predefinido.

Los dos formatos más difundidos son el ASCII (American Standard Code of Information Interchange – Código estándar de EE.UU para intercambio de Información) y el EBCDIC (Extended Binary Code/Decimal Interchange Code – Código ampliado de intercambio decimal codificado en binario), que utilizan 8 bits para conformar un byte, en el que se almacena un carácter.
EBCDIC utiliza 8 bits para formar un byte. ASCII utiliza 7 bits para el mismo propósito. Por lo tanto en EBCDIC tenemos 256 combinaciones diferentes (28 ) para representar igual número de caracteres por byte, mientras que en ASCII la posibilidad se limita a 128 alternativas (27) y la versión de ASCII extendido utiliza 8 bits o sea 256 combinaciones diferentes (28 ).
Muchas veces también se utiliza el sistema de numeración hexadecimal (base 16) para exponer la información de un byte, simplificando la lectura al representar las 256 alternativas del byte (FF representa el número binario 1111 1111, es decir, la última combinación posible de las 256 binarias en 8 bits).

Cada tipo de información que se digitaliza necesita de mayor o menor cantidad de bits para ser representada. Una página de texto plano ocupa 2 Kb. Pero al trabajar con otro tipo de información (texto con formato, gráficos, sonidos, etc., las cantidades de bits aumentan significativamente.


Ejemplos:


Fotografía digital comprimida entre 100 y 500 Kb
Minuto de audio formato wav 10 Mb
Minuto de audio en formato mp3 1 Mb

Digitalizar una imagen significa convertirla en un archivo que puede ser manipulado por la computadora, es decir en un conjunto de bits. Para digitalizar una imagen es necesario dividirla en unidades discretas, cada una de las cuales se llama píxel, que es un apócope de picture elemento (del inglés, elemento o unidad, de imagen). Una vez dividida la imagen, se le asigna un valor a cada uno de los pixeles. En el caso de una imagen en blanco y negro, si la mayor parte del pixel es ngro, se le asigna el valor de 1, y si la mayor parte es blanco, se le asigna valor o. La cantidad de pixles que forman una imagen se llama resolución. Cuanto mayor es el número de píxeles utilizados para definir una imagen, mayor es el grado de realidad de la misma. La resolución de una imagen indica que cantidad de píxeles por pulgada (PPI) se utilizó para componer esa imagen.
Para digitalizar imágenes en color, se utiliza el mismo procedimiento, aunque es necesario asignarle a cada píxel un número mayor de bits para asignarle a la información sobre los colores. En la siguiente tabla se observa la cantidad de colores posibles según el número de bits utilizados para definir la profundidad del color:


1 bits 21 2 tonos
2 bits 22 4 tonos
3 bits 23 8 tonos
4 bits 24 16 tonos
8 bits 28 256 tonos
16 bits 216 65.536 tonos
24 bits 224 16,7 millones de tonos


Los archivos de imágenes digitales suelen ser de gran tamaño, lo que hace difícil su procesamiento, manipulación y transporte. Para reducir el tamaño de los archivos se utilizan procedimientos de compresión, encargados de reducir la cantidad de información (bits) necesaria, con el límite de que dicha reducción no altere la percepción de la imagen.
Ejemplo:
100 dpi compresión JPEG baja (Tamaño de archivo 248 Kb)
100 dpi compresión JPEG media (Tamaño de archivo 49 Kb)
100 dpi compresión JPEG alta (Tamaño de archivo 22 Kb)


Existen varios formatos para comprimir el tamaño de las imágenes entre los más conocidos es el JPEG (en inglés Joint Photographic Expert Group, a menudo abreviado JPG)/ JFIF (JPEG File Interchange Format).

En la digitalización de imágenes en movimiento, la sensación de la misma se logra al proyectar a gran velocidad una serie de imágenes fijas. En este procedimiento se basa en la invención del cine. El ojo humano no llega a captar el pasaje de una imagen a la otra, lo que genera la sensación de ver una imagen en movimiento. En el cine se suceden 24 imágenes por segundo. La pantalla de la televisión se renueva 25 veces por segundo. Para generar imágenes digitales en movimiento se utiliza el mismo principio. Los archivos de video digital se componen de una sucesión de entre 15 y 29 imágenes fijas por cada segundo. Existen diversos formatos de compresión de videos: rm, wmv y mov (archivos de tamaño reducidos), mpg (para videos de calidad, divx y xvid (permiten guardar 90 minutos de video en 700 Mb = capacidad de Cd).

Los sonidos son vibraciones del aire. Se puede describir gráficamente como una onda, que cambia de forma de acuerdo con la característica del sonido. Desde la invención del fonógrafo, en 1877, los sonidos se han podido conservar y reproducir por medio del sistema analógico. Una grabación analógica del sonido preserva de manera mecánica la forma de la onda del sonido para luego ser reproducida. En los viejos LP de vinilo se pueden observar los surcos por donde se desliza la púa. Dentro de ese surco, de manera casi microscópica, está dibujada la onda de sonido que es captada por la púa y luego amplificada. La posibilidad de la digitalización transformo totalmente el procedimiento. Actualmente, para preservar un sonido de manera digital, se realiza a través de los procesos de muestreo y cuantificación. Este proceso es conocido como ADC Analog Digital Conversion (conversor de analógico a digital).

El muestreo consiste en tomar una muestra del sonido de un determinado momento. Para digitalizar el sonido, es necesario realizar un muestreo muchas veces por segundo. La frecuencia, es la cantidad de veces por segundo que se toma la muestra y se mide en hertz (1 hertz = 1 vez por segundo). Para obtener un sonido de calidad, como n un Cd de música, es necesario realizar alrededor de 44.000 muestras por segundo. En términos técnicos, se dice que un Cd de música utiliza una frecuencia de 44 Khz (Kilohertz= 1.000 hertz).

La cuantificación consiste en asignar un valor numérico en bits a cada una de las muestras tomadas en el muestreo. Cuantos más bits se le asignen, más calidad tendrá el sonido obtenido. La cuantificación representa la amplitud del muestreo.

La calidad del sonido digitalizado dependerá de dos factores: la frecuencia del muestreo y la profundidad del sonido. Ejemplo: El estándar de calidad de un disco compacto (Cd) equivale a un muestreo de 44.1 KHz a 16 bits. Al decir que los archivos MP3 tienen calidad de Cd, significa que están muestreados a 44.1 KHz a 16 bits.

En el formato de sonido mp3, en algunos casos existe una pérdida de calidad perceptible y en otras casos, no. Para poder transmitir sonidos a través de Internet es necesario comprimirlo mucho a fin de que la información no se atore en la red. Un formato para la compresión de sonido es el formato mp3. En su configuración mas frecuente la reducción del tamaño de los archivos comparados con un Cd de audio es de 11 a 1. En un cd de audio, cada minuto de sonido ocupa 10 Mb, en un archivo mp3 sólo se requiere 1Mb.


Base de datos

Llamamos base o banco de datos al medio de acumular y almacenar un conjunto de datos para ser combinados y procesados posteriormente. El objetivo principal de una base de datos es almacenar y organizar datos que respondan a una misma finalidad de uso, en cambio un archivo almacena datos en forma conjunta sin clasificar u organizar y cuando se requieren los mismos deben ser recabados por medio de un método de acceso. Estos métodos pueden ser:
a) Secuencial: siguiendo el orden en que fueron archivados los datos.
b) Aleatorio: solicitando el dato requerido y accediendo directamente al mismo.

Estos datos son ordenados conforme a determinados criterios: cronológicos, geográficos, por su origen, por su tipo, por su importe, por su clase, constituyendo la base de datos. Ese orden determina la forma de ingreso de los mismos a los registros o almacenamientos de datos y permite su búsqueda posterior cuando se realiza su procesamiento.











domingo, 13 de abril de 2008

Dato e Información



INTRODUCCIÓN

En la actualidad, nos encontramos bombardeados por los términos datos e información, empleados de manera casi indistinta. Pero, en realidad, ¿Qué es dato? y ¿Qué es Información?.

Si bien ambos conceptos están, en cierta forma relacionados, debe distinguirse conceptualmente uno de otro e interpretarse:

Dato es el componente mínimo de una información mayor. Necesario para llegar al conocimiento exacto de una cosa o hecho, que describe objetos, situaciones, etc.

Información es el conjunto de datos procesados en forma significativa, ordenados y con una secuencia lógica sobre algún suceso o hecho de importancia. Con valor real para la toma de decisiones, a medida que tenemos más información, más fácil nos resulta tomar decisiones correctas. Esa es la función de la información: disminuir la incertidumbre o aumentar el conocimiento, incrementando además la probabilidad de éxito.

Conocimiento es el entendimiento obtenido a partir de la razón en base a la información disponible.

La materia que nos ocupa “Tecnología de la Información y la Comunicación” trata precisamente del cómo y con qué herramienta se procesan los datos, cómo se distribuye la información, qué formato se le da, etc.

Se llama TIC (Tecnología de la Información y la Comunicación) al conjunto de procesos y productos derivados de las nuevas herramientas (hardware y software), soportes de la información y canales de comunicación relacionados con el almacenamiento , el procesamiento y la transmisión digitalización de la información.

En la sociedad de la Información, las tecnologías de la Información y la Comunicación se constituyen en la base material sobre las que se organiza la inmensa mayoría de los procesos económicos, sociales y culturales, produciendo un fuerte impacto en todos los ámbitos de intervención humana. La revolución digital ha sido posible a partir de la convergencia de los siguientes tres pilares:
* La digitalización que permite transformar cualquier tipo de información en bits.
* La informática o ciencias de la información, que con la computadora permite manipular y procesar grandes cantidades de información.
* Las telecomunicaciones que permiten en la actualidad transmitir la información con gran rapidez y en grandes cantidades desde un extremo al otro del planeta.