Beruflich Dokumente
Kultur Dokumente
Conceptos
Archivos – Ficheros – es una colección de información (datos relacionados entre sí,
localizada o almacenada como una unidad.
Tipos de Archivos
→ Según su función
-Permanentes
Sus registros sufren pocas o ninguna variación a lo largo del tiempo se dividen en:
-De Movimiento
Al finalizar un archivo secuencial se denota con una marca de fin de archivo. (End end-of-
file)
La mayor parte de los lenguajes por procedimiento de alto nivel cuenta con características que
ayudan a detectar la marca de fin de archivo.
Al estar usando un archivo secuencial como archivo maestro, el realizar las operaciones
de actualizaicón se llevará con el auxilio de un archivo de transacciones, debido a que se
realizará el proceso en lote para que sea más eficiente.
El archivo de transacciones contiene básicamente el mismo tipo de registro que el archivo
maestro, la cantidad de registros en el archivo de transacciones dependerá obviamente
de los registros a actualizar, la única diferencia es un campo que se usará como código
para indicar el tipo de actualización que se realizará con el registro.
Así mismo se puede generar un archivo de reporte donde nos proporcione la estadística
necesaria o requerida del proceso de actualización.
El archivo más importante que se genera en este proceso es el archivo maestro nuevo
que el siguiente ciclo tomará el lugar del archivo maestro viejo.
La creación del archivo desde el punto de vista de la técnica de programación viene a ser
una estructura interactiva.
1- Uso más común: procesamiento por lotes (respado de datos, generación de reportes,
transmisión física de datos,...)
2- Ventas
-Proveen la mejor utilización de espacio.
-Son rápidos cuando se acceden secuencialmente.
-Archivos de poca volatilidad.
3- Desventajas:
-El acceso a un registro es pobr
-La localización de un determinado registro no se puede hacer individualmente, ni
rápidamente, el acceso aleatorio es impráctico.
Los registros se organizan en una secuencia basada en un campo clave presentando dos
características, un índice del archivo para soportar los accesos aleatorios y un archivo de
desbordamiento. El índice proporciona una capacidad de búsqueda para llegar
rápidamente al registro deseado y el archivo de desbordamiento es similar al archivo de
registros usado en un archivo secuencial, pero está integrado de forma que los archivos
de desbordamiento se ubiquen siguiendo un puntero desde su registro predecesor.
La estructura más simple tiene como índice un archivo secuencial simple, cada registro
del archivo índice tiene dos campos, un campo clave igual al del archivo principal y un
puntero al archivo principal. Para encontrar un campo especifico se busca en el índice
hasta encontrar el valor mayor de la clave que es iguale o precede al valor deseado de la
clave, la búsqueda continua en el archivo principal a partir de la posición que indique el
puntero.
Cada registro del archivo principal tiene un campo adicional que es un puntero al archivo
de desbordamiento. Cuando se inserta un nuevo registro al archivo, también se añade al
archivo de desbordamiento. El registro del archivo principal que precede inmediatamente
al nuevo registro según la secuencia lógica se actualiza con un puntero del registro nuevo
en el archivo de desbordamiento, si el registro inmediatamente anterior está también en el
archivo de desbordamiento se actualizará el puntero en el registro.
Para procesar secuencialmente un archivo completo los registros del archivo principal se
procesarán en secuencia hasta encontrar un puntero al archivo de desbordamiento, el
acceso continúa en el archivo de desbordamiento hasta que encuentra un puntero nulo,
entonces renueva el acceso donde se abandonó en el archivo principal.
a) El diseño del registro tiene que tener un campo, o combinación de campos, que permita
identificar cada registro de forma única, es decir, que no pueda haber dos registros que
tengan la misma información en él. A este campo se le llama campo clave y es el que va
a servir de índice. Un mismo fichero puede tener mas de un campo clave, pero al menos
uno de ellos no admitirá valores duplicados y se le llama clave primaria. A las restantes se
les llama claves alternativas.
b) Permiten utilizar el modo de acceso secuencial y el modo de acceso directo para leer la
información guardada en sus registros.
El modo de acceso directo se hace conociendo el contenido del campo clave del registro
que queremos localizar. Con esa información el sistema operativo puede consultar el
índice y conocer la posición del registro dentro del fichero.
En el modo de acceso secuencial los registros son leídos ordenados por el contenido del
campo clave, independientemente del orden en que se fueron grabando (El orden lógico
no es igual al orden físico), debido a que el acceso a los datos se hace a través del índice,
que para hacer más fácil la búsqueda de los registros permanece siempre ordenado por el
campo clave.
VENTAJAS
DEVENTAJAS
1. Ocupa más espacio en el disco que los ficheros secuénciales, debido al uso del área de
índices.
2. Tiene tendencia a que aumente el tiempo medio de acceso a los registros, cuando se
producen muchas altas nuevas con claves que hay que intercalar entre las existentes, ya
que aumenta el área de overflow.
Este tipo de organización se utiliza cuando existe la necesidad tanto de acceder a los
registros secuencialmente, por algún valor de llave, como de acceder los individualmente.
Un archivo secuencial indexado puede tener acceso porque manejan un archivo
secuencial y un archivo relativo o de acceso directo.
Los registros están situados en un soporte direccionable por el orden de los valores
indicados por la clave.
• El valor del campo clave del último registro de un bloque. Los bloques están constituidos
por un número fijo de registros consecutivos.
Área de índice: Los niveles de índice están contenidos en una tabla, si existieran varios
índices enlazados se denomina nivel de indexación.
Es creada por el sistema al mismo tiempo que se van almacenando los datos. Contiene
una tabla que asocia las claves con las direcciones de los registros en el área de datos.
Cada entrada del área de índices está formada por el valor más alto de la clave de cada
grupo de registros y un puntero con la dirección del primer registro del grupo.
Estos registros se presentan como una lista encadenada, en que el puntero al próximo
registro está compuesto por la pista y el lugar que ocupa el registro dentro de la pista.
Esta lista se mantiene ordenada por clave.
Del tratamiento de los índices y punteros se encarga el sistema operativo.
Archivo Directo
El archivo directo intenta explorar la capacidad, proporcionada por las unidades de disco y
dispositivos similares, de lograr acceso a cualquier bloque de dirección conocida. Para
lograr el direccionamiento directo se utiliza la llave del registro para localizarlo en el
archivo.
FUNCIONES HASHING.
[Otra información]
Cada registro en un archivo de organización directa hace referencia por un número entero
de dirección, el cual indica su distancia o desplazamiento desde el origen del archivo. Al
primer registro en un archivo relativo se le asigna el valor 1, 2 al siguiente y así
sucesivamente. De este modo, la dirección relativa de un valor entero que refleja su
posición respecto al primer registro del archivo. El acceso aleatorio de un registro en un
archivo de organización relativa se hace vía su número relativo de registro.
Pues esta forma nos permite acceder de forma directa dando más funciones,
probablemente rapidez en la búsqueda de datos.
Los archivos relativos son archivos que pueden ser accesados directamente por medio de
llaves que a través de un método son convertidas en direcciones en las que se almacenan
los registros.
El uso de esta función genera lo que se llama colisiones. Las colisiones son las
repeticiones de direcciones que se obtienen de la función HASH. Conforme más saturado
se ve un archivo más frecuentes serán las colisiones que se presenten. El factor de carga
nos dice que tan lleno esta un archivo y que tan bueno es el desempeño del archivo, el
factor de carga se obtiene dividiendo él número de registros en el archivo sobre él número
máximo de registros que puede almacenar el archivo.
Las colisiones no se pueden eliminar pero si se pueden disminuir los efectos negativos
que producen, para esto están los métodos de solución de colisiones, entre los más
conocidos están el encadenamiento de sinónimos, el direccionamiento por cubetas etc.
ISAM
VSAM
Cuando se determina el archivo que será cargado en memoria, este se consulta para
obtener un intervalo más específico y se carga el siguiente archivo en las mismas
localidades de memoria, es decir, se sobre escribe en el índice previo en la memoria. Este
proceso se repite hasta alcanzar el último nivel el cual contendrá la dirección lógica del
dato buscado en el archivo principal. La principal cualidad de VSAM es su
transportabilidad, el inconveniente es la cantidad de accesos a disco que se requieren
para obtener el dato deseado. Según la cantidad de memoria disponible se diseñara la
cantidad de memoria de los bloques. A mayor cantidad de memoria, mayor tamaño de
bloques y en consecuencia menor cantidad de niveles y por lo tanto menos accesos a
disco.
Bibliografía
http://es.slideshare.net/luismy_martinez?
utm_campaign=profiletracking&utm_medium=sssite&utm_source=ssslideview
http://romerovivivi.blogspot.com.es/
https://admisnitraciondearchivogabrielagomezperez.wordpress.com/2011/11/23/unidad-v-
archivos-directos/