Top 6 des modèles d'organisation de fichier (avec diagramme)

Cet article met en lumière les six principaux modèles d'organisation de fichiers. Les modèles sont les suivants: 1. Organisation du fichier à accès direct 2. Organisation du fichier à accès séquentiel 3. Organisation du fichier d'accès indexé (inversé) 4. Organisation du fichier à accès séquentiel indexé 5. Organisation du fichier à accès direct 6. Organisation du fichier à accès multiple.

Modèle d'organisation de fichier n ° 1. Organisation du fichier Pile Access:

Le fichier Pile contient un ensemble d'enregistrements sans ordre particulier.

Les enregistrements sont stockés dès leur arrivée.

Ils ne suivent aucune séquence particulière de valeurs d'attribut.

Cette méthode de stockage des enregistrements est adoptée lorsqu'il n'est pas possible d'organiser les enregistrements dans un ordre logique, lorsque les champs de l'enregistrement ne sont pas bien définis et que l'utilisation exacte du fichier ne peut pas être anticipée.

Les fichiers sont généralement créés dans ce mode en perforant les documents dans leur ordre d'arrivée. Le tas ainsi créé peut ensuite être organisé en un autre fabriqué.

L'emplacement d'un enregistrement dans un fichier de pile peut être effectué en recherchant séquentiellement les enregistrements jusqu'à atteindre la valeur souhaitée de l'attribut clé. L'ajout de nouveaux enregistrements dans un fichier de pile est très simple. Les nouveaux enregistrements sont ajoutés à la fin du fichier.

Les modifications et les suppressions d’enregistrements dans un fichier de pile stocké sur un support à accès aléatoire peuvent être effectuées en localisant l’enregistrement et en modifiant son contenu ou en signalant l’enregistrement pour indiquer que l’enregistrement a été invalidé. Le fichier peut être réorganisé périodiquement pour supprimer les trous créés par la suppression des enregistrements. Cependant, la mise à jour du fichier de pile sur un support à accès séquentiel ne peut être effectuée qu'en créant un nouveau fichier.

Modèle d'organisation de fichier n ° 2. Organisation du fichier à accès séquentiel:

Dans l'organisation séquentielle, les occurrences d'enregistrement sont référencées dans l'ordre dans lequel elles sont stockées physiquement. Les données stockées sur des cartes et des bandes sont nécessairement stockées de manière séquentielle. Les périphériques à accès direct tels que les disques peuvent être, mais ne sont pas nécessairement référencés de manière séquentielle.

Parfois, le traitement est mieux effectué via un accès séquentiel, même lorsque des périphériques à accès direct sont utilisés. C'est le cas lorsque de nombreux enregistrements d'un fichier doivent être accessibles pour satisfaire une demande de données.

Dans un fichier séquentiel, les enregistrements sont conservés dans la séquence logique de leurs valeurs de clé primaire. Le traitement d'un fichier séquentiel est conceptuellement simple mais inefficace pour un accès aléatoire. Toutefois, si l'accès au fichier est strictement séquentiel, un fichier séquentiel convient. Un fichier séquentiel peut être stocké sur un périphérique de stockage séquentiel tel qu'une bande magnétique.

Dans une mise à jour de fichier séquentielle, les enregistrements de transaction suivent la même séquence que dans le fichier principal. Les enregistrements des deux fichiers sont appariés sur la base d'un enregistrement à la fois, ce qui donne un fichier principal mis à jour, comme indiqué dans la fig. 16.1.

Avantages / mérites:

1. Les erreurs dans les fichiers restent localisées.

2. Le chargement d'un enregistrement nécessite uniquement la clé d'enregistrement.

3. Simple à comprendre l'approche.

4. Facile à organiser, maintenir et comprendre.

5. Vous pouvez utiliser un support d’entrée / sortie (E / S) relativement peu coûteux.

6. Les fichiers peuvent être relativement faciles à reconstituer puisqu’une bonne mesure de la sauvegarde intégrée est généralement disponible.

7. Efficace et économique si le taux d'activité, c'est-à-dire la proportion d'enregistrements de fichiers à traiter, est élevé.

Démérites / Inconvénients:

1. Les transactions doivent être triées et placées en séquence avant le traitement.

2. La redondance des «données» est généralement élevée, car les mêmes données peuvent être stockées dans plusieurs fichiers séquencés dans des clés différentes.

3. Les demandes aléatoires sont pratiquement impossibles à gérer.

4. L'actualité des données dans le fichier se détériore pendant que les lots sont accumulés.

5. Le fichier entier doit être traité même lorsque le taux d'activité est très faible.

6. Cette méthode convient aux petits enregistrements. Si le disque est très volumineux, le classement du fichier prend beaucoup de temps.

Modèle d'organisation de fichier n ° 3. Organisation du fichier d'accès indexé (inversé):

Dans l'organisation de fichier inversée, un index est maintenu pour chaque attribut de clé de l'enregistrement. Le fichier d'index contient la valeur de l'attribut clé suivi des adresses de tous les enregistrements du fichier principal avec la même valeur que l'attribut clé.

Dans l'exemple d'informations sur le personnel de plusieurs enseignants, supposons que le fichier principal contienne les enregistrements de six enseignants, comme suit:

Le fichier d’index de l’attribut de clé, qualification scolaire, contiendrait:

Diplômé 1, 4, 6

Post-gradué 2, 3 Ph.D. 5

Et cela pour l'attribut clé sujet enseigné contiendrait:

Économie 6

Hindi 1

Histoire 2, 5

Physique 2, 4

Le fichier principal n'a pas besoin de contenir les valeurs des attributs pour lesquels des index ont été gérés, car le fichier d'index en contient déjà. Le fichier principal peut également ne pas être dans une séquence particulière. Ce peut être juste un fichier de pile.

L'organisation des fichiers inversés nécessite la gestion de trois types de fichiers, le fichier principal, les fichiers de répertoire et les fichiers d'index. Le fichier de répertoire contient la valeur des attributs de clé et le pointeur sur le premier enregistrement du fichier d'index contenant les adresses de tous les enregistrements du fichier principal avec cette valeur de l'attribut de clé. Il existe un fichier de répertoire pour chaque attribut de clé.

Le fichier inversé est très utile lorsque la liste des enregistrements avec les valeurs d'attribut de clé spécifiées est requise. Par exemple, nous voulons avoir une liste de tous les enseignants en poste dans le district de Lucknow ou de tous ceux qui enseignent la physique. L'ajout d'enregistrements dans le fichier principal peut être effectué à la fin du fichier car celui-ci n'est conservé dans aucun ordre.

Toutefois, des entrées correspondantes doivent être effectuées dans tous les fichiers d'index pour les attributs de clé de l'enregistrement. Les modifications apportées aux attributs clés de l’enregistrement et les suppressions devront également être accompagnées des modifications correspondantes apportées aux fichiers d’index. La maintenance des fichiers d'index peut donc prendre beaucoup de temps.

File Organization Model # 4. Organisation du fichier à accès séquentiel indexé:

La récupération d'un enregistrement à partir d'un fichier séquentiel nécessite en moyenne un accès à la moitié des enregistrements du fichier, ce qui rend non seulement cette interrogation inefficace, mais elle prend également beaucoup de temps pour les gros fichiers. Pour améliorer le temps de réponse à la requête d'un fichier séquentiel, un type de technique d'indexation peut être ajouté.

Un index est un ensemble de paires. L'indexation associe un ensemble de quantités pouvant être commandées, généralement plus petites ou dont les propriétés sont un mécanisme permettant une recherche plus rapide. L’indexation a pour but d’accélérer le processus de recherche. Les index créés à partir d'un ensemble séquentiel (ou trié) de clés primaires sont appelés séquentiels d'index.

Bien que les index et les blocs de données soient maintenus ensemble physiquement, nous les distinguons logiquement. Nous utiliserons le terme fichier index pour décrire les index et le fichier de données pour faire référence aux enregistrements de données. L'index est généralement assez petit pour être lu dans la mémoire du processeur.

Un fichier séquentiel (pour les clés triées sur des clés primaires) indexé est appelé taille séquentielle d'index. L'index fournit un accès aléatoire aux enregistrements, tandis que la nature séquentielle du fichier permet un accès facile aux enregistrements suivants, ainsi qu'un traitement séquentiel. Une fonctionnalité supplémentaire de ce système de fichiers est la zone de débordement. Cette fonctionnalité fournit un espace supplémentaire pour l'ajout d'enregistrements sans nécessiter la création d'un nouveau fichier.

Avantages / avantages:

1. Permet un accès rapide aux enregistrements de manière relativement efficace lorsque cette activité représente une petite fraction de la charge de travail.

2. Permet l'utilisation efficace et économique des techniques de traitement séquentiel lorsque le taux d'activité est élevé.

Démérites / inconvénients:

1. Moins efficace dans l'utilisation de l'espace de stockage que certaines autres alternatives.

2. Des ressources matérielles et logicielles relativement coûteuses sont nécessaires.

3. La récupération lente comparée à l'accès aléatoire car la recherche de l'index nécessite du temps.

Modèle d'organisation de fichier n ° 5. Organisation du fichier à accès direct:

L'accès séquentiel aux index convient aux données sur les actions de l'acheteur car son fichier doit être accessible à la fois séquentiellement et directement, et la mise à jour est effectuée périodiquement jusqu'à la minute où aucune information n'est requise. Par contre, de nombreuses applications nécessitent à la fois une récupération à temps et une mise à jour en ligne pour conserver les informations les plus récentes possibles.

Les courtiers en valeurs mobilières, par exemple, ont besoin d’une mise à jour et d’une récupération rapides des données sur le cours des actions. Les compagnies aériennes exigent une mise à jour et une récupération rapides des données passagers, et les guichets automatiques nécessitent un accès rapide aux enregistrements bancaires.

L'accès direct aux grands fichiers de méthode d'accès séquentiel indexé (ISAM) est ralenti par le fait que les index et éventuellement les zones de débordement doivent être recherchés avant que l'enregistrement souhaité puisse être transféré vers la mémoire principale. Même pire mise à jour de (ISAM), les fichiers sont ralentis par la nécessité de mettre à jour les index et les pointeurs et de transférer les enregistrements des zones principales aux zones de débordement.

La méthode d’accès direct a été conçue pour répondre à la nécessité de mettre à jour et de récupérer les données rapidement. Dans cette approche, un algorithme est utilisé pour calculer l'adresse d'un enregistrement. La valeur de clé primaire est l'entrée dans l'algorithme et l'adresse de bloc de l'enregistrement est la sortie.

Pour mettre en œuvre l'approche, une partie de l'espace de stockage est réservée au fichier. Cet espace doit être suffisamment grand pour contenir le fichier, plus une marge de croissance. Ensuite, un algorithme qui génère l'adresse appropriée pour une clé primaire donnée est conçu.

L'algorithme est communément appelé algorithme de hachage et la méthode d'accès direct est appelée accès haché. Le processus de conversion des valeurs de clé primaire en adresses est appelé transformation clé en adresse.

Plusieurs enregistrements logiques entrent généralement dans un bloc, nous pouvons donc penser que la zone de stockage réservée est divisée en emplacements de mémoire numérotés séquentiellement de 1 à n. Ces numéros séquentiels sont appelés numéros d'enregistrement relatifs, pointeurs relatifs ou adresses relatives, car ils indiquent la position de l'enregistrement par rapport au début du fichier.

Avantages / avantages:

1. Les transactions ne doivent pas être triées.

2. Différents disques ou unités de disque ne sont pas nécessaires pour la mise à jour des enregistrements, les enregistrements existants pouvant être modifiés par écrasement.

3. Il est également possible de traiter les enregistrements directs de fichiers de manière séquentielle dans une séquence de touches d'enregistrement.

4. Une organisation de fichier direct convient mieux aux applications en ligne interactives telles que les systèmes de réservation de lignes aériennes ou de chemins de fer, les guichets de banque dans les applications bancaires, etc.

5. L'accès immédiat aux enregistrements à des fins de mise à jour est possible.

6. Les demandes aléatoires, trop fréquentes dans des situations professionnelles, peuvent être facilement traitées.

Démérites / inconvénients:

1. Peut être moins efficace dans l'utilisation de l'espace de stockage que le fichier organisé séquentiellement.

2. Des ressources matérielles et logicielles coûteuses sont nécessaires.

3. Complexité relative de la programmation.

4. La conception du système est complexe et coûteuse.

5. Les données peuvent être effacées accidentellement ou même écrites à moins que des précautions spéciales ne soient prises.

6. Des mesures de sécurité spéciales sont nécessaires pour les fichiers directs en ligne accessibles depuis plusieurs stations.

7. La mise à jour de fichiers (enregistrements d'addition et de suppression) est plus difficile que les fichiers séquentiels.

8. Les enregistrements en ligne peuvent indiquer les risques de perte d’exactitude et d’atteinte à la sécurité. Des procédures spéciales de sauvegarde et de reconstruction doivent être mises en place.

Modèle d'organisation de fichier n ° 6. Organisation du fichier d'accès à anneaux multiples:

Les fichiers à anneaux multiples sont très utiles lorsque la liste des enregistrements avec des valeurs d'attribut de clé spécifiques est fréquemment souhaitée. Par exemple, nous aimerions peut-être avoir la liste des enseignants de physique ou la liste des enseignants en poste dans le district de Lucknow ou la liste des enseignants qui prennent leur retraite une année donnée. Dans cette organisation de fichiers, tous les enregistrements avec une valeur d'attribut de clé spécifiée sont modifiés ensemble.

Le fichier répertoire, comme celui de l'organisation du fichier inversé, contient le pointeur sur le premier enregistrement avec la valeur d'attribut clé spécifiée - le premier enregistrement contient l'adresse du deuxième enregistrement de la chaîne et le second contient l'adresse du troisième enregistrement lorsque Le dernier enregistrement de la chaîne contient un pointeur sur le premier enregistrement. On dit que les enregistrements forment un anneau.

Un certain nombre de ces anneaux peuvent être formés pour différentes valeurs d'attribut de clé et pour différents attributs. Le répertoire fournit un point d’entrée aux anneaux.