Article de reference

stockage de données informatiques

1 Gio de SDRAM monté dans un ordinateur . Un exemple de mémoire vive . Disque dur PATA de 15 Go (HDD) datant de 1999. Lorsqu'il est connecté à un ordinateur, il sert de stockage...

1 Gio de SDRAM monté dans un ordinateur . Un exemple de mémoire vive .
Disque dur PATA de 15 Go (HDD) datant de 1999. Lorsqu'il est connecté à un ordinateur, il sert de stockage secondaire .
des données numériques au moyen d' une technologie composée de composants informatiques et de supports d'enregistrement . Le stockage de données numériques est une fonction essentielle et un élément fondamental des ordinateurs.

Généralement, les composants de stockage rapides et éphémères sont appelés « mémoire », tandis que les composants persistants plus lents sont appelés « stockage ». Cette distinction a été étendue dans l' architecture de Von Neumann , où l' unité centrale de traitement (CPU) se compose de deux parties principales : l' unité de contrôle et l' unité arithmétique et logique (UAL). La première gère le flux de données entre la CPU et la mémoire, tandis que la seconde effectue les opérations arithmétiques et logiques sur les données. En pratique, presque tous les ordinateurs utilisent une hiérarchie mémoire : qui place la mémoire à proximité de la CPU et le stockage plus loin.

Dans les ordinateurs modernes, on utilise généralement des disques durs (HDD) ou des disques SSD comme support de stockage.

Un ordinateur numérique moderne représente les données à l'aide du système binaire . La cellule mémoire est l'élément de base de la mémoire informatique ; elle stocke un bit d'information binaire qui peut être initialisé à 1, réinitialisé à 0, et accessible par lecture de la cellule.

Le texte, les nombres, les images, l'audio et presque toute autre forme d'information peuvent être convertis en une chaîne de bits , ou chiffres binaires, chacun ayant la valeur 0 ou 1. L'unité de stockage la plus courante est l' octet , qui équivaut à 8 bits. Les données numériques constituent la représentation binaire d'une information, souvent encodée en attribuant une séquence de bits à chaque caractère , chiffre ou objet multimédia . Il existe de nombreuses normes d'encodage (par exemple, les encodages de caractères comme ASCII , les encodages d'images comme JPEG et les encodages vidéo comme MPEG-4 ).

Cryptage

Pour des raisons de sécurité , certains types de données peuvent être chiffrés lors du stockage afin d'empêcher toute possibilité de reconstitution non autorisée d'informations à partir de fragments d'instantanés de stockage. Le chiffrement en transit protège les données pendant leur transmission.

Compression

Les méthodes de compression de données permettent, dans de nombreux cas (comme pour une base de données), de représenter une chaîne de bits par une chaîne plus courte (« compression ») et de reconstruire la chaîne originale (« décompression ») en cas de besoin. Cela permet de réduire considérablement l'espace de stockage (de l'ordre de quelques dizaines de pour cent) pour de nombreux types de données, au prix d'une charge de calcul plus importante (compression et décompression selon les besoins). Une analyse du compromis entre les économies réalisées sur le stockage et les coûts des calculs associés, ainsi que les éventuels délais d'accès aux données, est effectuée avant de décider de conserver ou non certaines données compressées.

Vulnérabilité et fiabilité

Les différents types de stockage de données présentent des points de défaillance distincts et nécessitent diverses méthodes d' analyse prédictive des pannes . Parmi les vulnérabilités pouvant entraîner une perte totale et instantanée, on peut citer la collision des têtes de lecture /écriture sur les disques durs mécaniques et la défaillance des composants électroniques sur les supports de stockage flash.

Redondance

La redondance permet à l'ordinateur de détecter les erreurs dans les données codées (par exemple, une inversion aléatoire de bit due à des radiations aléatoires ) et de les corriger à l'aide d'algorithmes mathématiques. La méthode de contrôle de redondance cyclique (CRC) est couramment utilisée dans les communications et le stockage pour la détection d'erreurs . Les solutions de redondance comprennent la réplication du stockage , la mise en miroir des disques et le RAID ( Redundant Array of Independent Disks ).

Détection d'erreurs

Mesure du taux d'erreur sur un DVD+R . Les erreurs mineures sont corrigibles et restent dans une plage acceptable.

L'estimation de la défaillance imminente des disques durs s'effectue à l'aide des données de diagnostic SMART , qui incluent les heures de fonctionnement et le nombre de mises en rotation, bien que leur fiabilité soit contestée. L'état des supports optiques peut être déterminé en mesurant les erreurs mineures corrigibles ; un nombre élevé d'erreurs mineures indique une détérioration et/ou une faible qualité du support. Un trop grand nombre d'erreurs mineures consécutives peut entraîner une corruption des données. Tous les fabricants et modèles de lecteurs optiques ne prennent pas en charge l'analyse des erreurs.

Architecture

Sans une quantité importante de mémoire, un ordinateur ne pourrait effectuer que des opérations fixes et afficher immédiatement le résultat, ce qui nécessiterait une reconfiguration matérielle pour l'exécution d'un nouveau programme. Ce principe est souvent utilisé dans des appareils tels que les calculatrices de bureau , les processeurs de signaux numériques et d'autres dispositifs spécialisés. Les machines de von Neumann se distinguent par leur mémoire où sont stockées les instructions d'exploitation et les données ce qui leur permet de ne pas avoir besoin d'être reconfigurées matériellement pour chaque nouveau programme ; elles peuvent simplement être reprogrammées avec de nouvelles instructions en mémoire. Leur conception est également généralement plus simple , car un processeur relativement simple peut conserver un état entre les calculs successifs pour produire des résultats procéduraux complexes. La plupart des ordinateurs modernes sont des machines de von Neumann.

Stockage et mémoire

Dans l'usage courant, le terme « stockage » désigne généralement un sous-ensemble du stockage de données informatiques comprenant les périphériques de stockage et leurs supports non directement accessibles par le processeur , c'est-à -dire le stockage secondaire ou tertiaire . Les disques durs , les lecteurs de disques optiques et les dispositifs non volatils (c'est-à-dire les dispositifs qui conservent leur contenu même lorsque l'ordinateur est éteint) en sont des exemples courants. En revanche, le terme « mémoire » est utilisé pour désigner le stockage de données en lecture-écriture sur semi-conducteurs , généralement la mémoire vive dynamique (DRAM). La mémoire vive dynamique est une forme de mémoire volatile qui nécessite une relecture et une réécriture périodiques des informations stockées, ou un rafraîchissement ; la mémoire vive statique (SRAM) est similaire à la DRAM, mais elle n'a jamais besoin d'être rafraîchie tant qu'elle est alimentée.

Dans l’usage contemporain, la hiérarchie de mémoire du stockage primaire et du stockage secondaire fait parfois référence à ce qui était historiquement appelé respectivement stockage secondaire et stockage tertiaire .

Primaire

Les différents types de stockage sont classés selon leur éloignement de l' unité centrale de traitement . Les composants fondamentaux d'un ordinateur à usage général sont l'unité arithmétique et logique , les circuits de commande , l'espace de stockage et les périphériques d'entrée/sortie . Leur technologie et leurs capacités sont similaires à celles des ordinateurs personnels courants vers 2005.

La mémoire principale (également appelée mémoire interne ou mémoire de stockage primaire ), souvent désignée simplement par le terme « mémoire » , est un espace de stockage directement accessible au processeur. Ce dernier lit en continu les instructions qui y sont stockées et les exécute selon les besoins. Toutes les données traitées y sont également stockées de manière uniforme. Historiquement, les premiers ordinateurs utilisaient des lignes à retard , des tubes Williams ou des tambours magnétiques rotatifs comme mémoire principale. Dès 1954, ces méthodes peu fiables ont été majoritairement remplacées par la mémoire à tores magnétiques . Cette dernière est restée dominante jusqu'aux années 1970, date à laquelle les progrès de la technologie des circuits intégrés ont permis à la mémoire à semi-conducteurs de devenir économiquement compétitive.

Ceci a conduit à la mémoire vive moderne , compacte, légère et relativement coûteuse. La RAM utilisée comme mémoire principale est volatile : elle perd ses données lorsqu'elle est hors tension pendant un certain temps . Outre le stockage des programmes ouverts, elle sert de cache disque et de tampon d'écriture pour améliorer les performances de lecture et d'écriture. Les systèmes d'exploitation utilisent la RAM pour la mise en cache tant qu'elle n'est pas requise par les logiciels en cours d'exécution. La mémoire disponible peut être utilisée comme disque RAM pour le stockage temporaire de données à haute vitesse. Outre la RAM principale de grande capacité, il existe deux autres sous-couches de stockage principal :

  • Les registres du processeur constituent la forme de stockage de données la plus rapide. Situés à l'intérieur du processeur, chaque registre contient généralement un mot de données (souvent 32 ou 64 bits). Les instructions du processeur indiquent à l' unité arithmétique et logique d'effectuer divers calculs ou autres opérations sur ces données.
  • Le cache du processeur constitue une étape intermédiaire entre les registres plus rapides et la mémoire principale plus lente ; il est plus rapide que cette dernière, mais sa capacité est bien moindre. Une architecture de cache hiérarchique à plusieurs niveaux est également courante : le cache primaire est le plus petit et le plus rapide, tandis que le cache secondaire est plus grand et plus lent.

La mémoire principale, incluant la ROM , l'EEPROM , la mémoire flash NOR et la RAM , est généralement adressable par octet . Cette mémoire est connectée directement ou indirectement à l'unité centrale de traitement (CPU) via un bus mémoire , composé d'un bus d'adresses et d'un bus de données . Le CPU envoie d'abord, via le bus d'adresses, un nombre appelé adresse mémoire , indiquant l'emplacement des données à lire ou à écrire. Il lit ou écrit ensuite les données dans les cellules mémoire à l'aide du bus de données. De plus, une unité de gestion de la mémoire (MMU) est un petit dispositif situé entre le CPU et la RAM, qui recalcule l'adresse mémoire. Les unités de gestion de la mémoire permettent la gestion de la mémoire ; elles peuvent, par exemple, fournir une abstraction de la mémoire virtuelle ou effectuer d'autres tâches.

BIOS

La mémoire vive ( RAM ) , contenant un petit programme de démarrage, est utilisée pour initialiser l'ordinateur, c'est-à-dire pour charger un programme plus volumineux depuis la mémoire secondaire non volatile et le lancer. La mémoire morte (ROM) est une technologie non volatile utilisée à cet effet. La plupart des ROM ne sont pas littéralement en lecture seule, mais l'écriture y est complexe et lente . Certains systèmes embarqués exécutent les programmes directement depuis la ROM, car ces programmes sont rarement modifiés. Les ordinateurs classiques, hormis le micrologiciel , ne stockent généralement que très peu de programmes en ROM et utilisent d'importantes capacités de mémoire secondaire.

Secondaire

Le stockage secondaire (également appelé mémoire externe ou mémoire auxiliaire ) diffère du stockage principal en ce qu'il n'est pas directement accessible par le processeur. Les ordinateurs utilisent des canaux d'entrée/sortie pour accéder au stockage secondaire et transférer les données souhaitées vers le stockage principal. Le stockage secondaire est non volatil : il conserve les données même hors tension. Les systèmes informatiques modernes disposent généralement d'une capacité de stockage secondaire cent fois supérieure à celle du stockage principal, car le stockage secondaire est moins coûteux.

Dans les ordinateurs modernes, les disques durs (HDD) ou les disques SSD sont généralement utilisés comme stockage secondaire. Le temps d'accès par octet pour les HDD ou les SSD se mesure généralement en millisecondes , tandis que celui du stockage principal se mesure en nanosecondes . Les supports de stockage optiques rotatifs , tels que les lecteurs de CD et de DVD , ont des temps d'accès encore plus longs. Parmi les autres technologies de stockage secondaire, on peut citer les clés USB , les disquettes , les bandes magnétiques , les bandes perforées , les cartes perforées et les disques RAM .

Pour réduire le temps de recherche et la latence rotationnelle, les données stockées sur le stockage secondaire ( disques durs , lecteurs optiques et SSD ) sont transférées par blocs contigus. Le stockage secondaire est adressable par bloc ; une fois que la tête de lecture/écriture des disques durs a atteint la position adéquate et que les données sont écrites, l’accès aux données suivantes sur la même piste est très rapide. Une autre méthode pour réduire le goulot d’étranglement des E/S consiste à utiliser plusieurs disques en parallèle afin d’augmenter la bande passante entre la mémoire principale et la mémoire secondaire, par exemple en utilisant le RAID .

Le stockage secondaire est souvent formaté selon un système de fichiers , qui fournit l'abstraction nécessaire à l'organisation des données en fichiers et répertoires , ainsi que des métadonnées décrivant le propriétaire d'un fichier, la date et l'heure d'accès, les permissions d'accès et d'autres informations. La plupart des systèmes d'exploitation utilisent le concept de mémoire virtuelle , permettant d'exploiter une capacité de stockage primaire supérieure à celle physiquement disponible. Lorsque la mémoire primaire est saturée, le système déplace les blocs les moins utilisés ( pages ) vers un fichier d'échange (ou fichier de pagination) sur le stockage secondaire, pour les récupérer ultérieurement en cas de besoin.

Tertiaire

Une grande bibliothèque de bandes magnétiques , avec des cartouches disposées sur des étagères à l'avant et un bras robotisé en mouvement à l'arrière. La hauteur visible de la bibliothèque est d'environ 180 cm.

Le stockage tertiaire , ou mémoire tertiaire, repose généralement sur un bras robotisé qui monte et démonte des supports de stockage de masse amovibles, les transférant d'une base de données de catalogue vers un périphérique de stockage en fonction des besoins du système. Il est principalement utilisé pour l'archivage d'informations rarement consultées, car il est beaucoup plus lent que le stockage secondaire (par exemple, 5 à 60 secondes contre 1 à 10 millisecondes). Il est particulièrement utile pour les très grands volumes de données, accessibles sans intervention humaine. On peut citer comme exemples typiques les bibliothèques de bandes , les juke-boxes optiques et les systèmes MAID (Massive Arrays of Indle Disks ). Le stockage tertiaire est également appelé stockage nearline , car il est « quasi-en-ligne » . La gestion hiérarchique du stockage est une stratégie d'archivage qui consiste à migrer automatiquement les fichiers inutilisés depuis longtemps des disques durs rapides vers des bibliothèques ou des juke-boxes.

Hors ligne

Le stockage hors ligne désigne le stockage de données informatiques sur un support ou un périphérique qui n'est pas contrôlé par une unité de traitement . Le support est enregistré, généralement sur un périphérique de stockage secondaire ou tertiaire, puis retiré ou déconnecté physiquement. Contrairement au stockage tertiaire, il nécessite une intervention humaine pour y accéder. Il est utilisé pour le transfert d'informations, car le support détaché est facilement transportable. Dans les ordinateurs personnels modernes, la plupart des supports de stockage secondaire et tertiaire sont également utilisés pour le stockage hors ligne.

connectivité réseau

Un système de stockage secondaire ou tertiaire peut se connecter à un ordinateur via un réseau informatique . Ce concept ne s'applique pas au système de stockage principal.

Nuage

Le stockage en nuage repose sur une infrastructure hautement virtualisée . Sous-ensemble du cloud computing , il offre des interfaces natives spécifiques, une élasticité et une scalabilité quasi instantanées , la mutualisation des ressources et une facturation à l'usage. Les services de stockage en nuage peuvent être utilisés depuis un serveur distant ou déployés sur site.

Modèles de déploiement

Les modèles de déploiement cloud définissent les interactions entre les fournisseurs de cloud et les clients.

Types

Il existe trois types de stockage cloud :

Caractéristiques

Un module de 1 Gio de mémoire vive DDR2 pour ordinateur portable

Les technologies de stockage, à tous les niveaux de la hiérarchie, peuvent être différenciées par l'évaluation de certaines caractéristiques fondamentales ainsi que par la mesure de caractéristiques spécifiques à une implémentation particulière. Ces caractéristiques fondamentales sont :

  • Volatilité
    • Un système d'alimentation sans interruption (ASI) permet à un ordinateur de disposer d'un court laps de temps pour transférer des données de sa mémoire vive vers une mémoire non volatile avant que les batteries ne soient épuisées. Certains systèmes, comme EMC Symmetrix , intègrent des batteries qui assurent l'alimentation de la mémoire vive pendant plusieurs minutes.
  • Mutabilité
  • Accessibilité
    • Les types d'accès comprennent l'accès aléatoire et l'accès séquentiel . En accès aléatoire, n'importe quelle donnée stockée est accessible à tout moment, dans un laps de temps approximativement identique. En accès séquentiel, l'accès aux données se fait de manière séquentielle, les unes après les autres ; le temps d'accès à une donnée dépend donc de la dernière donnée consultée.
  • adressabilité
  • Capacité et densité
  • Performance
    • Les indicateurs de performance du stockage comprennent la latence , le débit , la granularité et la fiabilité.
  • Énergie
    • Les disques SSD de faible capacité ne comportent aucune pièce mobile et consomment moins d'énergie que les disques durs. Par ailleurs, la mémoire vive peut consommer davantage d'énergie que les disques durs. Les caches de grande capacité, utilisés pour éviter la saturation de la mémoire , peuvent également consommer une quantité importante d'énergie.
  • Sécurité
Aperçu
Caractéristiquesdisque durdisque optiquemémoire flashMémoire à accès aléatoirebande linéaire ouverte
Technologiedisque magnétiqueRayon laserSemi-conducteurbande magnétique
VolatilitéNonNonNonVolatilNon
Accès aléatoireOuiOuiOuiOuiNon
Latence (temps d'accès)~15 ms (swift)~150 ms (modéré)Aucun (instantané)Aucun (instantané)Absence d'accès aléatoire (très lent)
ContrôleurInterneExterneInterneInterneExterne
Défaillance avec perte de données imminenteAccident de la têteCircuits
Détection d'erreursDiagnostic ( SMART )Mesure du taux d'erreurIndiqué par des baisses soudaines des taux de transfert(Stockage à court terme)Inconnu
Prix ​​par espaceFaibleFaibleHautTrès hautTrès bas (mais disques durs coûteux)
Prix ​​unitaireModéréFaibleModéréHautDisques durs modérés (mais coûteux)
Application principaleExtension du stockage à moyen terme, sauvegardes régulières, serveur et poste de travailArchivage à long terme, distribution de copies papierÉlectronique portable ; système d'exploitationEn temps réelarchivage à long terme

Médias

Semi-conducteur

La mémoire à semi-conducteurs utilise des puces de circuits intégrés (CI) à base de semi-conducteurs pour stocker les informations. Les données sont généralement stockées dans des cellules de mémoire métal-oxyde-semi-conducteur (MOS) . Une puce de mémoire à semi-conducteurs peut contenir des millions de cellules de mémoire, composées de minuscules transistors à effet de champ MOS (MOSFET) et/ou de condensateurs MOS . Il existe des mémoires à semi-conducteurs volatiles et non volatiles ; les premières utilisent des MOSFET standard et les secondes des MOSFET à grille flottante .

Dans les ordinateurs modernes, le stockage principal est presque exclusivement constitué de mémoire vive (RAM) à semi-conducteurs volatile dynamique, et plus particulièrement de mémoire vive dynamique (DRAM). Depuis le début du XXIe siècle, un type de mémoire à semi-conducteurs non volatile à grille flottante, la mémoire flash, a progressivement gagné des parts de marché comme stockage hors ligne pour les ordinateurs personnels. La mémoire à semi-conducteurs non volatile est également utilisée comme stockage secondaire dans divers appareils électroniques avancés et ordinateurs spécialisés conçus pour ces derniers.

Dès 2006, les fabricants d'ordinateurs portables et de bureau ont commencé à utiliser des disques SSD (Solid State Drives ) à mémoire flash comme options de configuration par défaut pour le stockage secondaire, soit en complément, soit à la place du disque dur traditionnel.

Magnétique

Le stockage magnétique utilise différents motifs d' aimantation sur une surface recouverte d'un revêtement magnétique pour stocker des informations. Ce type de stockage est non volatil . L'accès aux informations se fait à l'aide d'une ou plusieurs têtes de lecture/écriture, qui peuvent contenir un ou plusieurs transducteurs d'enregistrement. Une tête de lecture/écriture ne couvre qu'une partie de la surface ; par conséquent, pour accéder aux données, la tête, le support ou les deux doivent être déplacés l'un par rapport à l'autre. Dans les ordinateurs modernes, le stockage magnétique prend les formes suivantes :

Dans les premiers ordinateurs, le stockage magnétique était également utilisé comme :

Contrairement à la mémoire flash et aux supports optiques réinscriptibles, le stockage magnétique ne présente pas de limite définie de cycles de réécriture, car la modification des champs magnétiques n'entraîne aucune usure physique. Sa durée de vie est plutôt limitée par les pièces mécaniques.

Optique

Le stockage optique , généralement représenté par un disque optique , stocke l'information dans des cavités à la surface d'un disque circulaire et lit cette information en éclairant la surface avec une diode laser et en observant la réflexion. Le stockage sur disque optique est non volatil . Les cavités peuvent être permanentes (supports à lecture seule), formées une seule fois (supports à écriture unique) ou réversibles (supports enregistrables ou à lecture/écriture). Les formats suivants étaient couramment utilisés CD , CD-ROM , DVD , BD-ROM : Support de stockage en lecture seule, utilisé pour la distribution massive d'informations numériques (musique, vidéo, programmes informatiques) ;

  • CD-R , DVD-R , DVD+R , BD-R : Supports de stockage à écriture unique, utilisés pour le stockage tertiaire et hors ligne ;
  • CD-RW , DVD-RW , DVD+RW , DVD-RAM , BD-RE : Supports de stockage à écriture lente et lecture rapide, utilisés pour le stockage tertiaire et hors ligne ;
  • La technologie Ultra Density Optical ou UDO a une capacité similaire à celle des disques BD-R ou BD-RE et est un support de stockage à écriture lente et à lecture rapide utilisé pour le stockage tertiaire et hors ligne.
  • Le stockage sur disque magnéto-optique est un type de stockage optique où l'information est stockée dans l'état magnétique d'une surface ferromagnétique. La lecture et l'écriture de cette information s'effectuent par une combinaison de méthodes magnétiques et optiques. Ce type de stockage, non volatil et à accès séquentiel , présente une vitesse d'écriture lente et une vitesse de lecture rapide. Il est utilisé pour le stockage tertiaire et hors ligne.

    Le stockage optique de données 3D a également été proposé.

    La fusion de l'aimantation induite par la lumière dans les photoconducteurs magnétiques a également été proposée pour le stockage magnéto-optique à haute vitesse et à faible consommation d'énergie.

    Papier

    Le stockage de données sur papier , généralement sous forme de bandes perforées ou de cartes perforées , a longtemps été utilisé pour enregistrer des informations destinées au traitement automatique, notamment avant l'avènement des ordinateurs. L'information était enregistrée en perforant le papier ou le carton, puis lue mécaniquement (ou plus tard optiquement) pour déterminer si un emplacement précis était plein ou perforé. Les codes-barres permettent d'apposer de manière sécurisée des informations lisibles par ordinateur sur les objets vendus ou transportés.

    Des quantités relativement faibles de données numériques (comparées à d'autres supports de stockage de données numériques) peuvent être sauvegardées sur papier sous forme de code-barres matriciel pour un stockage à très long terme, car la durée de vie du papier dépasse généralement même celle du stockage de données magnétiques.

    Autre