Le bit est l' unité d'information la plus élémentaire en informatique et en communication numérique . Son nom est un mot-valise formé à partir de « bit » (chiffre binaire) . [ bit représente un état logique prenant l'une des deux valeurs possibles . Ces valeurs sont le plus souvent représentées par 1 et 0 , mais d'autres représentations telles que vrai / faux , oui / non , activé / désactivé et +/− sont également largement utilisées .
La relation entre ces valeurs et les états physiques du support de stockage ou du périphérique sous-jacent relève de la convention, et différentes affectations peuvent être utilisées même au sein d'un même périphérique ou programme . Elle peut être implémentée physiquement avec un périphérique à deux états.
Un groupe contigu de chiffres binaires est communément appelé chaîne de bits , vecteur de bits ou tableau de bits unidimensionnel (ou multidimensionnel) . Un groupe de huit bits est appelé un octet , mais historiquement, la taille de l'octet n'est pas strictement définie. Fréquemment, les demi-mots, les mots entiers, les mots doubles et les mots quadruples sont constitués d'un nombre d'octets qui est une petite puissance de deux. Une chaîne de quatre bits est généralement appelée un quartet .
En théorie de l'information , un bit représente l' entropie informationnelle d'une variable binaire aléatoire valant 0 ou 1 avec une probabilité égale , ou encore l'information acquise lorsque la valeur de cette variable est connue . En tant qu'unité d'information , le bit est également appelé shannon [ du nom de Claude E. Shannon . Utilisé comme mesure de la longueur d'une chaîne numérique codée en symboles sur un alphabet binaire (c'est-à-dire 1000 × 1000 , le bit a été appelé binit , mais cet usage est aujourd'hui rare
En compression de données , l'objectif est de trouver une représentation plus courte d'une chaîne de caractères, afin de réduire le nombre de bits nécessaires lors de son stockage ou de sa transmission. La chaîne est compressée en cette représentation plus courte avant le stockage ou la transmission, puis décompressée dans sa forme originale lors de sa lecture ou de sa réception. Le domaine de la théorie algorithmique de l'information est consacré à l'étude du contenu informationnel irréductible d'une chaîne (c'est-à-dire sa représentation minimale possible, exprimée en bits), en supposant que le destinataire possède une connaissance a priori minimale de la méthode de compression utilisée. En détection et correction d'erreurs , l'objectif est d'ajouter des données redondantes à une chaîne afin de permettre la détection ou la correction d'erreurs lors du stockage ou de la transmission. Ces données redondantes sont calculées au préalable, stockées ou transmises, puis vérifiées ou corrigées lors de la lecture ou de la réception des données.
Le symbole du chiffre binaire est soit « bit », conformément à la norme CEI 80000-13 :2008, soit le caractère minuscule « b », conformément à la norme IEEE 1541-2002 . L’utilisation de ce dernier peut prêter à confusion avec le « B » majuscule, qui est le symbole normalisé international de l’octet.
Histoire
Ralph Hartley a suggéré l'utilisation d'une mesure logarithmique de l'information en 1928. Claude E. Shannon a utilisé pour la première fois le mot « bit » dans son article fondateur de 1948 intitulé « A Mathematical Theory of Communication ». Il en a attribué l'origine à John W. Tukey , qui avait rédigé une note de service des Bell Labs le 9 janvier 1947 dans laquelle il avait abrégé « binary digit » en « bit ».
représentation physique
Un bit peut être stocké par un dispositif numérique ou tout autre système physique existant dans l'un ou l'autre de deux états distincts possibles . Il peut s'agir des deux états stables d'une bascule , des deux positions d'un interrupteur électrique , des deux niveaux de tension ou de courant distincts autorisés par un circuit , des deux niveaux d' intensité lumineuse distincts , des deux directions de magnétisation ou de polarisation , de l'orientation de l'ADN double brin réversible , etc.
L'un des premiers exemples de dispositif de stockage binaire est sans doute la carte perforée, inventée par Basile Bouchon et Jean-Baptiste Falcon (1732), perfectionnée par Joseph Marie Jacquard (1804), puis adoptée par Semyon Korsakov , Charles Babbage , Herman Hollerith et les premiers fabricants d'ordinateurs comme IBM . Une variante de ce principe est la bande perforée . Dans tous ces systèmes, le support (carte ou bande) comportait une série de perforations ; chaque perforation pouvait être perforée ou non, transportant ainsi un bit d'information par emplacement potentiel. Le codage du texte par bits a également été utilisé dans le code Morse (1844) et dans les premières machines de communication numérique, comme les téléscripteurs (1870).
Les premiers dispositifs électriques à logique discrète (tels que les circuits de commande d'ascenseurs et de feux de circulation , les commutateurs téléphoniques et l'ordinateur de Konrad Zuse) représentaient les bits par l'état de relais électriques , ouverts ou fermés. Ces relais fonctionnaient comme des interrupteurs mécaniques, basculant physiquement entre deux états pour représenter des données binaires, constituant ainsi les éléments de base des premiers systèmes informatiques et de contrôle. Lorsque les relais furent remplacés par des tubes à vide à partir des années 1940, les concepteurs d'ordinateurs expérimentèrent diverses méthodes de stockage, comme les impulsions de pression se propageant dans une ligne à retard à mercure , les charges stockées sur la surface interne d'un tube cathodique ou les points opaques imprimés sur des disques de verre par photolithographie .
Dans les années 1950 et 1960, ces méthodes ont été largement supplantées par des dispositifs de stockage magnétique tels que les mémoires à tores magnétiques , les bandes magnétiques , les tambours et les disques , où un bit était représenté par la polarité de l'aimantation d'une zone donnée d'un film ferromagnétique , ou par un changement de polarité d'une direction à l'autre. Ce même principe a ensuite été utilisé dans la mémoire à bulles magnétiques développée dans les années 1980, et on le retrouve encore dans divers objets à bande magnétique comme les tickets de métro et certaines cartes de crédit .
Dans les mémoires à semi-conducteurs modernes , telles que la mémoire vive dynamique (DRAM) ou un disque SSD , les deux valeurs d'un bit sont représentées par deux niveaux de charge électrique stockés dans un condensateur ou un transistor MOSFET à grille flottante . Dans certains types de matrices logiques programmables et de mémoires mortes (ROM) , un bit peut être représenté par la présence ou l'absence d'un conducteur en un point précis du circuit. Sur les disques optiques , un bit est codé par la présence ou l'absence d'une microcavité sur une surface réfléchissante. Dans les codes-barres unidimensionnels et les codes QR bidimensionnels , les bits sont codés par des lignes ou des carrés noirs ou blancs.
En informatique numérique moderne, les bits sont transformés en portes logiques booléennes .
Transmission et traitement
En transmission série , les bits sont transmis un par un . En transmission parallèle , plusieurs bits sont transmis simultanément . Un ordinateur séquentiel traite l'information soit bit à bit, soit octet à octet. Du point de vue des communications de données, une transmission octet à octet correspond à une transmission parallèle à 8 voies avec signalisation binaire.
Dans les langages de programmation tels que le C , une opération bit à bit agit sur les chaînes binaires comme s'il s'agissait de vecteurs de bits, plutôt que de les interpréter comme des nombres binaires .
Les débits de transfert de données sont généralement mesurés en multiples décimaux du SI. Par exemple, la capacité d'un canal peut être spécifiée comme suit : 8 kbit/s = 1 ko/s.
Stockage
La taille des fichiers est souvent mesurée en multiples binaires d'octets (norme CEI), par exemple, 1 Kio = 1024 octets = 8192 bits. Une confusion peut survenir lorsque (pour des raisons historiques) la taille des fichiers est spécifiée avec des multiplicateurs binaires utilisant les préfixes ambigus K, M et G plutôt que les préfixes normalisés CEI Ki, Mi et Gi.
Les dispositifs de stockage de masse sont généralement mesurés en multiples décimaux du SI, par exemple, 1 To = octets.
De manière déroutante, la capacité de stockage d'un dispositif de mémoire directement adressable, tel qu'une puce DRAM , ou d'un assemblage de telles puces sur un module de mémoire, est spécifiée comme un multiple binaire, utilisant le préfixe ambigu G au lieu du préfixe Gi recommandé par la CEI. Par exemple, une puce DRAM spécifiée (et présentée) comme ayant une capacité de 1 Go possède une capacité de 8 Go octets. En 2022, la différence entre la conception courante d'un système de mémoire d' une capacité de 8 Go et la signification correcte de 8 Go selon le SI posait encore problème aux concepteurs de logiciels.
Unité et symbole
Le bit n'est pas défini dans le Système international d'unités (SI). Cependant, la Commission électrotechnique internationale (CEI ) a publié la norme CEI 60027 , qui spécifie que le symbole d'un chiffre binaire est « bit », et que ce symbole doit être utilisé pour tous les multiples, tels que « kbit » pour kilobit. Toutefois, la lettre « b » minuscule est également largement utilisée et a été recommandée par la norme IEEE 1541 (2002) . En revanche, la lettre « B » majuscule est le symbole standard et usuel de l'octet.
Plusieurs bits
| Décimal | Binaire | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Valeur | SI | Valeur | IEC | JEDEC | |||||||
| 1000 | kbit | kilobit | 1024 | Kibit | kibibit | Kbit | Ko | kilobit | |||
| 1000 2 | Mbit | mégabit | 1024 2 | Mibit | mebibit | Mbit | Mo | mégabit | |||
| 1000 3 | Gbit | gigabit | 1024 3 | Gibit | gibibit | Gbit | GB | gigabit | |||
| 1000 4 | Tbit | térabit | 1024 4 | Tibit | tebibit | — | |||||
| 1000 5 | Pbit | pétabit | 1024 5 | Pibit | pebibit | — | |||||
| 1000 6 | Ebit | exabit | 1024 6 | Eibit | exbibit | — | |||||
| 1000 7 | Zbit | zettabit | 1024 7 | Zibit | zebibit | — | |||||
| 1000 8 | Ybit | yottabit | 1024 8 | Yibit | yobibit | — | |||||
| 1000 9 | Rbit | ronnabit | 1024 9 | Ribit | Robibit | — | |||||
| 1000 10 | Qbit | quettabit | 1024 10 | Qibit | quebibit | — | |||||
| Ordres de grandeur des données | |||||||||||
Plusieurs bits peuvent être exprimés et représentés de diverses manières. Pour faciliter la représentation de groupes de bits récurrents en informatique, plusieurs unités d'information ont été traditionnellement utilisées. La plus courante est l'octet , terme introduit par Werner Buchholz en juin 1956, qui servait historiquement à représenter le groupe de bits permettant d'encoder un caractère de texte sur un ordinateur De ce fait, il a été utilisé comme élément adressable de base dans de nombreuses architectures informatiques . Dès 1993, la conception matérielle s'est orientée vers l' octet de 8 bits . Cependant, en raison de l'ambiguïté liée à la dépendance à la conception matérielle sous-jacente, l' octet a été défini pour désigner explicitement une séquence de huit bits.
Les ordinateurs manipulent généralement les bits par groupes de taille fixe, appelés conventionnellement « mots ». À l’instar de l’octet, le nombre de bits dans un mot varie selon la conception matérielle et se situe généralement entre 8 et 80 bits, voire davantage sur certains ordinateurs spécialisés. Au début du XXIe siècle, les ordinateurs personnels et serveurs grand public utilisaient des mots de 32 ou 64 bits.
Le Système international d'unités (SI) définit une série de préfixes décimaux pour les multiples d'unités normalisées, qui sont également couramment utilisés avec le bit et l'octet. Les préfixes kilo ( 10³ ) à quetta ( 10³⁰ ) s'incrémentent par multiples de mille, et les unités correspondantes sont le kilobit (kbit) à la quettabit (Qbit).