Module de persistance

Un module de persistance est une structure mathématique d' homologie persistante et d'analyse topologique des données qui décrit formellement la persistance des propriétés topologiques d'un objet pour différentes échelles. Un module de persistance est souvent constitué d'un ensemble de groupes d'homologie (ou d'espaces vectoriels si l'on utilise les coefficients de corps ) correspondant à une filtration d' espaces topologiques , et d'un ensemble d' applications linéaires induites par les inclusions de cette filtration. Le concept de module de persistance a été introduit en 2005 comme application des modules gradués sur les anneaux de polynômes , transposant ainsi des idées algébriques bien établies de l'algèbre commutative classique au cadre de l'homologie persistante. Depuis, les modules de persistance figurent parmi les principales structures algébriques étudiées en topologie appliquée.

corps . L'ensemble est parfois appelé ensemble d'indexation . Alors, un module de persistance à un paramètre est un foncteur de la catégorie des ensembles partiellement ordonnés de vers la catégorie des espaces vectoriels sur et des applications linéaires . Un module de persistance à un paramètre indexé par un ensemble partiellement ordonné discret tel que les entiers peut être représenté intuitivement par un diagramme d'espaces : Pour mettre l'accent sur l'ensemble d'indexation utilisé, un module de persistance indexé par est parfois appelé module de -persistance, ou simplement module de -persistance. Les ensembles d'indexation couramment utilisés incluent , etc.

On peut également utiliser une définition ensembliste d'un module de persistance qui est équivalente au point de vue catégorique : un module de persistance est une paire où est une collection d' espaces vectoriels et est une collection d'applications linéaires où pour chaque , tel que pour tout (c'est-à-dire que toutes les applications commutent).

Modules de persistance multiparamètres

Soit un produit d' ensembles totalement ordonnés , c'est-à-dire pour certains ensembles totalement ordonnés . Alors, en munissant le produit de l' ordre partiel défini par si et seulement si pour tout , on peut définir un module de persistance à plusieurs paramètres indexé par comme un foncteur . Ceci est une généralisation des modules de persistance à un seul paramètre, et en particulier, cela coïncide avec la définition à un seul paramètre lorsque .

Dans ce cas, un module de persistance est appelé module de persistance à dimensions ou à paramètres, ou simplement module multiparamètre ou multidimensionnel si le nombre de paramètres est déjà clair d'après le contexte.

Les modules de persistance multidimensionnels ont été introduits pour la première fois en 2009 par Carlsson et Zomorodian . Depuis, de nombreuses recherches ont porté sur la théorie et la pratique de leur utilisation, car ils offrent une meilleure structuration des données En effet, les modules multiparamètres présentent une sensibilité à la densité et une robustesse aux valeurs aberrantes supérieures à celles des modules monoparamètres, ce qui en fait un outil potentiellement précieux pour l'analyse des données

L’un des inconvénients de la persistance multiparamétrique réside dans sa complexité intrinsèque. Cela rend difficile l’exécution des calculs liés aux modules de persistance multiparamétrique. Dans le pire des cas, la complexité de calcul de l’homologie persistante multidimensionnelle est exponentielle.

La méthode la plus courante pour mesurer la similarité de deux modules de persistance multiparamètres consiste à utiliser la distance d'entrelacement , qui est une extension de la distance de goulot d'étranglement.

Exemples

Modules d'homologie

Lorsqu'on utilise l'homologie à coefficients dans un corps , un groupe d'homologie a la structure d'un espace vectoriel . Par conséquent, étant donné une filtration d'espaces , l'application du foncteur d'homologie à chaque indice donne un module de persistance pour chaque , appelé le module d'homologie ( de dimension ) de . Les espaces vectoriels du module d'homologie peuvent être définis indice par indice comme pour tout , et les applications linéaires sont induites par les applications d'inclusion de .

Les modules d'homologie sont les exemples les plus répandus de modules de persistance, car ils encodent des informations sur le nombre et l'échelle des caractéristiques topologiques d'un objet (généralement dérivées de la construction d'une filtration sur un nuage de points ) dans une structure purement algébrique , rendant ainsi la compréhension de la forme des données accessible aux techniques algébriques, importées de domaines mathématiques bien développés tels que l'algèbre commutative et la théorie des représentations .

Modules d'intervalle

L'une des principales préoccupations dans l'étude des modules de persistance est de savoir si ces modules peuvent être décomposés en « morceaux plus simples », en simplifiant. Plus précisément, il est algébriquement et informatiquement pratique qu'un module de persistance puisse être exprimé comme une somme directe de modules plus petits appelés modules d'intervalle .

Soit un sous-ensemble non vide d'un ensemble partiellement ordonné . Alors est un intervalle de si

Pour chaque si alors
Pour chaque , il existe une séquence d'éléments telle que , , et sont comparables pour tout .

Étant donné un intervalle, nous pouvons maintenant définir un module de persistance par index comme suit :

$; .$

Le module est appelé module d'intervalle .

Modules gratuits

Soit . Alors nous pouvons définir un module de persistance par rapport à où les espaces sont donnés par

$, et les cartes définies via .$

Il est alors connu sous le nom de module libre (de persistance) .

On peut également définir un module libre en termes de décomposition en modules d'intervalles. Pour chaque , on définit l'intervalle , parfois appelé « intervalle libre ». Alors, un module de persistance est un module libre s'il existe un multiensemble tel que . Autrement dit, un module est un module libre s'il peut être décomposé en une somme directe de modules d'intervalles libres.

Propriétés

Conditions de type fini

Un module de persistance indexé sur est dit de type fini si les conditions suivantes sont vérifiées pour tout :

Chaque espace vectoriel est de dimension finie.
Il existe un entier tel que l'application soit un isomorphisme pour tout .

Si satisfait la première condition, alors on dit généralement qu'il est de dimension finie ponctuelle (pfd) . La notion de dimension finie ponctuelle s'étend immédiatement aux ensembles d'indexation arbitraires.

La définition de type fini peut également être adaptée aux ensembles d'indexation continus. Plus précisément, un module indexé sur est de type fini si est pfd et contient un nombre fini d'espaces vectoriels uniques. Formellement, cela implique que pour tout point sauf un nombre fini de points, il existe un voisinage de tel que pour tout , et également qu'il existe un tel que pour tout . Un module satisfaisant uniquement la première propriété est parfois qualifié d' essentiellement discret , tandis qu'un module satisfaisant les deux propriétés est dit essentiellement fini .

Un module de persistance est dit semi-continu si, pour tout et tout suffisamment proche de , l'application est un isomorphisme. Il convient de noter que cette condition est redondante si les autres conditions de type fini ci-dessus sont satisfaites ; elle n'est donc généralement pas incluse dans la définition, mais elle est pertinente dans certains cas.

Théorème de structure

L'un des principaux objectifs de l'étude des modules de persistance est de les classer selon leur décomposabilité en modules d'intervalles. Un module de persistance admettant une décomposition en somme directe de modules d'intervalles est souvent simplement qualifié de « décomposable par intervalles ». Un des résultats fondamentaux dans ce domaine est que tout module de persistance pfd indexé sur un ensemble totalement ordonné est décomposable par intervalles. Ce résultat est parfois désigné comme le « théorème de structure des modules de persistance »

Le cas où est fini est une application directe du théorème de structure pour les modules de type fini sur un anneau principal idéal . Pour les modules indexés sur , la première démonstration connue du théorème de structure est due à Webb. [30] Le théorème a été étendu au cas de (ou de tout ensemble totalement ordonné contenant un sous-ensemble dénombrable dense la topologie d' ordre ) par Crawley - Boevey en 2015. La version généralisée du théorème de structure, c'est-à-dire pour les modules pfd indexés sur des ensembles totalement ordonnés quelconques, a été établie par Botnan et Crawley-Boevey en 2019.