Calcul de réservoir

Le calcul par réservoir est un cadre de calcul dérivé de la théorie des réseaux de neurones récurrents. Il consiste à projeter des signaux d'entrée dans des espaces de calcul de dimension supérieure grâce à la dynamique d'un système non linéaire fixe appelé réservoir. Après l'injection du signal d'entrée dans le réservoir, considéré comme une « boîte noire », un mécanisme de lecture simple est entraîné pour lire l'état du réservoir et le convertir en la sortie souhaitée. Le premier avantage majeur de ce cadre est que l'entraînement n'est effectué qu'à l'étape de lecture, la dynamique du réservoir étant fixe. Le second est que la puissance de calcul des systèmes naturellement disponibles, classiques et quantiques, peut être utilisée pour réduire le coût de calcul effectif.

Histoire

Les premiers exemples de réseaux de neurones à réservoir ont démontré que les réseaux de neurones récurrents à connexions aléatoires pouvaient être utilisés pour l'apprentissage de séquences sensori -motrices et pour des formes simples de discrimination d'intervalles et de parole . Dans ces premiers modèles la mémoire du réseau prenait la forme à la fois d'une plasticité synaptique à court terme et d'une activité médiée par les connexions récurrentes. Dans d'autres modèles initiaux de réseaux de neurones à réservoir, la mémoire de l'historique récent des stimuli était assurée uniquement par l'activité récurrente De manière générale, le concept de calcul à réservoir repose sur l'utilisation de connexions récursives au sein des réseaux de neurones pour créer un système dynamique complexe . Il s'agit d'une généralisation d'architectures de réseaux de neurones antérieures telles que les réseaux de neurones récurrents, les machines à états liquides et les réseaux à états d'écho . Le calcul par réservoir s'étend également aux systèmes physiques qui ne sont pas des réseaux au sens classique du terme, mais plutôt des systèmes continus dans l'espace et/ou le temps : par exemple, un simple « seau d'eau » peut servir de réservoir et effectuer des calculs sur des entrées correspondant à des perturbations de sa surface. La complexité résultante de tels réseaux de neurones récurrents s'est avérée utile pour résoudre divers problèmes, notamment le traitement du langage naturel et la modélisation de systèmes dynamiques. Cependant, l'apprentissage des réseaux de neurones récurrents est complexe et coûteux en ressources de calcul. Le calcul par réservoir atténue ces difficultés d'apprentissage en fixant la dynamique du réservoir et en n'entraînant que la couche de sortie linéaire.

Une grande variété de systèmes dynamiques non linéaires peuvent servir de réservoir pour effectuer des calculs. Ces dernières années, les lasers à semi-conducteurs ont suscité un intérêt considérable, car ils permettent des calculs rapides et économes en énergie, comparativement aux composants électriques.

Les progrès récents en intelligence artificielle et en théorie de l'information quantique ont donné naissance au concept de réseaux neuronaux quantiques . Ces réseaux sont prometteurs pour le traitement de l'information quantique, un défi pour les réseaux classiques, mais peuvent également trouver des applications dans la résolution de problèmes classiques . En 2018, une réalisation physique d'une architecture de calcul quantique à réservoir a été démontrée sous la forme de spins nucléaires au sein d'un solide moléculaire . Cependant, les expériences sur les spins nucléaires décrites dans ne démontraient pas le calcul quantique à réservoir à proprement parler, car elles n'impliquaient pas le traitement de données séquentielles. Les données étaient plutôt des entrées vectorielles, ce qui en fait une démonstration plus précise de l'implémentation quantique d'un algorithme de type « kitchen sink » (également appelé « machines d'apprentissage extrême » dans certaines communautés). En 2019, une autre implémentation possible de processeurs à réservoir quantique a été proposée sous la forme de réseaux fermioniques bidimensionnels. En 2020, la réalisation du calcul réservoir sur des ordinateurs quantiques à portes logiques a été proposée et démontrée sur des ordinateurs quantiques supraconducteurs IBM à court terme basés sur le cloud.

Les ordinateurs à réservoir ont été utilisés à des fins d'analyse de séries temporelles . En particulier, certaines de leurs utilisations impliquent la prédiction de séries temporelles chaotiques , la séparation de signaux chaotiques , et l'inférence de liens de réseaux à partir de leur dynamique.

Calcul de réservoir classique

Réservoir

Dans le calcul par réservoir, le « réservoir » désigne la structure interne de l'ordinateur et doit posséder deux propriétés : être composé d'unités individuelles non linéaires et être capable de stocker des informations. La non-linéarité décrit la réponse de chaque unité à une entrée, ce qui permet aux ordinateurs à réservoir de résoudre des problèmes complexes. Les réservoirs stockent des informations en connectant les unités dans des boucles récurrentes, où l'entrée précédente influence la réponse suivante. Cette modification de la réaction en fonction des entrées passées permet d'entraîner les ordinateurs à accomplir des tâches spécifiques.

Les réservoirs peuvent être virtuels ou physiques. Les réservoirs virtuels sont généralement générés aléatoirement et conçus comme des réseaux de neurones. Les réservoirs virtuels peuvent être conçus pour présenter une non-linéarité et des boucles récurrentes, mais, contrairement aux réseaux de neurones, les connexions entre les unités sont aléatoires et restent inchangées tout au long du calcul. Les réservoirs physiques sont possibles grâce à la non-linéarité inhérente à certains systèmes naturels. L'interaction entre les ondulations à la surface de l'eau contient la dynamique non linéaire nécessaire à la création d'un réservoir, et un système de reconnaissance de formes a été développé en générant d'abord des ondulations à l'aide de moteurs électriques, puis en enregistrant et en analysant ces ondulations.

Lire à haute voix

La couche de lecture est une couche de réseau neuronal qui effectue une transformation linéaire sur la sortie du réservoir. Les poids de cette couche sont entraînés en analysant les motifs spatio-temporels du réservoir après excitation par des entrées connues, et en utilisant une méthode d'entraînement telle qu'une régression linéaire ou une régression Ridge . Son implémentation dépendant des motifs spatio-temporels du réservoir, les détails des méthodes de lecture sont adaptés à chaque type de réservoir. Par exemple, la lecture pour un ordinateur à réservoir utilisant un récipient de liquide comme réservoir peut impliquer l'observation des motifs spatio-temporels à la surface du liquide.

Types

Réseau de réverbération contextuelle

Un des premiers exemples de calcul réservoir est le réseau de réverbération contextuelle . Dans cette architecture, une couche d'entrée alimente un système dynamique de grande dimension, lu par un perceptron monocouche entraînable . Deux types de systèmes dynamiques ont été décrits : un réseau de neurones récurrent à poids aléatoires fixes et un système de réaction-diffusion continu inspiré du modèle de morphogenèse d' Alan Turing . Au niveau de la couche entraînable, le perceptron associe les entrées courantes aux signaux qui résonnent dans le système dynamique ; ces derniers sont censés fournir un « contexte » dynamique aux entrées. Dans les travaux ultérieurs, le système de réaction-diffusion sert de réservoir.

Réseau d'état d'écho

Le modèle Tree Echo State Network (TreeESN) représente une généralisation du cadre de calcul de réservoir aux données structurées en arbre.

Machine à l'état liquide

Machine à états liquides chaotiques

Le liquide (ou réservoir) d'une machine à états liquides chaotiques (CLSM) , également appelée réservoir chaotique, est constitué de neurones à impulsions chaotiques dont l'activité se stabilise en convergeant vers une hypothèse unique décrivant les entrées apprises de la machine. Ceci contraste avec les réservoirs classiques qui ne se stabilisent pas. La stabilisation du liquide s'effectue par plasticité synaptique et contrôle du chaos, qui régissent les connexions neuronales au sein du liquide. La CLSM a montré des résultats prometteurs pour l'apprentissage de données de séries temporelles sensibles.

Calcul transitoire non linéaire

Ce type de traitement de l'information est particulièrement pertinent lorsque les signaux d'entrée dépendant du temps s'écartent de la dynamique interne du mécanisme. Ces écarts provoquent des transitoires ou des altérations temporaires qui sont représentées dans la sortie du dispositif.

calcul profond sur réservoir

L'extension du cadre de calcul de réservoir vers l'apprentissage profond , avec l'introduction du calcul de réservoir profond et du modèle de réseau d'état d'écho profond (DeepESN) permet de développer des modèles entraînés efficacement pour le traitement hiérarchique des données temporelles, tout en permettant l'étude du rôle inhérent de la composition en couches dans les réseaux neuronaux récurrents .

Calcul quantique à réservoir

Le calcul quantique à réservoirs peut exploiter la nature non linéaire des interactions ou processus quantiques pour former des réservoirs non linéaires caractéristiques , mais peut également être réalisé avec des réservoirs linéaires lorsque l'injection de l'entrée dans le réservoir crée la non-linéarité . L'association de l'apprentissage automatique et des dispositifs quantiques conduit à l'émergence du calcul neuromorphique quantique comme nouveau domaine de recherche

Types

États gaussiens d'oscillateurs harmoniques quantiques en interaction

Les états gaussiens constituent une classe paradigmatique d'états de systèmes quantiques à variables continues . Bien qu'ils puissent aujourd'hui être créés et manipulés, par exemple, sur des plateformes optiques de pointe , et qu'ils soient naturellement robustes à la décohérence , il est bien connu qu'ils ne sont pas suffisants pour, par exemple, l'informatique quantique universelle , car les transformations qui préservent la nature gaussienne d'un état sont linéaires . En général, une dynamique linéaire ne serait pas suffisante non plus pour un calcul réservoir non trivial. Il est néanmoins possible d'exploiter une telle dynamique à des fins de calcul réservoir en considérant un réseau d' oscillateurs harmoniques quantiques interagissant et en injectant l'entrée par des réinitialisations d'état périodiques d'un sous-ensemble d'oscillateurs. En choisissant judicieusement la façon dont les états de ce sous-ensemble d'oscillateurs dépendent de l'entrée, les observables des autres oscillateurs peuvent devenir des fonctions non linéaires de l'entrée, adaptées au calcul réservoir. En effet, grâce aux propriétés de ces fonctions, le calcul à réservoir universel devient possible en combinant les observables avec une fonction de lecture polynomiale. En principe, de tels ordinateurs à réservoir pourraient être implémentés avec des processus paramétriques optiques multimodes contrôlés , cependant, l'extraction efficace de la sortie du système est un défi, en particulier dans le régime quantique où la rétroaction de la mesure doit être prise en compte.

Réseaux de points quantiques bidimensionnels

Dans cette architecture, le couplage aléatoire entre les sites du réseau confère au réservoir la propriété de « boîte noire » inhérente aux processeurs à réservoir. Le réservoir, qui sert d'entrée, est alors excité par un champ optique incident . La lecture s'effectue sous la forme de nombres d'occupation des sites du réseau, qui sont naturellement des fonctions non linéaires de l'entrée.

Spins nucléaires dans un solide moléculaire

Dans cette architecture, le couplage quantique entre les spins d'atomes voisins au sein du solide moléculaire assure la non-linéarité nécessaire à la création d'un espace de calcul de dimension supérieure. Le réservoir est ensuite excité par un rayonnement électromagnétique radiofréquence accordé aux fréquences de résonance des spins nucléaires concernés . La lecture s'effectue par la mesure des états de spin nucléaire.

Calcul de réservoir sur des ordinateurs quantiques supraconducteurs à court terme à base de portes

Le modèle le plus répandu d'informatique quantique est le modèle à portes logiques, où le calcul quantique est effectué par des applications séquentielles de portes quantiques unitaires sur les qubits d'un ordinateur quantique. Une théorie pour la mise en œuvre du calcul réservoir sur un ordinateur quantique à portes logiques, avec des démonstrations de faisabilité sur plusieurs ordinateurs quantiques IBM supraconducteurs et bruyants à échelle intermédiaire (NISQ) , a été présentée dans