Vous êtes ici

Développement de logiciels d’analyse du signal

Responsables:
Christophe Pouzat CNRS Paris
Samuel Garcia CNRS Lyon

La communauté scientifique qui utilise les techniques multiélectrodes extracellulaires (MEA – multi-electrodes arrays) fait aujourd'hui face à plusieurs problèmes :

  • Le volume de données généré lors d'une expérience « explose » de façon exponentielle. La taille des données générées par les enregistrements extracellulaires peut en effet aller de quelques dizaines de Mo à quelques dizaines de Go par heure d'acquisition. Outre le problème de stockage, émergent de façon particulièrement prégnante, les problèmes méthodologiques d'analyse de ces données.
  • L'analyse des signaux extracellulaires qu'elle se situe au niveau des décharges des cellules (potentiels d'action ou spikes) ou des phénomènes de réseaux (local field potential, LFP) nécessite une expertise de plus en plus pointue. De plus, le niveau de « bruit » que contiennent ces signaux, combiné à la grande complexité des méthodes, interdit une analyse purement automatique. Le temps passé à l'analyse des données dépasse ainsi couramment et significativement le temps passé à l'acquisition.
  • La communauté des neurophysiologistes souffre d'une faible mise en réseau des méthodes et des outils d'analyse. Certains laboratoires ont la chance d'avoir des compétences fortes dans le domaine de l'analyse (chercheur ou ingénieur). Cela entraine le plus souvent un développement d'algorithmes utilisés « en local ». Malheureusement, ces développements sont peu diffusés dans la communauté et le scénario où un étudiant, ou un stagiaire postdoctoral doit à lui tout seul, développer un ensemble d'outils complets n'est malheureusement que trop fréquent. Cette situation est d'autant plus frustrante que toutes ces boites à outils qui se clonent les unes les autres sont souvent moins bien programmées que des algorithmes librement accessibles sur le Net.
  • La littérature florissante qui présente les nouvelles méthodes est souvent difficile d'accès pour les neurobiologistes souhaitant les essayer. Les algorithmes ne sont pas faciles à trouver. Il en résulte plusieurs scénarios : soit une non-utilisation de ces méthodes, soit une mise en oeuvre hasardeuse et très couteuse en temps, soit une longue quête pour obtenir les codes d'origines.
  • Parfois, la communauté dispose de plusieurs méthodes d'analyse apparemment incompatibles. L'exemple classique est celui du tri des potentiels d'action (spike sorting) qui consiste à attribuer à différents neurones chaque décharge cellulaire détectée sur les données brutes. Peu de laboratoires ont le temps de, ou l'expertise requise pour, comparer différentes méthodes. Le choix d'une méthode par un laboratoire se fait ainsi souvent sans réelle comparaison et mise en concurrence des algorithmes disponibles.

Nous proposons de répondre à ces problèmes en développant dans cette thématique « outils d'analyses » une approche « ouverte ». Le qualificatif ouvert recouvre ici deux aspects :

  • Les logiciels déjà identifiables dans les laboratoires du GDR (OpenElectrophy, SpikeOMatic et STAR...) sont gratuits et que leurs codes sources sont disponibles (traduction du terme open source).
  • L'ouverture de ces outils doit aussi être entendue comme la mise à disposition de l'utilisateur d'un large éventail de méthodes pouvant être appliquées à un même jeu de données. Nous parlons donc d'une ouverture vis-à-vis des méthodes. L'idée de ce dernier point vient de la conviction que les données doivent « décider » de la méthode à employer.

Les axes directeurs de la thématique seront donc les suivants :

  • Recenser les outils déjà disponibles et utilisés dans les laboratoires du GDR.
  • Mettre en commun ces outils, les rendre compatibles entre eux.
  • Centraliser des jeux des données différents pour pouvoir tester les algorithmes et les comparer.

D'une certaine façon, nous proposons d'étendre le concept de « base de données » à celui de « base de méthodes ».