DataLab

Laboratoire R&D du groupe Quinten

Chez Quinten, l’obsession de produire des résultats à l’état de l’art fait partie de notre ADN.

A cette fin, une structure dédiée : le datalab, est en large partie dédiée à la R&D en intelligence artificielle dans le but de produire de nouveaux outils, méthodologies et résultats visant à intégrer les dernières approches les plus performantes.
L’équipe, composée de profils variés (docteurs, post-doc, chercheurs, ingénieurs et consultants) a un triple objectif :

 

  • Proposer des solutions innovantes dans le domaine de l’IA pour la santé et la finance ;
  • S’assurer de la qualité technique des rendus sur nos projets clients ;
  • Effectuer une veille scientifique de qualité pour la diffuser en interne.
Face à l’évolution rapide des technologies d’intelligence artificielle, la mission du Datalab est d’identifier et d’évaluer ces technologies innovantes, afin d’accélérer leur intégration à l’offre des filiales du groupe Quinten. Cela nous permet de proposer systématiquement à nos clients des solutions à la pointe de l’innovation.
Lucas Davy

Directeur du DataLab

Approche multi-disciplinaire de l’intelligence Artificielle

Cinq axes de spécialisation en intelligence artificielle font aujourd’hui l’expertise de Quinten et constituent l’essentiel de notre R&D. Cette orientation est issue à la fois de l’expérience historique de l’entreprise, pionnière dans l’IA en santé, ayant permis d’accumuler une expérience significative dans ce domaine particulier ainsi que l’ouverture à d’autres méthodologies permises par notre ouverture multi-sectorielle.

 

Données de vie réelle

Le premier axe s’intéresse à l’exploitation des données de vie réelle, dont la complexité et la technicité nécessite un haut niveau de spécialisation.

Le développement d’approches complémentaires basées sur les biostatistiques (modèles bayesiens…) et sur le deep learning (Réseau de Neurones Récurrents, AutoEncodeurs) nous permettent de traiter de très nombreux cas d’usage avec des performances à l’état de l’art : diagnostic prédictif, etc.

Nous nous appuyons pour cela sur différents algorithmes développés en interne tels que le Q-Finder, ou encore le Générateur de codes médicaux.

 

Analyse de langage (NLP)

Le second axe est consacré à l’analyse de langage (NLP), avec une spécialisation sur les documents biomédicaux (rapports de médecin, littérature biomédicale, commentaires patients, etc.) et en particulier en langage francophone.

Le développement d’algorithmes de deep learning (transformers) spécifiquement entrainés sur des corpus spécialisés comme AliBERT nous permet de proposer des solutions extrêmement performantes sur des tâches variées : détection d’effets secondaires, extraction d’entités biomédicales en oncologie, classification de rapports médicaux, etc.

 

Traitement des séquences

Parcours clients et parcours patients sont naturellement représentés sous forme d’un enchainement d’événements (visites à l’hôpital ou chez le médecin pour un patient par exemple). Quinten a développé une expertise particulière autour de la modélisation de ce type de données via une représentation séquentielle pour aboutir à la création d’algorithmes propriétaires comme le Seqminer.

Cette approche nous permet d’obtenir des meilleures performances ainsi qu’une compréhension plus fine sur des cas d’usages aussi variés que la prédiction d’un diagnostic, le scoring d’un client, la survie d’un patient, le clustering de progression de pathologie, etc.

 

Explicabilité des modèles

La plupart des cas d’usages traités au sein de Quinten demande une compréhension des phénomènes modélisés. Il est donc indispensable de pouvoir expliquer et interpréter les prédictions de nos modèles.

Dans ce cadre, nous avons développé plusieurs approches spécifiques aux cas d’usages dans le domaine de la santé et de la banque/assurance permettant de fournir des éléments d’explication des modèles à différents niveaux de détail.

 

Graphes

La représentation des données sous forme de graphes offre des avantages particuliers qu’il est difficile et laborieux d’obtenir via des données tabulaires. Par ailleurs, le domaine biomédical regorge d’ontologies et de classifications prenant naturellement la forme de graphes permettant de structurer la connaissance.

Chez Quinten, nous travaillons au développement de méthodologies permettant de doper la performance de nos algorithmes à partir de graphes de connaissance déjà disponibles ou que nous enrichissons afin de répondre encore mieux aux cas d’usage que nous traitons.

Nos partenaires

Quinten travaille régulièrement dans le cadre de partenariats avec le monde académique et médical.

Notre R&D en chiffres

publications scientifiques

%

des revenus investis en R&D

collaborateurs dédiés à la recherche

algorithmes propriétaires

Nos familles d’algorithmes propriétaires

Q-Finder

Le Q-Finder© est un algorithme permettant la détection de sous-groupes au sein d’une cohorte.

Dans le domaine de la santé, il va identifier des sous-groupes de patients pouvant répondre favorablement à une thérapie en s’appuyant sur la recherche de facteurs prédictifs de la maladie ou la réponse au traitement.

AliBERT

AliBERT est un modèle de langage spécialisé dans le domaine biomédical en langue française.

Son utilisation permet de traiter différentes tâches d’analyse de langage dans le domaine médical : détection d’effets secondaires, extraction d’entités biomédicales, classification de diagnostics.

Générateur de codes médicaux

Nous avons développé un outil de génération de codes médicaux (ICD10) à partir des synonymes associés à une même classe de pathologie.

Cet outil est utilisé pour retraiter les codes ICD10 trouvés dans les données de vie réelle afin de les rattacher à une pathologie à une maille aggrégée.

Seqminer

Seqminer est un algorithme exhaustif de détection de sous-séquences.

Son utilisation intervient notamment dans le traitement de parcours patients ou parcours clients pour détecter les modèles communs identifiables dans ces données de forme séquentielle.