Starlims Logo White 1

L’optimisation de l’intelligence artificielle (IA) commence par un LIMS harmonisé

Home » Blog » L’optimisation de l’intelligence artificielle (IA) commence par un LIMS harmonisé

L’intelligence artificielle (IA) et le machine learning (ML) sont des applications indispensables pour les laboratoires de demain. L’IA permet d’explorer en profondeur les données provenant des bases de données  laboratoires de toute l’entreprise, et l’apprentissage automatique est une partie intégrante de l’élaboration d’idées et de connexions non encore établies entre les points de données, pouvant accélérer les projets et, parfois, les orienter dans de nouvelles directions. Pour tirer le meilleur parti de ces systèmes, il ne suffit pas d’optimiser le système d’IA. La qualité et l’exhaustivité de l’IA dépendent en grande partie de votre système de gestion des informations de laboratoire (LIMS).

Votre LIMS doit être robuste, fiable et suffisamment flexible pour s’adapter aux besoins futurs, et les données doivent également être harmonisées pour que les résultats obtenus reflètent une recherche exhaustive des données pertinentes dans le système. Ce n’est qu’alors que l’IA et les chercheurs qui l’utilisent pourront être sûrs que leurs conclusions sont étayées par la science.

Ces conclusions peuvent conduire à de nouvelles connaissances qui peuvent, par exemple, améliorer la compréhension des mécanismes d’action ou des interactions entre les médicaments et leurs cibles, ce qui peut permettre d’identifier de nouvelles cibles pharmaceutiques, de concevoir de nouvelles molécules in-silico et de modéliser plus précisément les interactions entre les protéines. Les connaissances issues de l’IA peuvent contribuer à accélérer le processus de dépôt d’une demande d’autorisation de mise sur le marché d’un nouveau médicament de recherche (IND).

Étant donné que votre LIMS contient les résultats des expériences et les résultats des tests centrés sur les échantillons qui peuvent couvrir plusieurs tests ou protocoles, il est une référence pour tout ce qui suit. Il est donc important de s’assurer que les données de base et les données générées par les différents laboratoires soient harmonisées. L’harmonisation garantit que toutes les données pertinentes peuvent être retrouvées et, donc, prises en compte par l’IA. En bref, elle permet à l’IA de découvrir davantage de corrélations.

Lors de la mise en œuvre d’un nouveau LIMS, il est conseillé à toutes les parties prenantes – personnel de laboratoire, gestionnaires, responsables de la production, experts en assurance qualité et autres – de décrire leurs processus de travail en rapport avec le LIMS, d’identifier les goulets d’étranglement et d’optimiser les processus. Cet exercice permettra d’améliorer l’efficacité du système global, avec ou sans IA.

Si le LIMS est utilisé depuis un certain temps, commencez par passer en revue les données de référence du LIMS – les informations dont les utilisateurs ont besoin pour faire fonctionner le LIMS correctement. Tout d’abord, assurez-vous qu’elles soient disponibles en un seul endroit. Ces données de base sont non transactionnelles, elles ne changent donc que lorsque de nouvelles technologies ou de nouveaux processus sont ajoutés. Parmi les exemples de données de référence, citons la liste des mots-clés réservés qui ne peuvent pas être utilisés comme noms de fichiers, et les conventions qui dictent l’utilisation des caractères spéciaux ou des majuscules. Ce fichier doit être facile à trouver et à mettre à jour lorsque des modifications sont apportées aux laboratoires ou que le logiciel LIMS est mis à jour.

Prenez également le temps d’établir ou de mettre à jour les conventions de dénomination afin qu’elles soient significatives à l’échelle de l’entreprise. Envisagez des conventions de dénomination qui font référence au projet, à une variation, au type de laboratoire, à la chaîne de fabrication ou au site. Par exemple, les installations de production multisites peuvent nommer un essai en fonction du site, du bâtiment, de la chaîne de production et de l’objectif. Ainsi, un test de pH pour la ligne 1 du bâtiment 2 de l’usine de Boston pourrait être étiqueté “Bos2-Line1pH”. Ce niveau de détail permet d’identifier facilement les tests par la suite.

Pour les applications non liées à la fabrication, envisagez d’utiliser le nom du service, le numéro de la méthode et le type de référence. D’autres conventions peuvent trouver utile d’utiliser les numéros de référence réglementaires dans le nom du fichier. Si une plus grande spécificité est nécessaire, liez les données à un tableau de consultation au besoin. La valeur de cette approche peut sembler négligeable aujourd’hui, mais elle devient plus évidente lorsque des données historiques sont incorporées dans le LIMS. Dans ce cas, un nom de fichier faisant référence à un appareil d’IRM qui a été remplacé il y a dix ans peut être moins utile que de noter le numéro du processus réglementaire ou le type de laboratoire. Il faut également normaliser la longueur autorisée des fichiers de données entre les laboratoires afin que les recherches puissent porter sur des noms de fichiers aussi bien très longs que très courts.

Assurez-vous que le LIMS et les laboratoires eux-mêmes utilisent des termes et des définitions standard pour les tests et les produits afin de simplifier les recherches. Détaillez comment le LIMS traite les soumissions d’échantillons et les résultats des tests, interagit avec les instruments de laboratoire et documente la chaîne de traçabilité.

Les organisations internationales doivent également tenir compte des différences internationales dans les données de référence. Il s’agit notamment de la langue (par exemple, l’anglais et le chinois), des orthographes (par exemple, le Royaume-Uni et les États-Unis), des devises et des fuseaux horaires. Par conséquent, établissez des conventions standard pour régir ces différences. Par exemple, déterminez si les heures doivent être indiquées dans le fuseau horaire local ou en utilisant le temps moyen de Greenwich (GMT), et si les rapports doivent être rédigés dans la langue principale de l’organisation ou dans la langue locale du laboratoire, et assurez-vous que les entrées de valeurs sont correctement traduites.

Une fois la structure du LIMS en place, les parties prenantes peuvent commencer à harmoniser les données en établissant des normes et des formats afin que le LIMS présente la cohérence dont les utilisateurs ont besoin pour utiliser le système de manière efficace et efficiente.

Bien qu’un LIMS ne soit pas un entrepôt de données, il est confronté à bon nombre de problèmes similaires. Lorsque plusieurs laboratoires utilisent le LIMS, il est probable qu’ils aient leurs propres ontologies et conventions de dénomination et de classement. Si elles ne sont pas harmonisées, certaines données sont effectivement cloisonnées et n’apparaîtront pas dans les résultats de recherche, à moins que les chercheurs ne sachent utiliser ces termes spécifiques. 

Par exemple, le LIMS doit savoir que les termes “poids”, “poids”, “livres” et “kilogrammes” font tous référence au poids, et les utilisateurs doivent convenir d’une convention standard. La nécessité d’une telle normalisation s’applique également à la terminologie et aux conventions de dénomination des tests, des méthodes, des matériaux et même des récipients, ainsi qu’à l’identification des échantillons et à l’état des stocks.

Si le LIMS est utilisé depuis un certain temps, prenez le temps maintenant de vous assurer que toute modification des processus, des matières premières ou d’autres éléments est reflétée dans le système. De petits changements (comme des modifications de la spécificité des tests résultant d’un changement de fournisseur, par exemple) peuvent affecter l’exactitude des données et les conclusions de l’IA.

Au niveau des projets, il est de bonne pratique de séparer les données en une analyse brute et une analyse de synthèse. Le fait de noter cette distinction permet aux chercheurs d’accéder aux données brutes pour vérifier les résultats ou pour effectuer une nouvelle analyse sans détruire les données d’origine.

Avant de mettre en œuvre une application d’IA, c’est aussi le moment de dédupliquer les fichiers. L’espace de stockage n’est plus illimité. En fait, de nombreuses organisations commencent à considérer le stockage comme un bien consommable et à traiter les données plutôt que de simplement acheter plus d’espace de stockage. La conservation consiste à garder les données utiles et à détruire celles qui ne servent plus à rien. Prenons l’exemple d’un contrôle de qualité d’un instrument. S’il est bon, stockez-le avec le reste des données, mais il est inutile de stocker plusieurs tests de qualité qui ont échoué tout en modifiant les paramètres avant qu’un contrôle acceptable ne soit effectué.

Si votre LIMS ne comprend pas de données historiques, ajoutez-les en tant que projet secondaire. L’inclusion des données historiques, surtout si elles sont saisies à partir de sources papier, sera probablement fastidieuse, mais pourrait s’avérer inestimable si des données des années précédentes – qui ne semblaient peut-être pas importantes à l’époque – éclairent des questions actuelles.

Dans l’idéal, toutes les données auront été harmonisées lors de la première mise en œuvre du LIMS dans l’ensemble de l’organisation, et les laboratoires utiliseront toujours les termes normalisés de manière cohérente. En pratique, il faut s’attendre à une certaine dérive au fil du temps et des changements de personnel. Il vaut donc la peine pour les responsables de laboratoire de s’assurer que les interactions de leur laboratoire avec le LIMS reflètent toujours les normes convenues.

L’analyse de l’IA ne permet d’obtenir des résultats fiables et exploitables que si les données auxquelles elle accède sont fiables. Cela nécessite un LIMS harmonisé qui permet une analyse complète de l’IA. Faire l’effort de nettoyer les données maintenant – et de s’assurer qu’elles restent propres – sera payant à long terme.