Moteur de Recherche de Veille Concurrentielle pour l'Industrie Pharmaceutique et de Santé

mardi 7 février 2012

Linguamatics et ChemAxon : projet visant à améliorer l'exploration de texte dans le domaine de la chimie

Linguamatics
December 14, 2011 - Linguamatics et ChemAxon sont heureux d'annoncer leur partenariat dans le cadre d'un nouveau projet révolutionnaire, subventionné par le programme Eurostars d'EUREKA. Le nom de code du projet est « ChiKEL », qui signifie « Chemically Informed Knowledge Extraction from Literature » (extraction de connaissances chimiquement significatives de sources littéraires). ChiKEL fournira le premier système interactif d'exploration de texte dédié à la chimie, intégrant une fonction évoluée de recherche de produits chimiques et d'extraction de relations entre les structures et les autres entités biologiques ou chimiques. L'association de fonctions de recherche de produits chimiques et d'exploration de texte permettra aux utilisateurs d'effectuer des recherches sur la structure chimique et la biologie pour extraire, à des fins d'analyse ultérieure, des informations structurées de brevets, d'articles scientifiques et de documents internes.

Cette approche entièrement automatisée permet de localiser des structures chimiques dans des documents qui n'ont pas encore été annotés à la main ou ont été annotés pour certaines structures seulement, ou lorsque la procédure n'est économiquement pas viable – par exemple, pour les rapports internes d'une entreprise. Il est important de noter que cette nouvelle approche est extrêmement évolutive et peut localiser des structures chimiques à des emplacements spécifiques dans un document, permettant ainsi de poser des questions telles que « Quels produits chimiques sont mentionnés comme inhibiteurs d'une cible particulière ? » ou « Quel est le rôle de ce produit chimique dans le contexte de ce document ? ».

ChemAxon

L'intégration existante entre les produits logiciels de Linguamatics et de ChemAxon autorise la recherche de sous-structures et de similarités pour les composés connus. Par exemple, il est possible d'interroger la documentation pour découvrir les propriétés de composés possédant une sous-structure particulière, à l'image des cibles inhibées par un ensemble de composés.

Le projet ChiKEL étend l'intégration existante pour autoriser la reconnaissance de composés chimiques novateurs exprimés sous différentes formes, et notamment avec des dénominations UICPA et des images. Outre la recherche de sous-structures ou de similarités selon une structure donnée, définie par un utilisateur, ChiKEL améliorera également la présentation des résultats des recherches, permettant aux utilisateurs de visualiser les structures chimiques et de parcourir les agrégats de structures présentes dans les documents.

Les principaux objectifs de ChiKEL consistent à 1) développer des « étalons-or » pour les procédures d'évaluation, 2) intégrer le nom à la structure pour localiser les produits chimiques novateurs, 3) autoriser la visualisation des structures dans les résultats de recherches et 4) explorer la conversion d'images en structures.

Les applications incluent notamment la recherche scientifique, la propriété intellectuelle et la veille commerciale. Les domaines spécifiques incluent la découverte de médicaments, la conformité et la réorientation des médicaments, la sécurité des médicaments et la pharmacovigilance. Les clients ciblent incluent les entreprises pharmaceutiques et biotechnologiques, ainsi que les marchés adjacents tels que l'alimentation, l'agrochimie et la santé.
Les entreprises souhaitant participer aux tests bêta du logiciel ChiKEL sont invitées à contacter Linguamatics à l'adresse chikel@linguamatics.com - lire la fin du communiqué de presse de Linguamatics et ChemAxon - version anglaise de Linguamatics - version anglaise de ChemAxon -