Pistoia Alliance startet neues DataFAIRy: Bioassay-Projekt, um mehr Daten maschinenlesbar zu machen und KI zu

Science

Die Pistoia Alliance, eine globale, gemeinnützige Allianz, die sich für eine stärkere Zusammenarbeit in der Forschung und Entwicklung im Bereich Life Sciences einsetzt, startet heute die zweite Phase ihres DataFAIRy: Bioassay-Projekts, das darauf abzielt, Bioassay-Daten in maschinenlesbare Formate umzuwandeln, die den FAIR-Leitprinzipien von Findable, Accessible, Interoperable und Reusable. Die aktuelle Pilotphase wurde von AstraZeneca, Bristol Myers Squib, Novartis und Roche gesponsert und hat 496 Assays erfolgreich mit einem Natural Language Processing-Modell kommentiert, das speziell für die Erkennung von Life Sciences-Sprachen entwickelt wurde. Diese zweite Phase zielt darauf ab, den Annotationsprozess um das 10- bis 100-fache zu skalieren und das Datenmodell schließlich zum Industriestandard zu machen. Biologische Assays sind analytische Methoden, die für das Testen von Verbindungen, die für neue Medikamente in Betracht gezogen werden, sowie für die Überwachung der Umwelttoxizität von entscheidender Bedeutung sind. Derzeit gibt es mehr als 1,3 Millionen Protokolle für biologische Assays in Klartextformaten, wie veröffentlichte Artikel oder Herstellerhinweise. Die Auswahl und Validierung von Assays erfordert derzeit eine arbeitsintensive Suche, die Wissenschaftler bis zu 12 Wochen pro Assay in Anspruch nehmen kann. Die Einhaltung des DataFAIRy-Modells wird die Zeit reduzieren, die Wissenschaftler mit der Suche und Planung von Assay-Experimenten verbringen. Darüber hinaus sind Assay-Metadaten ein beliebter Datentyp für das Post-hoc-Data-Mining. Aber die meisten dieser veröffentlichten Daten und Metadaten sind nicht in einer Form, die für das automatisierte Mining geeignet ist. Sie sind teilweise in öffentlichen Datenbanken mit Anmerkungen versehen, aber Umfang, Tiefe und Qualität dieser Anmerkungen reichen nicht aus, um viele aktuelle und zukünftige Geschäftsfragen zu beantworten. Gartner prognostiziert jedoch, dass 85 Prozent der KI-Projekte aufgrund von Datenproblemen fehlerhafte Ergebnisse liefern werden, beispielsweise wenn Informationen nicht maschinenlesbar sind. Projekte wie DataFAIRy sind daher entscheidend für den Erfolg der KI-Einführung in den Life Sciences. „Während meiner gesamten Laufbahn, die sich in den letzten dreißig Jahren erstreckte, waren unstrukturierte Daten ein großes Problem für Wissenschaftler. Da das Volumen, die Vielfalt und die Komplexität von Assay-Informationen weiter zunehmen, müssen Unternehmen ihre Daten effektiver verwalten, damit Forscher ihre Zeit optimal nutzen und Unternehmen die Vorteile der digitalen Transformation voll ausschöpfen können“, erklärt Dr. Projektmanager des KI- und ML-Kompetenzzentrums der Pistoia Alliance. âDas von uns entwickelte DataFAIRY-Modell wird nicht nur die Zeit reduzieren, die Wissenschaftler auf der Suche nach Assay-Informationen aufwenden müssen. Es kann ihnen auch ermöglichen, Experimente zu überspringen, von denen bekannt ist, dass sie in der Vergangenheit fehlgeschlagen sind. Dies wird wiederum die Kosten für Unternehmen senken und wichtige Forschungsarbeiten beschleunigen.“ Obwohl die Digitalisierung Unternehmen die Bedeutung eines robusten Datenmanagements bewusster gemacht hat, ist das Fehlen von Industriestandards immer noch ein Hindernis für eine erfolgreiche Annotation und Verwaltung von Protokollen, einschließlich Assays . Die Übernahme der FAIR-Prinzipien ist der erste Schritt, um einen größeren Datenaustausch zwischen Organisationen zu ermöglichen und Wissenschaftlern zu helfen, mit der wachsenden Menge und Komplexität der erzeugten Daten fertig zu werden. Darüber hinaus sind aktuelle Datenmodelle nicht so aufgebaut, dass sie wissenschaftliche Sprache erkennen, sodass ein neues Modell erstellt werden muss, um die Annotation dieser wertvollen Ressourcen zu automatisieren. In der zweiten Stufe des DataFAIRy-Projekts wird ein solches Modell gemeinschaftsweit kollaborativ weiterentwickelt. „Um erfolgreich zu sein, müssen KI- und Natural-Language-Verarbeitungstools unter Berücksichtigung der wissenschaftlichen Terminologie entwickelt werden“, fährt Dr. Makarov fort. âDas von uns entwickelte DataFAIRy-Modell wird den Annotationsprozess automatisieren, sodass Assays durchsuchbar und wiederverwendbar sind, wodurch wertvolle Forschung beschleunigt wird. Wir hoffen, dass dieses Modell zum Gemeinschaftsstandard für die Veröffentlichung neuer Assays und für die Verwaltung bestehender Assays bei Anbietern, Aufsichtsbehörden und Herausgebern sowie Pharma- und Biotech-Unternehmen wird des DataFAIRy-Projekts wenden Sie sich bitte an projectteamdatafairy@pistoiaalliance.org. Als Unterstützung bei der Einführung von FAIR in Ihrem Unternehmen können Sie das kostenlose FAIR-Toolkit der Pistoia Alliance herunterladen, das Methodenwerkzeuge, Schulungen und Anwendungsfälle enthält, mit denen Unternehmen von Branchenerfolgen lernen können. Ginny Alexander Spark Communications ginny.alexander@sparkcomms.co.uk

“Das von uns entwickelte DataFAIRY-Modell wird nicht nur die Zeit reduzieren, die Wissenschaftler auf der Suche nach Assay-Informationen aufwenden müssen. Es kann ihnen auch ermöglichen, Experimente zu überspringen, von denen bekannt ist, dass sie in der V“
See all the latest jobs in Science
Zurück zu Nachrichten