InChI – Kooperationsprojekt zur Maschinenlesbarkeit chemischer Strukturen und Reaktionen
Zusammen mit InChI Trust arbeiten wir an der Weiterentwicklung des InChI – des „International Chemical Identifiers“, der von IUPAC (International Union of Pure and Applied Chemistry) und InChI Trust erstellt und eingeführt wurde. Der InChI Trust ist eine gemeinnützige Organisation, die die Entwicklung und Förderung des InChI-Standards unterstützt.
Das Beilstein-Institut fördert den InChI Trust direkt mit der Expertise von eigenen Entwicklern, um den InChI weiter auszubauen. Unser Fokus liegt in der chemoinformatischen Entwicklung neuer und der Weiterentwicklung bestehender Algorithmen. Zur Zeit beschäftigen wir uns mit der Erkennung von metallorganischen Strukturen. Zu unseren Aufgaben gehört auch die Entwicklung der InChI-Dokumentation.
Ein Ziel dieser Arbeiten ist die Integration des InChI in die Beilstein Journals – eine Pionierarbeit in der Welt des wissenschaftlichen Publizierens. Zu diesem Zweck werden die von den Autoren eingereichten grafischen Strukturen analysiert und so maschinenlesbar gemacht, dass sie den FAIR Data-Prinzipien entsprechen. Die FAIR Data-Prinzipien beschreiben Metadaten, die auffindbar (Findable), zugänglich (Accessible), interoperabel (Interoperabel) und wiederverwendbar (Reusable) sind. Diese Eigenschaften ermöglichen es Computersystemen, auf Daten zuzugreifen und sie in andere Anwendungen zu integrieren.
Derzeit stehen die Beilstein-Journale – wie alle anderen chemischen Fachzeitschriften – vor dem Problem, dass chemische Strukturen nicht als solche verarbeitet werden können, weil sie als Grafiken oder Text gespeichert sind. Dies verhindert jede benutzerbasierte Interaktion, die auf den chemischen Eigenschaften dieser Strukturen basiert. Mit der Erweiterung des InChI und entsprechenden Anwendungen wollen wir einen halbautomatischen Prozess schaffen, um die relevanten Informationen zu extrahieren, zu konvertieren, in maschinenlesbarer Form in Artikel einzubetten und schließlich an Dienste und Repositorien Dritter, z. B. PubChem, ChemSpider oder Chemotion, zu liefern.
Die Einbettung maschinenlesbarer chemischer Informationen aus chemischen Strukturen, Reaktionen und Metadaten bereichert unsere Artikel und macht die publizierten Daten auffindbar, zugänglich, interoperabel und wiederverwendbar (FAIR).