conference logo

Playlist "FAIR Data Prinzipien, Transparenz und Reproduzierbarkeit im Kontext von Open Source Software in den Wissenschaften"

FAIR Data Prinzipien, Transparenz und Reproduzierbarkeit im Kontext von Open Source Software in den Wissenschaften

Jens Dörpinghaus

Die Nutzung von Open Source ist ein guter Ansatz um zentrale ethische Maßstäbe in der Wissenschaft einfacher zur Anwendung zu bringen: Reproduzierbarkeit, Transparenz und der faire und wenn möglich offene Umgang mit Daten, kurz der „FAIR Data“ Prinzipien [1]. Der Vortrag soll den Status Quo in der Mathematik, Informatik und den Lebenswissenschaften sowie einiger Geisteswissenschaften darstellen und würdigen. Als Beispiel für Spannungsfelder in der interdisziplinären Forschung stellen wir die Open Source-Strategie der Arbeitsgruppe Bioinformatik am Fraunhofer SCAI vor.

Verschiedene Fachgruppen haben verschiedene Fachtraditionen, stehen aber zu den selben ethischen Grundwerten des wissenschaftlichen Arbeitens. Ist der Umgang mit Open Source Software in der Mathematik und Informatik noch relativ gebräuchlich, setzen Geisteswissenschaftler eher auf kommerzielle Softwarelösungen. Hier zeigt sich der Verlauf von allgemeineren zu spezifischeren Fachanwendungen. Wird in der Informatik primär programmiert, ist schon die Mathematik spezieller. Das zeigt sich am Einsatz von Software wie Matlab, Octave oder R. Auch in anderen Bereichen wie den Lebenswissenschaften zeigt sich eine Bandbreite von hochspezialisierten, recht statischen Fachanwendungen, zum Beispiel für die Mikroskopie, bis hin zu Lösungen in generischen Umgebungen wie R oder Python. In der Welt der Geisteswissenschaften findet Open Source wiederum wenig Beachtung.

Am Beispiel verschiedener wissenschaftlicher Disziplinen möchten wir zum einen die Diskrepanz zwischen allgemeinen und spezifischen Softwarelösungen sowie Probleme beim Einsatz von Open Source diskutieren. Zum anderen möchten wir die Anwendung der FAIR Data Prinzipien [1] in den wissenschaftlichen Disziplinen darstellen und diskutieren. In diesem Spannungsfeld findet sich die Open Source Software – kein Garant, aber eine gute Chance, sowohl in den spezifischen als auch allgemeinen Anforderungen von FAIR Data zu leben.

Anhand der Open-Source-Strategie der Arbeitsgruppe Bioinformatik möchten wir auf die Besonderheiten interdisziplinärer Arbeit eingehen, praktische und fachkulturelle Probleme sowie ihre Lösungen benennen und diskutieren. Manche Daten unserer Projekte sind nicht frei verfügbar, manche Software durfte aus lizenzrechtlichen Gründen nicht zur Verfügung gestellt werden. Trotz oder gerade deswegen glauben wir jedoch, dass die Vorteile bei der Nutzung von Open Source in der Wissenschaft überwiegen. Für ein Umdenken muss aktiv geworben und gearbeitet werden.

Literatur
[1] Wilkinson, Mark D., et al. "The FAIR Guiding Principles for scientific data management and stewardship." Scientific data 3 (2016).