910 Forschung & Lehre 12|24 DATENMANAGEMENT Sprache zu erleichtern. Denn die eigentliche Sprache der Naturwissenschaften war und ist die Mathematik und nicht Programmcode. Black Boxing Dieser Transparenz, Nachvollziehbarkeit und Verstehbarkeit des Programmcodes stehen jedoch verschiedene Entwicklungen entgegen. Zum einen wird der Anteil an Programmcode immer umfangreicher und durch die objektorientierte Programmierung zunehmend komplexer. Dabei muss man sich vor Augen halten, was geschieht, wenn Wissenschaft in Software übersetzt wird. Wissenschaftliche Konzepte sind in der Regel in Form theoretisch-mathematischer Modelle artikuliert, die allgemeine Aussagen über Zusammenhänge und Prozesse machen. Software hingegen muss eindeutig in Form ausführbarer Statements expliziert sein, um auf Computern berechenbar zu sein. Ein theoretisch-mathematisches Modell von wenigen Gleichungen wird dabei schnell zu einem Programmcode mit abertausenden von ausführbaren Statements, die die Zusammenhänge und Prozesse in raum-zeitlich diskretisierte Berechnungsschritte zerlegen. Zum anderen werden die Softwareprojekte, zu welchen viele zusätzliche softwaretechnische Aspekte wie Datenbankeinbindungen, Ein- und Ausgabeverwaltungen oder Parallelisierung der Berechnungen gehören, zunehmend anspruchsvoller. Research Software Engineering konzentriert sich vor allem auf die Professionalisierung dieser ständig komplexer und umfangreicher werdenden softwaretechnischen Aspekte der wissenschaftlichen Programmierung, um Forschungssoftware nachhaltiger, effizienter wie auch kompatibler zu machen. Transparenz, Nachvollziehbarkeit und Verstehbarkeit wie auch Nachhaltigkeit, Effizienz und Komptabilität sind zentrale epistemische Normen der Wissenschaft. Diese Normen sind durch die epistemische Überforderung aufgrund von enorm anwachsenden Datenmengen, extrem schnellen Berechnungen und der wachsenden Komplexität der Softwarestrukturen immer schwieriger zu gewährleisten. Der „digitale Extremismus“ treibt nicht nur die Entwicklung der Supercomputer in der Wissenschaft voran, er sorgt auch dafür, dass die logische Kontrolle der Computer selbst zunehmend automatisiert wird – durch softwaretechnische Routinen, aber immer öfter auch durch künstliche Intelligenz. Das folgerichtige Ende der Entwicklung ist der Gebrauch von Software wie auch digitaler Forschungsinfrastrukturen als Tools, die benutzbar, aber nicht mehr verstehbar und nachvollziehbar sind. Dies lässt sich als „Black Boxing“ von Forschung verstehen und zeigt sich aktuell besonders deutlich an den Deep-Learning-Verfahren, die aufgrund ihrer Komplexität nichtnachvollziehbare wie nicht-verstehbare Interpretationen großer Datenmengen generieren. Unboxing Im Kontext der Forschungssoftware kann Research Software Engineering hier einen wichtigen Beitrag leisten: zum einen indem verstärkt Methoden der „explainable AI“ (XAI) für die wissenschaftliche Programmierung entwickelt werden, um KI-basierte Dateninterpretationen nachvollziehbar und verstehbar zu machen. Zum anderen indem Standards definiert werden, um den zunehmend durch KI generierten Programmcode zu validieren. Da dieser Programmcode auch zur Automatisierung von forscherischer Tätigkeit verwendet wird, beispielsweise zur Entdeckung neuer physikalischer oder chemischer Eigenschaften, korrelierter oder sogar kausaler Verbindungen in Experimenten und Messungen, ist hier Transparenz, Nachvollziehbarkeit und Verstehbarkeit gefordert, solange wissenschaftliche Ansprüche geltend gemacht werden. Alles andere wäre nichts weiter als ein unwissenschaftlicher Datenpositivismus. Dies macht deutlich, dass die Wissenschaft immer tiefer in einen epistemischen und normativen Konflikt gerät. Wissenschaft – im Wortsinne als Wissen schaffen – war bislang ein zutiefst menschliches Unterfangen des Weltverstehens. Solange sich die Computational Sciences in der mnemotechnischen Revolution der symbolisch-logischen (und damit nachvollziehbaren) Kontrolle des automatisierten Rechnens gründen, haben sie sich diesem Unterfangen verschrieben. Doch wenn diese Kontrolle automatisiert und nicht mehr nachvollziehbar und verstehbar wird, bedeutet dies den Verlust des epistemischen Zugangs zu den Forschungsresultaten. Dieser epistemische Verlust wird durch die zunehmende Kommerzialisierung und Black Boxing von Software und digitalen Forschungsinfrastrukturen noch verstärkt. Hinzu kommt eine weitere, tiefgreifende Transformation der Wissenschaft, die sich immer mehr dem Unterfangen des wissenschaftlich-technologischen Weltdesigns als dem Weltverstehen verschreibt. Auch hier ist die Digitalisierung zentral, insofern das Designpotenzial der softwarebasierten Forschung zur Anwendung kommt. Molecular Design, Computational Fluid Dynamics oder generative KI-Methoden sind Beispiele hierfür. Der Wissenschaftsphilosoph Alfred Nordmann hat 2006 diesen Übergang vom Experiment zum Design epistemisch als „Collaps of the Distance“ beschrieben: „In other words, technoscience knows only one way of gaining new knowledge and that is by first making a new world.“ Dieses „world making“ vollzieht sich zumeist in softwarebasierter Forschung. In dieser Entwicklungslinie stehen nicht zuletzt die aktuellen Nobelpreise für Chemie und Physik. Dies alles deutet in eine Zukunft der Wissenschaft, in der Software noch zentraler werden wird: „Software is the new physical infrastructure of [...] scientific and technical research.“ (President’s Information Technology Advisory Committee, 1999). Der Forschungsalltag des 21. Jahrhunderts ist jedoch nicht nur durch Forschungssoftware und deren digitale Wissensprodukte geprägt, sondern auch durch die Softwarewelten der Sozialen Medien, Projektverwaltungssysteme, Open Access-Journale und Zitationsanalysen bis hin zu Large-Language-Modellen. Entsprechend wird auch das Research Software Engineering eine zunehmend zentrale Rolle spielen mit dem Ziel, Programmcode transparent, nachvollziehbar und verstehbar zu halten sowie forschungsrelevante Software zu professionalisieren, ohne sie zu kommerzialisieren. Eben dies ist vor dem Hintergrund zunehmend kommerzieller Softwareprodukte in der Forschung eine wichtige Aufgabe. »Ein theoretisch-mathematisches Modell von wenigen Gleichungen wird dabei schnell zu einem Programmcode mit abertausenden von ausführbaren Statements.«
RkJQdWJsaXNoZXIy MjMxMzg=