Hier beantworten wir Fragen, die uns häufig aus der Community gestellt werden.

Was sind Forschungsdaten?

In einer Gesamtschau auf die wissenschaftlichen Disziplinen hat der Rat für Informationsinfrastrukturen eine allgemeingültige Definition des Begriffs Forschungsdaten abgeleitet. Auch der NFDI e.V. verweist auf diese Begriffsbestimmung in seinem “Positionspapier zum direkten Recht eines Datenzugangs für die öffentliche Forschung”:

Forschungsdaten sind nicht allein die (End-)Ergebnisse von Forschung. Es handelt sich vielmehr um jegliche Daten, die im Zuge wissenschaftlichen Arbeitens entstehen, z. B. durch Beobachtungen, Experimente, Simulationsrechnungen, Erhebungen, Befragungen, Quellenforschungen, Aufzeichnungen, Digitalisierung, Auswertungen. Zu Forschungsdaten werden auch solche, nicht selbst gewonnenen Daten, auf die die Wissenschaft zu Forschungszwecken zugreift, um sie für den konkreten Forschungsprozess als methodisch erforderliche Grundlage zu nutzen. […] Dass auch die verwendeten Forschungswerkzeuge sowie die mitlaufend entstehenden Spuren wissenschaftlicher Arbeit – also Prozessdaten, wie sie namentlich die digitale Forschung vielfach automatisch hervorbringt – zu den Forschungsdaten zählen, ist überall dort von Bedeutung, wo die Dokumentation und Archivierung von Forschungsprozessen und Forschungsdaten zu deren Qualitätssicherung gehört oder aber unter Nachhaltigkeitsgesichtspunkten sowie für die historische Forschung geboten ist. […] Quelle: https://rfii.de/de/themen/

Aus dieser allgemeingültige Definition lässt sich eine spezifische Bestimmung des Begriff Forschungsdaten in NFDI4Objects ableiten In den multidisziplinären Forschungsprozessen unserer Community entstehen Daten, die zahlreiche konkrete technische und konzeptionelle Anforderungen an eine gemeinschafts- und nutzungsorientierte Infrastruktur stellen. Folgende Datentypen und -produkte sind für die Nutzungsgemeinschaft von NFDI4Objects von zentraler Bedeutung.

Primärdaten Objektbezogene Primärdaten können die Beschreibung von Artefakten und deren Abbildung aber auch Auffindungskontexte oder historische Gebäude sein.

Luftbild
© Scholz

Sensordaten Daten von mobilen, aktiv und passiv messenden Sensoren, die für die Vorbereitung oder im Rahmen der Durchführung von dokumentarischen Arbeiten bei Surveys und in der Feldforschung aufbereitet beziehungsweise generiert werden.

Collage zur Dokumentation des Prunkgrabs
© Archäologische Staatssammlung

Daten aus Laboratorien Daten, die in kontrolliertem Umfeld (Laboren) mit unterschiedlichen Messverfahren erzeugt werden.

Bearbeitung von Knochenmaterial mit einem Zahnarztbohrer.
© Cosimo Posth

Datenprodukte Datenprodukte als Ableitung von Primär- und Labor-Daten, die für den Einsatz in Forschungsprozessen aufbereitet werden.

Digitale Karte mit markierten Punkten.
© Schoeneberg

Alt-Daten (Legacy Data) Datenbanken, digitale Archive (Zeichnungen, Pläne, Fotografien) und weitre Altdatenbestände. Hierunter fallen auch lokale Aufzeichnungen, Denkmalregister/Ortsakten, historische Karten und Archivdaten, die im Rahmen von Forschungsprozessen in eine digitale Infrastruktur überführt werden.

Archäologische Karte
© Niedersächsisches Landesamt für Denkmalpflege, CC-BY SA 4.0”
Was beinhaltet Forschungsdatenmanagement?

Forschungsdatenmanagement (FDM) bezeichnet den systematischen und regelhaften Umgang mit Forschungsdaten über deren gesamten Lebenszyklus hinweg. Es umfasst alle Maßnahmen und Strategien, die erforderlich sind, um den Umgang mit den Daten zu planen, zu generieren oder zu erfassen, zu speichern, zu organisieren, anzureichern, zu teilen und langfristig zu archivieren.

Der Zweck des FDM ist es, die Nachvollziehbarkeit, Wiederverwendbarkeit, Qualität und Integrität von Forschungsergebnissen zu gewährleisten. Die Wichtigkeit von FDM ist zum einen durch das starke Anwachsen der Datenmengen in der Wissenschaft über die letzten Jahrzehnte stark gestiegen. Viele Förderinstitutionen machen darüber hinaus die Einhaltung bestimmter Richtlinien zum Umgang mit diesen Daten zur Bedingung für die Bewilligung von Forschungsfinanzierung.

Die wichtigsten Aspekte des Forschungsdatenmanagements sind:

  • Datenplanung: Zu Beginn eines Forschungsprojekts wird festgelegt, welche Daten gesammelt werden, wie sie organisiert und gespeichert werden, und wie der Zugang zu ihnen geregelt wird.
  • Datenorganisation: Strukturiertes und gut dokumentiertes Speichern und Ordnen von Daten, um sie nachvollziehbar und zugänglich zu machen.
  • Datensicherung: Regelmäßige Backups und Sicherheitsmaßnahmen, um Daten vor Verlust oder unbefugtem Zugriff zu schützen.
  • Metadaten und Dokumentation: Erstellung von Beschreibungen (Metadaten), die es anderen Forschenden ermöglichen, die Daten zu verstehen und nachzuvollziehen.
  • Datenarchivierung und -freigabe: Langfristige Speicherung von Daten in Repositorien und, wenn möglich, die Bereitstellung für die wissenschaftliche Gemeinschaft.
  • Rechtsfragen und ethische Aspekte: Berücksichtigung von Datenschutzbestimmungen, Urheberrechten und ethischen Richtlinien beim Umgang mit Forschungsdaten.

Forschungsdatenmanagement sorgt dafür, dass die Daten eines Forschungsprojekts langfristig zugänglich, verständlich und nutzbar bleiben, was insbesondere in interdisziplinären und kollaborativen Forschungsprojekten von großer Bedeutung ist.

Was sind FAIRe Daten?

FAIRe Daten entsprechen den FAIR-Prinzipien, die für Findable, Accessible, Interoperable und Reusable stehen. Diese Prinzipien helfen dabei, dass Daten gut organisiert und leicht zugänglich sind.

Findable (Auffindbar) bedeutet, dass Daten leicht zu finden sind. Dazu gehört, dass sie mit klaren und eindeutigen Beschreibungen (Metadaten) versehen sind und in durchsuchbaren Datenbanken gespeichert werden.

Accessible (Zugänglich) bedeutet, dass Daten leicht zugänglich sind. Es muss klar sein, wie man auf die Daten zugreift und welche Regeln hierfür bestehen.

Interoperable (Interoperabel) bedeutet, dass Daten in einem Format vorliegen, das von verschiedenen Systemen und Programmen verwendet werden kann. Dies wird häufig durch Programmierschnittstellen (sgn. APIs) gewährleistet. Die Daten sollen so strukturiert sein, dass sie mit anderen Daten kombiniert und gemeinsam genutzt werden können.

Reusable (Nachnutzbar) bedeutet, dass Daten so gut dokumentiert und organisiert sind, dass sie auch von anderen für verschiedene Zwecke wiederverwendet werden können. Dazu gehört, dass klar beschrieben wurde, wie die Daten erstellt wurden und unter welchen Bedingungen sie genutzt werden dürfen. Außerdem zählt hierzu auch der Aspekt der Langzeitspeicherung der Daten an einem zentralen Ort.

Zusammengefasst helfen die FAIR-Prinzipien, dass Forschungsdaten für alle leichter zugänglich und langfristig nutzbar sind.

Welchen Vorteil bringt Forschungsdatenmanagement für mich als Wissenschaftler:in in der objektbezogenen Forschung?

Gutes Forschungsdatenmanagement und eine entsprechende Forschungsdateninfrastruktur bieten Wissenschaftler:innen eine Vielzahl von Vorteilen, die den Forschungsprozess effizienter, transparenter und nachhaltiger gestalten. Die spezifischen Vorteile lassen sich in mehreren Bereichen zusammenfassen.

  • Langfristige Sicherung und Archivierung von Daten

    • Archäologische und objektbezogene Daten sind oft einmalig, da Ausgrabungen unwiederholbar sind und Fundkontexte durch die Ausgrabung selbst zerstört werden. Ein gutes digitales Forschungsdatenmanagement stellt sicher, dass Daten langfristig gesichert und archiviert werden, sodass sie auch für zukünftige Generationen von Forschenden zugänglich bleiben.
    • Eine standardisierte Datenarchivierung ermöglicht die dauerhafte Verfügbarkeit, auch wenn Technologien oder Software sich weiterentwickeln.
  • Zugänglichkeit und Wiederverwendbarkeit

    • Eine gut strukturierte digitale Infrastruktur ermöglicht es Wissenschaftler:innen, Daten zentral zu speichern und von überall darauf zuzugreifen. Dies ist besonders in multidisziplinären und globalen Disziplinen wie der Archäologie wichtig, da Forschung häufig auf internationaler Ebene stattfindet.
    • Die Veröffentlichung von Daten in öffentlichen Repositorien fördert den Zugang für andere Wissenschaftler:innen, die auf vorhandene Daten zugreifen, diese weiter analysieren oder in eigene Projekte integrieren können.
    • Open-Data beschleunigen wissenschaftlichen Fortschritt und ermöglichen die Überprüfung und Replikation von Forschungsergebnissen.
  • Effizienz und Zeitersparnis

    • Ein gutes digitales Forschungsdatenmanagement erleichtert das Auffinden, Ordnen und Suchen nach Daten. Statt durch unstrukturierte Archive und papierbasierte Notizen zu arbeiten, können Wissenschaftler:innen gezielt nach Metadaten und spezifischen Datensätzen suchen.
    • Dies reduziert den Zeitaufwand für die Verwaltung von Daten und erlaubt es den Forschenden, sich stärker auf die Analyse und Interpretation zu konzentrieren.
  • Erhöhte Transparenz und Nachvollziehbarkeit

    • Ein gut durchdachtes Forschungsdatenmanagement sorgt dafür, dass der Forschungsprozess vollständig dokumentiert ist. Alle Arbeitsschritte von der Datenerhebung bis zur Analyse werden transparent gemacht, was die Nachvollziehbarkeit der Forschung erhöht. Sie wird replizierbar und reproduzierbar.
    • Insbesondere in der Archäologie, wo der Fundkontext entscheidend ist, bietet ein strukturiertes Datenmanagement die Möglichkeit, Ergebnisse auch Jahre später zu überprüfen und nachzuvollziehen.
    • Förderung der Zusammenarbeit und Interdisziplinarität Digitale Infrastrukturen ermöglichen eine leichtere Zusammenarbeit zwischen verschiedenen
    • Forschungsgruppen und Disziplinen. Archäolog:innen können ihre Daten mit Expert:innen aus anderen Bereichen wie der Anthropologie, Geologie oder Genetik teilen, um umfassendere Forschungsergebnisse zu erzielen.
    • Interdisziplinäre Teams profitieren von gut organisierten und interoperablen Daten, die mit standardisierten Metadaten versehen sind.
  • Bessere Datenqualität und -sicherheit

    • Durch ein professionelles Forschungsdatenmanagement können Fehler in der Datenverarbeitung minimiert werden, da oft Werkzeuge zur Validierung und Konsistenzprüfung der Daten zum Einsatz kommen.
    • Digitale Infrastrukturen bieten in der Regel automatisierte Sicherungsmechanismen (Backups) sowie Sicherheitsprotokolle, die die Daten vor Verlust, Beschädigung oder unberechtigtem Zugriff schützen.
  • Erfüllung von Förderauflagen und rechtlichen Anforderungen

    • Viele Förderorganisationen und Forschungseinrichtungen fordern heute die Entwicklung eines Datenmanagementplans und die Einhaltung von Richtlinien zum Umgang mit Forschungsdaten.
    • Ein professionelles Forschungsdatenmanagement hilft Wissenschaftler:innen, diese Anforderungen zu erfüllen, und vermeidet Probleme bei der Mittelvergabe oder Publikation.
  • Förderung der wissenschaftlichen Sichtbarkeit und Anerkennung

    • Durch die Veröffentlichung von Daten in digitalen Repositorien können Wissenschaftler:innen Sichtbarkeit und Anerkennung für ihre Arbeit erhalten, da ihre Daten für andere Forscher zugänglich und zitierbar sind.
    • Eine gute Datenpublikation erhöht die Reichweite der Forschung und die Chancen auf Zitierungen, was sich positiv auf den wissenschaftlichen Ruf auswirken kann. Innovative Forschungsmethoden
    • Digitales Forschungsdatenmanagement ermöglicht den Einsatz von neuen Technologien und Methoden, wie z.B. Big Data-Analysen, Künstliche Intelligenz oder 3D-Modellierung, die in der objektbezogenen Forschung zunehmend Anwendung finden.
    • Mit der richtigen Infrastruktur können große Datenmengen analysiert und neuartige Forschungsfragen gestellt werden, die mit traditionellen Methoden nicht möglich wären.
  • Innovative Forschungsmethoden

    • Digitales Forschungsdatenmanagement ermöglicht den nachhaltigen Einsatz von neuen Technologien und Methoden, wie z.B. Big Data-Analysen, Künstliche Intelligenz oder 3D-Modellierung, die in der objektbezogenen Forschung zunehmend Anwendung finden.
    • Mit der richtigen Infrastruktur können große Datenmengen analysiert und neuartige Forschungsfragen gestellt werden, die mit traditionellen Methoden nicht möglich wären.
  • Ethische und rechtliche Sicherheit

    • Forschungsdatenmanagement unterstützt Archäolog:innen und andere Forschende dabei, rechtliche Vorgaben (z.B. Urheberrecht, Datenschutz, Kulturgutschutz) und ethische Anforderungen einzuhalten, insbesondere beim Umgang mit sensiblen Daten wie menschlichen Überresten oder kulturell bedeutsamen Funden.
    • Die genaue Dokumentation der Herkunft und Verwendung von Daten schützt vor rechtlichen Problemen und stellt sicher, dass die Forschung ethisch vertretbar ist.

Zusammenfassend kann festgestellt werden, dass ein gutes Forschungsdatenmanagement und eine funktionierende Forschungsdateninfrastruktur den Forschenden in der Archäologie und benachbarten Disziplinen mit objektbezogener Forschung erhebliche Vorteile bieten. Sie erleichtern die Verwaltung komplexer und heterogener Datensätze, fördern die Wiederverwendbarkeit und den Austausch von Daten, steigern die Effizienz der Forschung und tragen zur langfristigen Sicherung wertvoller Daten bei. Insgesamt unterstützen diese Systeme die Qualität und Nachvollziehbarkeit der Forschung und ermöglichen innovative Ansätze in der objektbezogenen Forschung.

Was ist der Unterschied zwischen Open Data und FAIR Data?

Die Begriffe Open Data und FAIR Data werden häufig verwechselt, da sie einige Überschneidungen haben. Im Folgenden haben wir Ihnen die Unterschiede zwischen Open Data und FAIR Data noch einmal aufgeschlüsselt.

Open Data bedeutet, dass die Daten frei zugänglich und ohne Einschränkungen genutzt, weiterverbreitet und modifiziert werden können. Die Daten können jederzeit von der gesamten Öffentlichkeit genutzt werden. Die Hauptidee hinter Open Data ist es, Informationen frei zugänglich zu machen, um Transparenz, Innovation und Zusammenarbeit zu fördern.

FAIR steht für Findable (auffindbar), Accessible (zugänglich), Interoperable (interoperabel) und Reusable (nachnutzbar). Diese Prinzipien stellen sicher, dass Daten gut organisiert, strukturiert und dokumentiert sind, damit sie leicht gefunden, zugänglich, interoperabel verwendet und nachhaltig genutzt werden können. Aber FAIR Data muss nicht unbedingt kostenlos oder ohne Einschränkungen zugänglich sein. Es geht darum, dass klar definiert ist, wie auf die Daten zugegriffen werden kann, und dass sie technisch und semantisch so gestaltet sind, dass sie leicht integriert und genutzt werden können. Das Ziel von FAIR Data ist es, Daten so zu gestalten, dass sie für wissenschaftliche Zwecke optimal nutzbar sind, was die Wiederverwendbarkeit und die Zusammenarbeit in der Forschung fördert.

Zusammengefasst bedeutet dies, dass Open Data die freie und uneingeschränkte Nutzung der Daten betont. Währenddessen beschreibt FAIR Data die Organisation und Strukturierung der Daten, um ihre Nutzbarkeit und Wiederverwendbarkeit zu maximieren, unabhängig davon, ob die Daten offen oder eingeschränkt zugänglich sind.

FAIR Data können auch Open Data sein, aber das ist nicht zwingend erforderlich. Gleichzeitig ist Open Data nicht zwangsläufig auch FAIR. Der Fokus von FAIR liegt auf der Verbesserung der Qualität und Nutzbarkeit der Daten, während Open Data hauptsächlich auf die Zugänglichkeit abzielt.

Haben Sie weitere Fragen? Dann kontaktieren Sie gerne unseren Helpdesk.