Postersektion
Donnerstag, 09.09.2021, 16:00 – 17:30 Uhr
Poster: A long-term archiving and dissemination ecosystem for Humanities’ research data
Gerlinde Schneider
Austrian Centre for Digital Humanities, Universität Graz
Martina Scholger
Austrian Centre for Digital Humanities, Universität Graz
Walter Scholger
Austrian Centre for Digital Humanities, Universität Graz
Elisabeth Steiner
Austrian Centre for Digital Humanities, Universität Graz
Johannes Stigler
Austrian Centre for Digital Humanities, Universität Graz
Sebastian Stoff
Austrian Centre for Digital Humanities, Universität Graz
Fabio Tosques
Austrian Centre for Digital Humanities, Universität Graz
Gunter Vasold
Austrian Centre for Digital Humanities, Universität Graz
Georg Vogeler
Austrian Centre for Digital Humanities, Universität Graz
Chiara Zuanni
Austrian Centre for Digital Humanities, Universität Graz
Abstract
For almost 20 years, the digital repository highlighted in this submission has been providing long-term preservation of Humanities’ resources offering both a technical solution and a way of achieving sustainability in the handling of research data. Such domain-specific digital repositories rely on specialised design principles and a strategic orientation to balance the need for long-term sustainability and the use of advanced technologies.
The repository solely relies on open source software due to its commitment to open access and open science. Its design principles intend to foster compliance with international best practices like the COAR Community Framework for Good Practices in Repositories and the certification guidelines of the CoreTrustSeal, and following the FAIR principles of findability, accessibility, interoperability and reusability.
Long-term preservation entails migration to new software versions and reflecting advancements in technology as well as responding to security issues; increase in projects and services require a more elaborate and stable system architecture.
This submission describes the conceptual framework and architecture of a large digital repository infrastructure that specialises on preservation, management and presentation of research data in the Humanities, as well as the maintenance and migration of this exemplary research data ecosystem.
Poster: Forschungs-Alltags-Infrastruktur
Bernhard Fisseni
Universität Duisburg-Essen
Denis Arnold
Leibniz-Institut für die Deutsche Sprache
Christian Lang
Leibniz-Institut für die Deutsche Sprache
Abstract
In unserem Beitrag diskutieren wir Aspekte einer Forschungsdateninfrastruktur für den wissenschaftlichen Alltag auf Projektebene und argumentieren für eine Unterstützung von Projekten während der Erfassung und Bearbeitung von Daten, d. h. vor deren endgültiger Veröffentlichung. Dabei differenzieren wir zwischen Projekten, deren primäres Ziel es ist, eine Ressource aufzubauen (ressourcenschaffende Projekte, kurz RP) und solchen, die zur Beantwortung einer konkreten Forschungsfrage Daten sammeln und auswerten (Forschungsprojekte, kurz FP). Wir argumentieren dafür, dass bei den offenkundigen Unterschieden zwischen beiden Projektarten die grundsätzlichen Ansprüche an das alltägliche Forschungsdatenmanagment im Kern sehr ähnlich (wenn auch unterschiedlich akzentuiert und skaliert) sind. Diese Ähnlichkeit rührt nicht zuletzt daher, dass im Rahmen von FP gesammelte Daten in Bezug auf das Projektziel primär Mittel zum Zweck sein mögen, sie jedoch bereits im Arbeitsprozess in unterschiedlichem Maß von unterschiedlichen Beteiligten genutzt werden. Wir gehen konkret auf die Aspekte Datenorganisation und -verwaltung, Metadaten, Dokumentation und Dateiformate und deren Anforderungen in den verschiedenen Projekttypen ein. Schließlich diskutieren wir Lösungsansätze dafür, Aspekte des Forschungsdatenmanagements auch in (kleineren) Forschungsprojekten nicht post-hoc, sondern bereits in der Projektplanung als Teil der alltäglichen Arbeit zu berücksichtigen und entsprechende Unterstützung in der Forschungsinfrastruktur vorzusehen.
Poster: Forschungsdaten.info – FDM-Angebote für die Geisteswissenschaften auf einen Blick
Elisabeth Böker
bw2FDM, KIM, Universität Konstanz
Regina Albrecht
Universitätsbibliothek der LMU München
Vanessa Gabriel
Universitätsbibliothek der LMU München
Laura Meier
Universitätsbibliothek der LMU München
Martin Spenger
Universitätsbibliothek der LMU München
Peter Brettschneider
bw2FDM, KIM, Universität Konstanz
Alexandra Axtmann
bw2FDM, KIM, Universität Konstanz
Abstract
Forschungsdaten.info ist das deutschsprachige Informationsportal zu Forschungsdatenmanagement (FDM). Mit praxisnahen Artikeln führt die Seite an das Thema heran. Die Plattform wird von einem überregionalen Team von Spezialistinnen und Spezialisten betreut und bietet eine Vielzahl von Einstiegsmöglichkeiten in das komplexe Thema FDM. Ein zentrales und etabliertes Angebot ist dabei die Rubrik „Wissenschaftsbereiche”. Mit der Fachseite Geisteswissenschaften bietet forschungsdaten.info einen umfangreichen und informativen Überblick über generische und spezifische FDM-Angebote in den geisteswissenschaftlichen Disziplinen. Die Unterteilung der Themenseite erfolgt in vier Bereiche: „NFDI“, „Projekte, Initiativen und Netzwerke“, „Repositorien und Datenjournale“ sowie „Tools und Services“. Auf der Fachseite werden sowohl aktuelle Informationen berücksichtigt als auch zusammen mit Forschenden neue Inhalte zu Forschungsprojekten und forschungsunterstützenden Hilfsmitteln erstellt. Zu den Hilfsmaterialien zählen beispielsweise nachnutzbare Schulungsmaterialien, die speziell für die Geisteswissenschaften erstellt wurden und auch Links zu internationalen Ressourcen. So wird trotz der deutschsprachigen Ausrichtung der Seite ein globaler Fokus eingenommen und es werden nationale und internationale Standards berücksichtigt, die auf die geisteswissenschaftlichen Fächer anwendbar sind. Ebenfalls bietet forschungsdaten.info disziplinübergreifende Informationen zum FDM an, bspw. in Form von FAQs, Veranstaltungsreihen oder einem Quiz. Das Poster zeigt, welche Ressourcen forschungsdaten.info für die Geisteswissenschaften bietet und wie die geisteswissenschaftliche Community Inhalte beisteuern kann.
Poster: Fun with VCS – more with less. A Tool for Facilitating the Use of Git in Linguistic Research Data Management.
Anne Ferger
Universität Paderborn
Daniel Jettka
Universität Paderborn
Abstract
The work with digital data requires some form of version control. In its simplest and still common appearance version control consists of file naming conventions, and often some creative form of duplication of files. The rising degree of collaboration in data creation and complexity of data, however, brings these intuitive methods to their limits, which is one of many practical and theoretical reasons why explicit and structured version control with the help of a version control system (VCS) is required. The introduction and use of a VCS (originally implemented for software engineering) for research data in the humanities often faces the obstacle of a steep learning curve and poses severe problems with regard to usability. To deal with this problem we discuss the open source script LAMA which is used to perform operations with the VCS Git. Using LAMA does not require in-depth knowledge of the VCS or additional technical expertise, so the focus of the individual researcher can remain on the creation of the research data itself. Additional advantages include messenger integration and the option to run consistency operations with pluggable tools.
Poster: Generische und disziplinspezifische Zugänge zur Qualität audiovisueller, annotierter Sprachdaten im BMBF-Projekt QUEST
Anna Wamprechtshammer
Universität Hamburg
Elena Arestau
Universität Hamburg
Abstract
In diesem Beitrag stellen wir mit dem BMBF-Verbundprojekt QUEST einen Ansatz zur Bestimmung der Nachnutzbarkeit von audiovisuellen, annotierten Sprachdaten vor. Der Fokus des Vorhabens liegt vor allem auf Forschungsdaten, die im Rahmen empirischer Forschung in den Bereichen Sprachdokumentation, Sprachkontakt- und Mehrsprachigkeitsforschung entstehen. Zur Evaluierung des Nachnutzungspotentials solcher Sprachdaten sollen einerseits generisch ausgerichtete datentechnische und dokumentatorische Standards für die verschiedenen relevanten Ressourcentypen sowie deren Metadaten und andererseits disziplinspezifische Kurationskriterien, die auf bestimmte Nachnutzungsszenarien ausgerichtet sind, entwickelt werden. In Bezug auf die sprachwissenschaftliche Sekundärnutzung mehrsprachiger Daten werden für die spezifischen Nachnutzungsszenarien ‚Lernerkorpora‘ und Korpora gedolmetschter Gespräche beispielsweise Evaluationskriterien für die Übersetzung mehrsprachiger Phänomene entwickelt sowie Fragen nach Metadatenstandards behandelt. Im Rahmen einer Erprobung von Methoden der Qualitätssicherung im Bereich dieser vergleichsweise heterogenen digitalen Sprachdaten strebt das Forschungsvorhaben darüber hinaus an, die Prüfung von Qualitätsstandards und Kurationskriterien als datentechnische Dienstleistung anzubieten. Dazu wird für ausgewählte Ressourcentypen zum Projektende ein System der automatischen kontinuierlichen Qualitätskontrolle implementiert.
Poster: NFDI4Objects: Eine NFDI-Konsortialinitiative zum materiellen Erbe aus etwa drei Millionen Jahren Menschheits- und Umweltgeschichte
Christin Keller
Deutsches Archäologisches Institut
Abstract
Seit 2018 entsteht NFDI4Objects in einem Bottom-up-Prozess und verfolgt das gemeinsame Ziel das Forschungsdatenmanagement in verschiedenen Disziplinen maßgeblich voranzutreiben. NFDI4Objects repräsentiert eine breite Community, die sich mit den materiellen Überresten der Menschheit aus einem Zeitraum von mehr als 2,6 Millionen Jahren beschäftigt. Sie umfasst zahlreiche Fachrichtungen aus den Geistes- und Naturwissenschaften, die durch gemeinsame Anforderungen an das Forschungsdatenmanagement miteinander verbunden sind. Mittlerweile vereint NFDI4Objects alle relevanten Forschungs-, Landes- und Bundeseinrichtungen, Universitäten und Museen, die sich mit dem materiellen Erbe unserer Vergangenheit beschäftigen.
Der Begriff “Objekt”, wie er von NFDI4Objects gedacht wird, deckt das gesamte Spektrum der Spuren und Hinterlassenschaften vergangener menschlicher Aktivitäten ab: von Artefakten über Ökofakte, archäologische Befunde und Architektur bis zu anthropogen geformten Landschaften, die durch vielfältige Objektkontexte und komplexe (Objekt-)Biografien eine besondere Herausforderung für das Forschungsdatenmanagement darstellen. So können Objecte nur mit ausreichender Kontextinformation über ihre ursprüngliche Fundsituation, Fundumstände sowie über Erhaltungsbedingungen usw. verstanden werden. Fortwährend verändern sie sich durch Gebrauch, Zerfall und Restaurierung. Das Potenzial Objekte in ihren sich verändernden Kontexten digital zu erforschen ist daher für zahlreiche Disziplinen von zentraler Bedeutung
Poster: Prozessmetadaten für die digitalen Geisteswissenschaften
Kerstin Jung
Institut für Maschinelle Sprachverarbeitung (IMS), Universität Stuttgart
Markus Gärtner
Institut für Maschinelle Sprachverarbeitung (IMS), Universität Stuttgart
Björn Schembera
Höchstleistungsrechenzentrum (HLRS), Universität Stuttgart
Abstract
Prozessmetadaten sind Teil einer nachhaltigen Dokumentation von erzeugten Forschungsdaten und -ergebnissen. Sie dienen dazu, die zum Forschungsprozess getroffenen Entscheidungen möglichst genau festzuhalten und helfen damit den Nachnutzenden zu bewerten, ob sich die Daten für die eigene Forschungsfrage eignen bzw. ob Ergebnisse verglichen werden können. Dabei spielen in den digitalen Geisteswissenschaften sowohl von automatischen Werkzeugen ausgeführte wie auch manuelle Arbeitsschritte eine essentielle Rolle. Im Rahmen einer Abbildung von drei Schemata für Prozessmetadaten aus verschiedenen Projekten wird untersucht, wie spezifisch die Ablaufinformationen für die digitalen Geisteswissenschaften in der Speicherung als Prozessmetadaten sind. Dabei werden die Schemata GRAIN aus der Computerlinguistik, RePlay-DH für die Digital Humanities und EngMeta aus den Ingenieurwissenschaften betrachtet. Allen betrachteten Ansätzen liegt eine Struktur aus Eingabe, Operation und Ausgabe zu Grunde, die eine prinzipielle Abbildung ermöglicht, aber Spielraum für individuelle Ausprägungen lässt und damit jeweils Annahmen für den spezifischen Einsatz enthält.
Poster: SDC4Lit – Science Data Center for Literature
Nina Buck
Höchstleistungsrechenzentrum (HLRS), Universität Stuttgart
André Blessing
Institut für Maschinelle Sprachverarbeitung (IMS), Universität Stuttgart
Thomas Bönisch
Höchstleistungsrechenzentrum (HLRS), Universität Stuttgart
Andreas Ganzenmüller
Höchstleistungsrechenzentrum (HLRS), Universität Stuttgart
Pascal Hein
Institut für Literaturwissenschaft (ILW), Universität Stuttgart
Jan Hess
Deutsches Literaturarchiv Marbach (DLA)
Alexander Holz
Deutsches Literaturarchiv Marbach (DLA)
Kerstin Jung
Institut für Maschinelle Sprachverarbeitung (IMS), Universität Stuttgart
Andreas Kaminski
Höchstleistungsrechenzentrum (HLRS), Universität Stuttgart
Roland Kamzelak
Deutsches Literaturarchiv Marbach (DLA)
Heinz Werner Kramski
Deutsches Literaturarchiv Marbach (DLA)
Jonas Kuhn
Institut für Maschinelle Sprachverarbeitung (IMS), Universität Stuttgart
Volodymyr Kushnarenko
Höchstleistungsrechenzentrum (HLRS), Universität Stuttgart
Björn Schembera
Höchstleistungsrechenzentrum (HLRS), Universität Stuttgart
Claus-Michael Schlesinger
Institut für Literaturwissenschaft (ILW), Universität Stuttgart
Mona Ulrich
Deutsches Literaturarchiv Marbach (DLA)
Gabriel Viehhauser
Institut für Literaturwissenschaft (ILW), Universität Stuttgart
Abstract
Das interdisziplinäre Science Data Center for Literature (SDC4Lit) hat sich den Aufbau eines Datenzentrums zur Sammlung, Archivierung, Erschließung, Erforschung und Vermittlung von digitalen literarischen Quellen mit computergestützten Methoden als Ziel gesetzt. Im Zuge dessen entsteht eine Forschungsplattform, auf der Quellen, Methoden, Werkzeuge und Vermittlungskompetenzen gebündelt, aufbereitet und strukturiert angeboten werden. Dabei wird auch beachtet, dass Modellierung, Aufbewahrung und Analyse aufgrund der besonderen Form digitaler Literatur zusammengehören.
Gegenstand sind genuin digitale literarische Materialien, mit einem Schwerpunkt auf Literatur im Netz und Born-digitals in Vor- und Nachlässen. Diese sind in einem Primärdatenrepositorium gespeichert und können in einer Arbeitsumgebung, die computergestützte Methoden und Werkzeuge bereitstellt und unterstützt, gelesen und analysiert werden. Die Forschungsergebnisse können in einem Forschungsdatenrepositorium, das auch über das Portal zugänglich sein wird, gespeichert und zur Verfügung gestellt werden.
Eine solche Aufgabe bringt viele Herausforderungen für die Forschung und die Archivarbeit mit sich und benötigt unterschiedliche Expertisen, weshalb SDC4Lit diese Aufgabe interdisziplinär bearbeitet.
Poster: Sprachwandel digital erfahrbar machen. Forschungsdatenmanagement in der Variationslinguistik
Brigitte Ganswindt
Philipps-Universität Marburg
Robert Engsterhold
Philipps-Universität Marburg
Abstract
Am Beispiel des historischen und weltweit einmaligen „Sprachatlas des Deutschen Reichs“ und seiner Datengrundlage (über 50.000 handgeschriebene Fragebögen in Kurrentschrift) werden die Anforderungen an ein jeweils zeitgemäßes Forschungsdatenmanagement in den Bereichen der Sprachgeographie und Variationslinguistik vorgestellt und diskutiert. Der Fokus des Beitrags liegt dabei zum einen auf den Besonderheiten der historischen Materialsammlung und ihrer Bedeutung für die Regionalsprachenforschung sowie für die Analyse von Sprachwandelprozessen. Zum anderen wird die Materialerschließung und die weltweit zugängliche, kostenfreie Bereitstellung der Daten im Internet vorgestellt. Um stets aus dem aktuellen Stand der Technik zu bleiben sind kontinuierliche Modernisierungen im Forschungsdatenmanagement erforderlich, die im Vortrag präsentiert werden sollen.
Poster: Virtuelle Forschungsdatenumgebungen – Struktur, Erkenntnis, Nachnutzung
Vinzenz Rosenkranz
eScience-Center Universität Tübingen
Karsten Schmidt
eScience-Center Universität Tübingen
Abstract
Forschungsdatenmanagement beginnt nicht erst bei der Erhebung der Forschungsdaten, sondern schon bei der Skizzierung der Forschungsidee. In vielen Wissenschaftsbereichen ist das Thema Forschungsdatenmanagement erst am Ende der Projektlaufzeit auf dem Schirm. Dies führt zumeist zu einer umständlichen, nicht lückenlosen Dokumentation der Forschungsdaten, wobei rechtliche und inhaltliche Kompromisse eingegangen werden. Warum denken wir das Management der Forschungsdaten nicht zu Beginn mit?
Virtuelle Forschungsdatenumgebungen (VFU) ermöglichen die Strukturierung und Erfassung der Forschungsdaten über den gesamten Lebenszyklus der Daten und der Datenverarbeitung bis hin zur Nachnutzung. Diese Werkzeuge können mit einer Bandbreite unterschiedlicher Informationen und Formaten angereichert und befüllt, individuell aber auch generisch interdisziplinär eingesetzt werden. Dabei bieten diese direkt bei der Aufnahme eine Unterstützung der Forschung und ermöglichen dort mit der Verknüpfung zu wissenschaftlichen Identifikationssystemen (z.B. ORCID) eine Anreicherung mit weiteren Metainformationen. Im Zentrum der am eScience-Center in Tübingen entwickelten VFU stehen dabei die Anforderung des Forschenden selbst.
Sie ermöglicht zusätzlich direkt bei der Eingabe erste Analysen, Korrekturen und Validierungen vorzunehmen, um die inhaltliche Beschreibung zu beginnen. Dabei kombiniert die Tübinger Forschungsumgebung sowohl Datenbank-technische Aspekte für die Erfassung als auch Visualisierungskomponenten (z.B. von Raumdaten, 3D-Objekte), um frühzeitig eine optimale Bewertung und Einordnung der unterschiedlichen Informationen im Kontext der Fragestellung zu ermöglichen.
Poster: Wir „gärtnern“ im FDM und forschungsethische Datenlandschaften. Wilderness and management of research data, including research ethics.
Annette Strauch
UB Hildesheim
Abstract
Die Arbeiten im aktiven Forschungsdatenmanagement sind heterogen. Forschungssupport geschieht im Austausch auf dem Campus mit den unterschiedlichen Akteurinnen und Akteuren. Eine wissenschaftliche Bibliothek kann die geisteswissenschaftlichen Disziplinen und die Forschungsprojekte aus der Sozial- und Bildungsforschung beim Umgang mit Forschungsdaten unterstützen. “Scientific Communities” werden durch Serviceinfrastrukturen mit Schnittstellen zur Forschung und den technischen Infrastrukturen intern und extern begleitet. Die FDM-Stelle engagiert sich in Task Areas (TA) der NFDI-Konsortien und kooperiert mit TA der NFDI4Culture und KonsortSWD, denn Forschungsdatenmanagerinnen und Manager beschäftigen sich mit den Projekten zu den jeweiligen forschungsethischen Belangen. Die FDM-Beratung lernt von den Projekten wie und mit welchen Methoden die Forschung in den Disziplinen betrieben wird. Dieser Beitrag beschäftigt sich mit zentralen und fachspezifischen Kooperationen einer Einrichtung, der Universitätsbibliothek. Eine Bibliothek ist ein wichtiger Teil des Forschungssupports, aber sie kann nicht für alle Disziplinen die gesamte forschungsnahe Unterstützung leisten, wohl aber in Kooperation. Welche Chancen gibt es in der Zusammenarbeit mit fächerspezifischen Infrastrukturanbietern und mit Konsortien wie der NFDI4Culture für geisteswissenschaftliche Forschungsdaten? Was wurde bisher in diesen Bereichen für das lokale FDM getan und wo sind langfristige Lösungen geschaffen worden (FAIR, Metadatenmanagement, Data Publication, Open Science)? Beispiele werden gezeigt.