Modellierung von Fuzzyness / Wobbliness in Geodaten
Insbesondere bei der Bereitstellung von Open Data nach den FAIR-Prinzipien zur bestmöglichen Offenheit und Transparenz ist die Angabe von Unsicherheiten und Zweifeln für den Nachnutzenden von enormer Bedeutung. Bei interdisziplinärer Zusammenarbeit ist dieser Aspekt umso wichtiger. In diesem Paper werden fünf data-driven interdisziplinäre Use-Cases für den Umgang mit und die Modellierung von vagen und unsicheren Georeferenzen aus dem Bereich der Archäologie und Geowissenschaften vorgestellt.
# Einleitung
Geodätinnen und Geodäten wissen, dass jede Bestimmung einer Länge, Winkel, bzw. eine Koordinate mit Unsicherheiten und/oder statistischen Kenngrößen wie Standardabweichungen, 3-Sigma-Regel etc. belegt ist. Insbesondere bei der Bereitstellung von Open Data nach den FAIR-Prinzipien [1] (Findable, Accessible, Interoperable und Reusable) zur bestmöglichen Offenheit und Transparenz ist die Angabe von Unsicherheiten und Zweifeln für den Nachnutzenden von enormer Bedeutung. Bei interdisziplinärer Zusammenarbeit ist dieser Aspekt umso wichtiger. Insbesondere in den Geistes- und Kulturwissenschaften (Humanities / Cultural Heritage) und auch Geowissenschaften (wie z.B. Geologie) spielen Geodaten eine große Rolle. Georeferenzierungen sind Teil der täglichen Arbeit und stellen ein Herausforderung bei der Bereitstellung von Open Geodata nach den FAIR-Prinzipien dar. Archäologische und geowissenschaftliche Forschung muss bei der Datenmodellierung mit Zweifeln wie Fuzzyness und Mehrdeutigkeiten umgehen. Dies geschieht insbesondere bei der Georeferenzierung [2;3]. Um jedoch reproduzierbare und verständliche Daten für die Wiederverwendung zu schaffen und gleichzeitig die Datenqualität archäologischer Daten zu gewährleisten, müssen diese Zweifel und Unklarheiten offengelegt werden [4]. Dies ist auch für die FAIRifizierung von Daten wichtig, die ein großer Teil der Nationalen Forschungsdateninfrastruktur (NFDI) ist [5;6]. In diesem Kontext müssen insbesondere Vagheiten und Unsicherheiten für die Arbeit mit und Bereitstellung von Geodaten modelliert werden [7-9]. Für die Verknüpfung von Daten und die FAIRifizierung ist jedoch die von Berners-Lee [10] vorgeschlagene graphbasierte Modellierung als Linked Open Data (LOD) die Methode und Technik der Wahl. Aufgrund der großen Vielfalt der Forschungsbereiche ist eine interdisziplinäre, allgemein verständliche Modellierung von Unsicherheiten und Vagheiten in Geodaten eine große Herausforderung.
In diesem Paper werden fünf data-driven interdisziplinäre Use-Cases für den Umgang mit und die Modellierung von vagen und unsicheren Georeferenzen (am Beispiel von Fundstellen) auf der Grundlage von Literatur als LOD aus dem Bereich der Archäologie und Geowissenschaften vorgestellt. Die Anwendungsfälle implementieren drei Modellierungsstrategien [11] unter Verwendung von Wikidata, Linked Open Data sowie einer Ontologie, modelliert in OWL [12] und Wikibase [13] und nehmen zudem Möglichkeiten in Open Street Map unter die Lupe.
# Use Cases
## Use Case A
Ogham-Steine sind Monolithen mit der frühmittelalterlichen irischen Ogham-Primitivschrift, die vor allem auf der Insel Irland und im westlichen Teil Großbritanniens zwischen dem 4. und 9 Jhd. n. Chr. errichtet wurden. Die meisten Steine befinden sich nicht mehr an ihrem ursprünglichen Standort, was für die kartografische Erfassung wichtig ist und die Bestimmung ihrer ursprünglichen Funktion erschwert [14]. Ogham-Steinfunde werden in verschiedenen Katalogen wie Büchern (z. B. 14-16), Online-Datenbanken (z. B. das CISP-Projekt) oder Online-Repositorien (z. B. Ogham in 3D) erwähnt. Diese Quellen liefern Informationen in unterschiedlicher Granularität: Townlands, Beschreibungen und Koordinaten in WGS84/GPS oder irischen GRID-Referenzen. Zudem werden ganze Biographien von Geo-Locations dort erfasst. Wie könnten diese Ungenauigkeiten und Unsicherheiten in Community-Hubs wie Wikidata oder Open Street Map abgebildet werden? Ein Beispiel hierfür ist CIIC 81, der im Stone Corridor des University College Cork (UCC) steht und mit Hilfe von WIkidata [17] und Open Street Map modelliert wurde, vgl. auch Wikidata Q106680733 [18] und OSM Node 11071361392 [19].
## Use Case B
Die Dissertation von S. Baars beschäftigt sich mit der Silbermünzprägung von Kroton, einer achäischen Kolonie in Süditalien, vom 6. bis 3. Jh. v. Chr. Dabei kommen verschiedene numismatische Methoden zum Einsatz, darunter auch die der Hortfundanalyse. Sämtliche Fundorte der untersuchten Horte sind nicht exakt georeferenziert (z. B. anhand der Dokumentation von Grabungsberichten). Die ermittelten Fundorte sind aus der Literatur abgeleitet und weisen unterschiedliche Präzisionsgrade hinsichtlich der geografischen Lage auf. Eine recht genaue Angabe bietet z. B. der Hortfund von "Tarent 1938" (IGCH 1902) in der "via Oberdan" in Tarent. Hinweise auf eine Verortung des Fundes im modernen und/oder antiken Stadtkerne liefern z. B. "Paestum 1937" (IGCH 1925) oder "Strongoli 1955" (IGCH 1885; in der Gegend der antiken Stadt Petelia). Teils sind lediglich Hinweise auf größere Regionen vorhanden, z. B. wurden Hortfunde im Jahr 1864 in "Kalabrien" (IGCH 1873) oder 1964 in "Süditalien" (IGCH 1894) gefunden oder stammen von der "Ionischen Küste” (IGCH 1916). Die Modellierung dieser Fundorte wurde mittels RDF und Wikibase durchgeführt. Ein Beispiel hierfür ist der Fundort “Fiume Esaro 1967 (gennaio)”, der die fuzzy-sl Wikibase ID Q67 [20] und URI site_3003 [21] führt.
## Use Case C
Ein Teil der Dissertation von F. Schenk befasst sich mit den Nachweisen des Ascheregens des Campanian Ignimbrite (CI) in Mitteleuropa; ein trachytischer Tuff aus einem spätpleistozänen vulkanischen Ereignis [22;23], der aus der Region Kampanien (Italien) stammt. Vor etwa 40.000 Jahren fand der größte Ausbruch des CI in den Phlegräischen Feldern statt. In diesen Tagen ist dies wieder von erhöhtem Interesse, da ein weiterer Ausbruch des Supervulkans bevorstehen könnte [24]. Nach dem Ausbruch bedeckten massive Glasablagerungen aus dem CI-Ausbruch große Teile des osteuropäischen Kontinents; vulkanisches Material des CI findet sich häufig in isolierten Wasserscheiden und Tälern. Diese Fundorte sind in mehreren Papern festgehalten, z.B. (a) genaue Koordinaten, z.B. "[...] Lago Grande di Monticchio in Süditalien (40°56N, 15°35′E)" [25], (b) Verweise auf Städte, z. B. Neapel [26] (c) Verweise auf Regionen, z. B. Altopiano delle Murge [27] oder (d) Verweise auf Höhlen und archäologische Stätten, z.B. die Crvena Stiljena-Höhle in Montenegro [28]. Dabei stellt sich die Frage wie diese verschiedenen Granularitäten von Fundorten modelliert und auf einen WKT-Punkt vereinfacht werden? Ist die Verwendung von “Google Maps” oder “geohack by toolforge” ausreichend? Diese Modellierungen wurden mittels RDF und Wikibase durchgeführt. Ein Beispiel hierfür ist der Fundort in der “Crvena Stiljena-Höhle”, der die URI cisite_51 [29] führt.
## Use Case D
Insbesondere in Münzfund-Datenbanken wie z.B. Antike Fundmünzen in Europa (AFE) werden Fund-Koordinaten hinterlegt. Zu diesem Fundort kann angegeben werden, ob die Koordinaten präzise sind oder auch nicht. Ein Fundort kann hier z.B. ein Gräberfeld, eine Grabungsstelle oder ein Einzelfund eines Sondengängers sein. Alle Fundmünzen mit allen Details wie bei einer Grabung einzugeben ist weder umsetzbar (da die Details oft fehlen) noch zielführend, da die Eingabe zu viel Zeit und die Oberfläche zu unübersichtlich werden würde. Um die Fundorte vor privaten Sondengängern zu schützen, werden Fund-Koordinaten jedoch durch AFE nur auf einer höheren Ebene (Place) veröffentlicht. Hierbei wird möglichst mit dem einem Ortsverzeichnis, hier: iDAI.gazetteer [30], verbunden. Dies kann jedoch zu Problemen führen, wenn Fundmünzen in verschiedenen Systemen eingetragen sind. Da aber das Vorgehen zum Verschleiern der Fund-Koordinaten über die Systeme nicht vereinheitlicht wurde, können diese nur bedingt genutzt werden, um Duplikate zu identifizieren. Werden diese Duplikate nicht erkannt, kann dies zu fehlerhaften Auswertungen von Daten aus verschiedenen Quellen führen.
## Use Case E
Die Münzstätte einer Münze ist nicht immer eindeutig, man hat nicht immer einen Namen dazu und weiß auch nicht, wo diese lag. Wenn man jedoch Münzen einheitlich einer soche Münzstätte zuordnen möchte, wird dies in nomisma.org durch sogenannte "uncertain mints" verwirklicht. Man weiß also nicht, wo die Mints waren und ob diese nicht vielleicht auch eine andere benannte Mint sein könnten. Nomisma listet bei der Suche nach “uncertain” für Münzstätten immerhin 232 Treffer auf, z.B. [Uncertain Mint 129](http://nomisma.org/id/uncertain_129_sco). In der RDF-Modellierung zu dieser wird die Unsicherheit noch nicht mit modelliert. Daher wurden in zwei Masterarbeiten [31;32] acht Möglichkeiten untersucht, wie Unsicherheiten in RDF modelliert werden können.
# Referenzen
[1] https://doi.org/10.1038/sdata.2016.18
[2] https://www.adwmainz.de/fileadmin/user_upload/digitale-akademie/graphentechnologien/Bruhn-Unold-Unsicherheit_Graphdatenbanken.pdf
[3] https://doi.org/10.5281/zenodo.6380914
[4] http://dx.doi.org/10.15496/publikation-87762
[5] https://doi.org/10.5281/zenodo.5654897
[6] https://doi.org/10.5281/zenodo.5849841
[7] https://zfdg.de/sb004_004
[8] https://doi.org/10.1023/A:1016740830286
[9] https://doi.org/10.5281/zenodo.3252392
[10] https://www.w3.org/DesignIssues/LinkedData.html
[11] https://codeberg.org/ResearchSquirrels/fuzzy-sl
[12] https://github.com/research-Squirrel-Engineers/fuzzy-sl-ontology
[13] https://fuzzy-sl.wikibase.cloud/
[14] Macalister, RAS. (1945): Corpus Inscriptionum Insularum Celticarum. Vol. I. Dublin: Stationery Office.
[15] MacManus, D. (1997): A Guide to Ogam. Maynooth Monographs 4. Maynooth: An Sagart.
[16] Ziegler, S. (1994): Die Sprache Der Altirischen Ogam-Inschriften. Göttingen: Vandenhoeck and Ruprecht.
[17] https://codeberg.org/ResearchSquirrels/fuzzy-sl/src/branch/main/wikidata/fsl_wikidata_ogham_stone_exsitu_onsitesurvey.png
[18] http://www.wikidata.org/entity/Q106680733
[19] https://openstreetmap.org/node/11071361392
[20] https://fuzzy-sl.wikibase.cloud/wiki/Item:Q67
[21] https://research-squirrel-engineers.github.io/croton-geo/site_3003/
[22] https://doi.org/10.1007/s007100170010
[23] https://doi.org/10.1007/bf02597680
[24] https://t1p.de/vtxub
[25] https://doi.org/10.1016/s1040-6182(00)00066-5
[26] https://doi.org/10.1016/s0377-0273(96)00063-7
[27] https://doi.org/10.1016/j.jvolgeores.2007.10.007
[28] https://doi.org/10.1016/j.yqres.2011.02.005
[29] https://research-squirrel-engineers.github.io/campanian-ignimbrite-geo/cisite_51/index.html
[30] https://gazetteer.dainst.org
[31] https://t1p.de/fsk91
[32] https://t1p.de/yh6us