wiki:2010-04-15 GIS meeting

Version 2 (modified by Klaus Thoden, 15 years ago) (diff)

--

Nachträgliches Protokoll GIS-Treffen 15.4.2010

Wolfgang Schmidle 6.5.2010

Anwesend FK JW WS

Markierung von GIS-Information im Text

Gesucht ist ein Standard, wie place, time, event, person in einem XML-Dokument markiert werden. Falk: Für place, time, event können wir GML 3.2.1 als blackbox nehmen, siehe http://schemas.opengis.net/, anerkannt von OGC.

Wie heißen die Elemente dort? Was für Attribute sind dort erlaubt? --> Falk wird nachschauen. Vorläufig: <gml:place>? Dann klären: Welche Teilmenge der Attribute verwenden wir? Wolfgang: wenn möglich nur Verweis auf authority file, keine Koordinaten im XML-Text. (Im experimentellen Echo-Schema ist noch beides erlaubt.)

Falk: In China Historical GIS ist es vorgesehen, dass places vom Type object sind, also Punkt oder Polygon. Wie sieht das konkret im Text und in CHGIS aus? --> Falk wird nachschauen.

time: unterscheiden, was man 1) automatisch markieren kann ("1637"), und was man 2) im scholarly workflow markieren kann ("ca. 1637"). Problem der verschiedenen Kalender.

Was machen wir mit person? Am besten etwas, was auch ein PND/GND-Attribut erlaubt. Gibt es etwas, was alle vier Kategorien (place, time, event, person) hat? Nachtrag: Dirk erwähnt CIDOC CRM, siehe http://cidoc.ics.forth.gr/official_release_cidoc.html --> Falk wird sich darum kümmern.

Im Beispieltext Song Yingxing 1637 werden wir uns allerdings erstmal auf place beschränken. Falk (Nachtrag: Madlen, siehe unten) wird die Ortsnamen nach einer vorgegebenen Liste markieren. Eine rein automatische Markierung, die nicht einfach die Zeichenfolgen aus der Wortliste markiert, scheint noch nicht zuverlässig genug zu funktioneren. Bevor die Orte vollständig markiert werden, endgültige Version des Textes abwarten. Dann: Text ist in <head> und <s>.

Nachtrag: Madlen übernimmt die Bearbeitung des Textes. Zurzeit bereitet sie den Text auf, damit der Text besser den Bildern entspricht. Anschließend wird der Text von Wolfgang wieder schema-konform gemacht, zum Beispiel wird <sm> innerhalb von <p> in <anchor> und <note> umgewandelt. (Text kann dann auch in <note> sowie in <caption> und <description> stehen; allgemein: überall, wo xml:space="preserve" steht.) Danach markiert Madlen die Ortsnamen im Text.

Markierung als Elemente im XML-Text oder als overlay? Wolfgang: Erstmal im Text, denn niemand weiß, wie overlay genau funktionieren soll, und die Infrastruktur ist noch nicht da.

Zusammenspiel von Josefs und Falks System

Minimalbeispiel erstellen: Text, in dem ein einziger Ort markiert ist. (Nachtrag: Falk kann seinen Teil aber auch ganz ohne Beispieltext machen, und es wird dann mit einer per Hand erstellten URL getestet.)

Szenario: In der Zeile

<s xml:id="N404318">北​京​有​磨​法,</s>

wurde ein Ort markiert:

<s xml:id="N404318"><gml:place authority="1234">北​京</gml:place>​有​磨​ 法,</s>

In Josefs System wird 北京 als link dargestellt. Wenn der user diesen link anklickt, wird er zu Falks System geleitet, wo 北京 auf der Karte angezeigt wird. Parameterübergabe über die URL. Falk möchte als Informationen:

  1. den Ortsnamen: 北京
  2. den Eintrag im authority file: 1234
  3. die Fundstelle im Text:
    1. Datei (!SongYingxing_1637.xml, mit komplettem link zu Josefs System??),
    2. Seite (irgendwie aus <pb file="X06.01.149B" n="300"/>, Problem bei Begriffen wie 北<pb/>京)
    3. Satz-ID: N404318

Die Fundstelle ist nötig für den Rückverweis von Falks zu Josefs System: Link von der Karte zur Suche im Text, oder zum Satz, aus dem der Begriff steht (also die entsprechende Textseite, und der Satz ist markiert). Das ist allerdings nicht so dringend wie der Verweis von Josefs zu Falks System.

--> Josef und Falk werden zusammen die Details der API klären.

Möglich wäre dann auch ein Knopf in Josefs System: zeige eine Karte mit allen Orten im Text. Dynamisch erzeugt, eventuell bewahrt sich Josefs System eine statische Kopie auf.

Nachtrag: Beachte, dass die obige Textzeile invisible spaces enthält. --> Man müsste klären, ob zum Beispiel innerhalb eines als Ort markierten und damit als Wort erkannten Begriffs noch ein invisible space stehen sollte. Und ist der invisible space zum Beispiel nach </gml:place> noch nötig? Jedenfalls sollten wir davon ausgehen, dass die invisible spaces irgendwann entweder ganz aus dem Text verschwinden, weil sie nicht mehr nötig sind, oder nur noch bei Wortgrenzen stehen. Dann könnte man den invisible space in 北京 entfernen, würde aber den invisible space zwischen </gml:place> und ​有​ drinlassen.

Was soll passieren, wenn der user auf eine Zeitangabe wie 1920 klickt? Unklar; man braucht Bezug/Kontext?. Nochmal überlegen. (Gibt es schon Lösungen woanders?)