wiki:authority-file

Version 5 (modified by Wolfgang Schmidle, 14 years ago) (diff)

--

1. Text

Was soll man im Text markieren?

Entscheidung für Song Yingxing: Wir markieren, was Dagmar in der Papierversion markiert hat. Dabei sind die Markierungen so fein wie möglich. Zusammenfassen kann man mehrere Markierungen immer noch, aber das wird wahrscheinlich erst mit einem overlay passieren, insbesondere um verschachtelte Markierungen im Text zu vermeiden.

Deutsches Pseudo-Beispiel: Dü Kö Bo (drei abgekürzte Ortnamen) für die Region zwischen Düsseldorf, Köln und Bonn. Markiert als (Dü)(Kö)(Bo). Die Markierung (DüKöBo?) kommt dann im overlay dazu )und die Markierungen, die schon im Text sind, werden in ein overlay umgewandelt)

Auch "beifang" markieren, solange wir kein overlay tagging haben. Unabhängig davon, ob es "Norden" meint oder eine konkrete Region. (Dagmar weiß, dass es eine konkrete Ortsangabe ist.)

Der Plan ist jedenfalls, möglichst bald auf overlays umzusteigen. (Der XML-Text muss allerdings lesbar bleiben.) Bis dahin: minimal und effizient bleiben.

Wie soll es im Text markiert werden?

Wir sind bisher alle zufrieden mit der Entscheidung, im Text nur eine eindeutige ID zu vergeben und den Rest in der zugehörigen Tabelle zu machen.

(IDs kürzen, z.B. jeweils "N40" weglassen? Problem verschwindet mit overlays, also eher nicht kürzen)

was kann man verschieben, bis es einen overlay-Mechanismus gibt?

Wir versuchen nicht, mögliche zukünftige Wünsche wie die Markierung von Münzämtern schon jetzt zu erfüllen.

2. Tabelle

Was soll in der zugehörigen Tabelle stehen?

Spalten:

  • Schreibweise im Text
  • ID aus dem Text
  • Verweis auf eine Zeile im authority file
  • Angaben, die für diesen einen Eintrag gelten

Wie wird eine Tabelle für Song Yingxing erstellt?

Ausgangspunkt: Liste aller <place> tags im Text. Erstellbar entweder mit dem Anzeigesystem oder mit oXygen. Beides ist ein bisschen umständlich. Bei oXygen erhält man die Zeilennummern dazu.

Wie können Forscher selber Tabellen erstellen?

Mit overlay: Sie markieren "einfach" interaktiv die Stellen, die sie interessant finden, und daraus wird ein overlay mit zugehöriger Tabelle erzeugt. Eventuell sind overlay und Tabelle auch ein und dasselbe.

Verhältnis von Markierungen und Volltextsuche: Insbesondere sollte es die Möglichkeit geben, das Ergebnis einer Volltextsuche zu einem overlay zu machen. Dieses overlay kann dann noch bearbeitet werden.

Aber die Daten sollten mappable sein. Eventuell sollten wir die Forscher in die richtige Richtung leiten.

Allgemein: Wie trägt man zusätzliche Informationen ein? basic suggestion: identifiable (was meint das?), standardized, sollte anzeigbar sein. Sollte maschinenelesbar sein.

3. Authority File

wie soll das authority file aussehen?

Spalten:

  • point
  • polygon
  • im Text genau bestimmt? ja, ungefähr, nein aber hat einen Ort, hat keinen Ort (z.B. mythical)
    • oder: real place versus mythical place, precisely known versus inexact
  • vom Forscher genauer/anders bestimmt? wieder: Point, Polygon
  • alle möglichen Namen: Beijing, Jing, Beiping, etc.
    • Beachte: zum Beispiel Jing kommt auch in anderen Einträgen vor.
    • Problem von metaphorischen Namen, die nur einmal irgendwo vorkommen ("echt" versus" literarisch).

Wäre Nanfang ein Beispiel, wo der Text es nur lose lokalisiert, und der Forscher weiß es genauer? ODer kann man sagen, dass es schon im Text "eigentlich" genauer angegeben bzw. gemeint ist?

Beziehungen von Einträgen

  • refines, isRefinedBy: Zum Beispiel Peking-Münzamt refines Peking. Suche nach Peking-Münzamt findet nicht Peking, aber Suche nach Peking findet Peking-Münzamt. (Ist das richtig so?)
    • eventuell die Liste von Dublin Core durchgehen (Abschnitt 1). Andersrum: Was Dublin Core nicht für nötig hält, muss sich besonders rechtfertigen.
  • associatedWith, hasBeenAssociatedWith
  • generisches Peking (ohne Zeitangabe) versus (zeitlich) konkrete Pekings: Zum Beispiel Beiping, oder Peking der Song-Dynastie.
  • Generisches Beijing als reiner "Container"; würde in der Tabelle gewählt werden, wenn es automatisch markiert wird, und könnte dann vom Forscher auf eine konkretere Angabe geändert werden.
  • Genauso für Provinzen, dort auch veränderte Grenzen (und Namensänderungen).

Situationen, die entweder schon aufgetreten sind oder sicher auftreten werden

  • Bejing 1500-1700, "touches" Beijing 1600-1800 ??

Wie können Forscher Einträge ins authority file machen?

Verhindere insbesondere unstimmige Einträge oder Dubletten. Erlaube andererseits z.B. weitere Untereinträge von Peking.

Wie kann man das authority file verwenden, um einen Text automatisch zu markieren?

Skript: werte die Namen im authority file aus, also Beijing, Beiping, etc.

Problem der metaphorischen Namen, wenn also etwas 99x das eine und nur 1x das andere meint: vom Skript erzeugte Liste manuell nachbessern.

4. Anzeige

Leute können zum Beispiel wählen, ob sie die Lokaliserungen im Text und/oder des Forschers sehen wollen.