wiki:e-caudata

ę and æ

Diese Seite setzt die Diskussion von <reg> fort.

Ausgangspunkt

Kann man sagen, dass wir zumindest im Lateinischen eine damals übliche Textgestalt erreichen wollen und dabei Zeichen regularisieren, die damals als reine Abkürzungszeichen empfunden wurden? Zum Beispiel ist ſ Teil der damals üblichen Textgestalt im Lateinischen. Es gibt klare Gebrauchsregeln für ſ, und es ist nicht einfach austauschbar mit s. Das ę ist dagegen ein Abkürzungszeichen, das der Setzer verwendet, wenn ae zuviel Platz wegnimmt. Das æ verhält sich offenbar eher wie ſ als wie ę, zum Beispiel in Formen wie quæ. Muss man dann quę zu quæ statt zu quae regularisieren, genauso wie ſcīa zu ſcientia und nicht zu scientia regularisiert wird? Und ſphęræ zu ſphæræ (diese Form kommt in Benedetti recht oft vor) statt zu ſphaeræ?

The Goal of <reg>

I am trying to regularize a Latin text from 1585. For example, the word "reſiduũ" will be regularised to "reſiduum". In XML, it looks like this: <reg norm="reſiduum">reſiduũ</reg>

An additional automated normalization service will turn "reſiduum" into "residuum", i.e. the modern spelling. The user can choose between the original, regularized and normalized text.

However, I am not sure what to do with the letter ę. It seems to be a simplification of æ which reflects the fact that the Latin diphthong æ had turned into a monophthong. But ę is apparently not an abbreviation of æ, and ę and æ can be used interchangeably in the text. For example, the text contains the words ſphęræ, ſphæræ, ſphęrę and ſphærę.

Does it make sense to regularize ſphęræ to ſphæræ? Pragmatically it would make the regularized version more readable. But is æ more regularized than ę? Would it be better to leave ę unchanged in the regularized version and change both ę and æ to ae in the normalized version?

In general, I am not not sure which goal to achieve with the regularized version, apart from emendations, correcting typos and resolving abbreviations such as "aũt" for "autem". Is it, for example, possible to produce a kind of standardized Neo-Latin?

Neu-Latein

Was wäre denn eine standardisierte neulateinische Textgestalt?

Wikipedia:

Neulatein hält sich im Gegensatz zu Mittellatein an die klassischen Standards: "Den Wortschatz und die Syntax dieser Vorbilder erhoben die Humanisten zu einer verbindlichen Norm. Daher kennt das Neulatein im Unterschied zum Mittellatein keine Sprachentwicklung, sondern ist fixiert." Humanistisches Latein auch schon "ad fontes". Als Nebeneffekt wird Latein von einer lebendigen Sprache (Mittellatein) zur ausgestorbenen Sprache für Gelehrte.

Deutsche und englische Wikipedia können sich dabei nicht auf die Zeiträume für Mittellatein, Humanistisches Latein und Neulatein einigen (siehe auch die Zeitskalen am Ende der jeweiligen Seiten):

Jedenfalls: Im Mittelalter wurde oft e oder auch ę statt æ für den geschwundenen Diphthong geschrieben. Dies wurde von den Humanisten wieder rückgängig gemacht. Man könnte also sagen, dass ę "moderner" ist als æ, und es ist offenbar kein Abkürzungszeichen. Aber es ist dann später bei den Humanisten nicht Teil der erwünschten Textgestalt.

Anderererseits scheint Benedetti im Jahr 1585 diese Ansicht der Humanisten zur Orthographie keinesfalls zu teilen. Was macht man also daraus?

Menota

Menota 2.0 Handbuch: html oder PDF (mit Anhang)

Kap. 3.2, levels of text representation:

  • facsimile = unser Originaltext
  • diplomatic: entspricht nicht wirklich unserem regularisierten Text: Zum Beispiel verschwinden line breaks, das ist bei uns nicht sinnvoll. Und wir wollen nicht italics verwenden, um Änderungen zu markieren.
  • normalized = unser normalized. Schöne Begründung als Standardform moderner Wörterbücher. (Funktioniert das mit Formen wie verò?)

Sollen wir trotzdem die Namen übernehmen? Aber es ist nicht klar, wie standardisiert diese Namen sind. Google-Suche nach "facsimile diplomatic normalized" findet wieder den Autor des Menota-Handbuchs. Also: wie machen es andere? Beachte auch: Das Menota-Handbuch bezieht sich nicht auf gedruckte Bücher, sondern auf Manuskripte.

Anderer Punkt aus diesem Abschnitt: Doch entities statt PUA-Codepoints oder sogar Bildlinks verwenden, die dann evtl. auf PUA-Zeichen verweisen?

Kap. 3.3 / 3.4: deren Idee ist jedenfalls, alle drei Versionen im Dokument explizit anzugeben. Ist das für uns jemals sinnvoll? Eventuell im Griechischen, wo sowieso jedes Wort ein reg-Tag hätte?

Kap 5: Die drei levels, entspricht das unseren textflows? Will sagen, wenn wir doch die drei levels explizit in unserem XML-Text kodieren sollten, hätten wir dann mit unserem Anzeige-Mechanismus für Textflows alles, was wir brauchen? Beziehungsweise andersherum: Wenn wir die Anzeige-Modi implementiert haben, ist es nur ein kleiner Schritt zur Anzeige der Textflows.

Last modified 14 years ago Last modified on Jun 9, 2010, 9:58:57 AM