normalization/6 – MPIWG-MPDL Content Project

Context Navigation

Version 4 (modified by Wolfgang Schmidle, 14 years ago) (diff)
--

	Transkription		<reg> (im XML)		Normalisierung (System)		Kommentar
	Rohtext	nachbearbeitet	@faithful	@norm	Anzeige	Donatus/Pollux
		Original	faithful	Regularized	Normalized

Latein	vnum		= 1)		unum		v wird zwischen Konsonanten zu u
	periti{$s}imo	peritißimo	=		peritissimo		ß in Latein wird normalisiert
	aër		=		aer	aer 2)	Trema
	verò		=		vero	vero 2)	Gravis
	re$iduũ	reſiduũ		reſiduum	residuum		Tilde
	re$idu\~u	reſiduũ		reſiduum	residuum		andere Schreibweise im Rohtext
	$ph{ae}ræ	ſphęræ	=		sphaerae		ę verschwindet erst in der Normalisierung
	{quis}	ꝙ		u.a. quod	=		MUFI, offizielles Unicode-Zeichen
	idem\'{que}	idem́		idemque	=		MUFI, PUA
		ſcīa		ſcientia	scientia		type="wordlist"
	<001>dã	ꝗdã		quidam	=		MUFI-Zeichen als Teil eines Wortes

Chinesisch	歴 (6B74)		=		歷 (6B77)		Zeichenvariante in Unicode
	中<国V>	中{国V} (中国) 3)	中{⿴口玉} 4)		=		Zeichenvariante nicht in Unicode

Griechisch	{πρ}ός	{πρ}ός (πρός)	{πρ}ός		=		einfache Ligatur
	ἀλλὰ ...		=		=	ἀλλά ...	Gravis wird für Wörterbuch zu Akut

"=" in Regularisierung: es gibt kein <reg>, d.h. Regularized = Original (das gilt auch, wenn es kein @norm gibt); "=" in Normalisierung: die Wortform wird nicht normalisiert
falls möglich, verwende die Diakritika zur Lemma-Disambiguierung
in Original-Spalte in Klammern: neues Original, sobald es <reg> mit faithful-Attribut gibt
automatisiert eventuell eine Zwischenstufe 中<reg faithful="{国}" type="unresolved">国</reg>, damit die Suche nicht bricht; per Hand <reg faithful="中{⿴口玉}">中国</reg> (Wortgrenzen beachten, IDS-Sequenz einfügen)