Annotation of storage/names/file-format.tex, revision 1.7
1.6 casties 1: \documentclass[a4paper]{article}
1.1 casties 2:
3: \usepackage{ngerman}
4:
5: \usepackage[latin1]{inputenc}
6: \usepackage[T1]{fontenc}
7: \usepackage{ae}
8: %\usepackage{times}
9: %\usepackage{courier}
10:
11: % create in-text links in black (with PDF)
1.7 ! casties 12: \usepackage[colorlinks=true,linkcolor=black]{hyperref}
1.1 casties 13: % Format URLs nicely (without PDF)
1.7 ! casties 14: %\usepackage{url}
! 15: % Grafik
! 16: \usepackage{graphicx}
! 17: % Verzeichnis mit Abbildungen
! 18: \graphicspath{{images/}}
1.1 casties 19:
20: \title{Ablage von Massendaten im Archiv- und Backupsystem}
21:
22: \author{Dirk Wintergrün, Robert Casties}
23:
1.7 ! casties 24: \date{V0.10.1 of \today}
1.4 casties 25:
1.1 casties 26: \begin{document}
27:
28: \maketitle
29:
30: \begin{abstract}
1.7 ! casties 31: In diesem Dokument wird die Ablage von Massendaten auf dem
! 32: zentralen Archiv- und Ablagesystem des MPIWG beschrieben
1.1 casties 33: \end{abstract}
34:
35: \tableofcontents
36:
37:
38: \section{Datentypen für die dieses Dokument gilt}
39: \label{sec:datentypen-fur-die}
40:
41:
1.6 casties 42: Die in diesem Dokument definierten Regeln gelten
43: für\footnote{Empfehlungen zu Standards für Datenformate fehlen noch.}
1.1 casties 44:
45: \begin{description}
1.2 casties 46: \item[Archivdaten] die innerhalb der Digitalisierungsprojekte des
1.7 ! casties 47: Instituts anfallen und als Rohdaten oder Produktionsdaten in
! 48: möglichst hoher Qualität ohne ständigen Zugriff langfristig
! 49: gesichert werden sollen (Pfad: \url{archive/data})
1.1 casties 50:
1.6 casties 51: \item[Langfristige Präsentationsdaten] die über das Internet verfügbar
52: gemacht werden sollen und deren URL bzw. URI langfristig stabil
53: gehalten werden sollen (Pfad: \url{online/permanent})
1.1 casties 54:
1.7 ! casties 55:
! 56: \item[Kurzfristige Präsentationsdaten] zu experimentellen Zwecken, die
! 57: kurzfristig und nur für begrenzte Zeit online verfügbar sein sollen
! 58: (Pfad: \url{online/experimental})
1.1 casties 59:
1.6 casties 60: \item[Mirror-Daten] größeren Umfangs, die am Institut im Rahmen von
1.1 casties 61: Kooperationsprojekten gehalten werden und auf die ständiger Zugriff
1.6 casties 62: z.B. zum Zweck der Synchronisation notwendig ist.(Pfad:
63: \url{mirrors})
1.1 casties 64: \end{description}
65:
66:
67: \section{Zugang zum Server}
68: \label{sec:zugang-zum-server}
69:
70: Die Ablage aller genannter Dokumente erfolgt auf dem Fileserver
1.2 casties 71: \texttt{foxridge}, der physisch am FHI steht.
1.1 casties 72:
1.2 casties 73: \begin{itemize}
74: \item Zugang per FTP, SCP, SFTP über:
1.6 casties 75: \url{foxridge.mpiwg-berlin.mpg.de} \\
1.2 casties 76: Zugang zu den Daten in den Verzeichnissen
1.6 casties 77: \url{/mpiwg/archive/data}, \url{/mpiwg/online/permanent},
78: \url{/mpiwg/online/experimental} und \url{/mpiwg/mirrors}
1.2 casties 79:
80: \item Zugang per Appletalk (AFP) über: Auswahl des Servers
81: \texttt{foxridge} in der Zone \texttt{Zentrale Fileserver} \\
1.6 casties 82: Zugang zu den Daten über die Freigaben \url{archive\_data},
83: \url{online\_permanent}, \url{online\_experimental} und
84: \url{mirrors}
1.2 casties 85: \end{itemize}
1.1 casties 86:
87:
88: \section{Benutzerkennung}
89: \label{sec:benutzerkennung}
90:
91: Benutzerkennungen und Passworte für die Ablage der Massendaten werden
1.6 casties 92: projektspezifisch vergeben.\footnote{Eine Regelung für die Vergabe der
93: Zugriffsrechte fehlt noch.}
1.1 casties 94:
95:
96: \section{Erlaubte Zeichen in Datei- und Ordnernamen}
97: \label{sec:erla-zeich-datei}
98:
1.7 ! casties 99: Erlaubte Zeichen in Datei- und Ordnernamen sind Kleinbuchstaben (a-z),
! 100: Großbuchstaben (A-Z), Ziffern (0-9), Bindestrich ("`-"'), Unterstrich
! 101: ("`\_"') und Punkt ("`."'). Andere Zeichen und Leerzeichen sind nicht
! 102: zulässig. Es wird empfohlen für Datei- und Ordnernamen ausschliesslich
1.6 casties 103: Kleinschreibung zu verwenden.
1.1 casties 104:
1.7 ! casties 105: Für die Umsezung von Dateinamen, die anderen Zeichen enthalten wird
! 106: empfohlen alle Leerzeichen durch Bindestriche ("`-"') und andere
! 107: nichtzulässige Zeichen durch Unterstriche ("`\_"') zu ersetzen.
! 108:
1.1 casties 109:
110: \section{Ablage von Archivdaten}
111: \label{sec:ablage-von-arch}
112:
1.2 casties 113: Archivdaten werden nur temporär auf der Festplatte des Servers
1.6 casties 114: gehalten. Nach der Archivierung auf Magnetbänder werden sie von der
1.7 ! casties 115: Festplatte gelöscht. Die Metadaten bleiben auch nach dem Löschen der
! 116: Daten auf der Festplatte. Für Archivdaten ist auf Foxridge der Pfad
1.1 casties 117:
1.7 ! casties 118: \url{/mpiwg/archive/data} bzw. \url{archive_data}
1.1 casties 119:
1.2 casties 120: \noindent vorgesehen.
1.1 casties 121:
1.7 ! casties 122: Die Ablage von Archivdaten erfolgt abhängig davon ob es sich um
! 123: \emph{Rohdaten} oder \emph{Produktionsdaten} handelt.
! 124:
! 125:
! 126: \subsection{Ablage von Rohdaten im Archiv}
! 127: \label{sec:ablage-von-rohdaten}
! 128:
! 129: Als Rohdaten gelten alle Daten, die aus externen Quellen eingekauft
! 130: wurden oder am Institut erzeugt werden und am Anfang eines workflows stehen.
! 131:
! 132: Rohdaten können entweder über ein Web-Frontend oder direkt im
! 133: Filesystem des Servers abgelegt werden. Bei der Ablage über das
! 134: Web-Frontend wird ein Metadaten-File automatisch erzeugt. Bei der
! 135: Ablage "`von Hand"' auf dem Server kann ein Metadaten-File
! 136: nachträglich mit Hilfe eines Web-Frontends erzeugt werden.
! 137:
! 138: Die wichtigste Information über die Rohdaten ist ihre Quelle, die in
! 139: einem \texttt{acquisition} Metadaten-Element beschrieben wird.
! 140: Außerdem müssen, je nach Medientyp verschiedene technische Angaben
! 141: über die abgelegten Daten erfolgen.
! 142:
! 143: Weitere inhaltliche Metadaten, wie eine bibliographische Bestimmung
! 144: erhalten zunächst nur den Metadaten-Status "`vorläufig"'
! 145: (\texttt{wf-status} \texttt{preliminary}).
! 146:
! 147:
! 148: \subsubsection{Erste Ebene: Provider}
! 149: \label{sec:ebene-provider}
! 150:
! 151: Die Rohdaten werden im Filesystem des Servers in Ordnern entsprechend
! 152: ihrer Quelle, ihres \emph{Providers} abgelegt. Bei externen
! 153: Lieferungen ist der Lieferant direkt als Provider angesehen
! 154: werden. Das gleiche gilt z.B. für Arbeiten der Digitalisierungsgruppe der
! 155: Bibliothek. Bei Arbeiten, die im Rahmen von Projekten von einzelnen
! 156: Mitarbeitern im Haus erstellt werden, liegt es in der Verantwortung
! 157: der Projekte einen Provider-Namen zu benennen.
! 158:
! 159: Zur Vereinheitlichung der Provider-Bezeichnungen wird ein zentrales
! 160: Verzeichnis mit Provider-Namen und IDs erstellt.
1.1 casties 161:
162:
1.7 ! casties 163: \subsubsection{Zweite Ebene: Dokumente}
! 164: \label{sec:ebene-dokumente}
1.1 casties 165:
1.7 ! casties 166: Unterhalb der Provider-Ebene werden Dokumente nach ihrer ID abgelegt.
! 167: Zu diesem Zweck erhalten alle Dokumente eine \texttt{archive-id}, eine
! 168: eindeutige achtstellige Zeichenfolge, vom Archiv"=ID"=Server
1.1 casties 169:
1.7 ! casties 170: \url{http://content.mpiwg-berlin.mpg.de/archive/ids}.
1.1 casties 171:
1.7 ! casties 172: \noindent Wenn die Daten direkt im Filesystem abgelegt werden muss vor der
! 173: Ablage im Webfrontend des ID-Servers eine Archiv-ID für das Dokument
! 174: reserviert werden.
1.6 casties 175:
1.7 ! casties 176: \begin{figure}[htbp]
! 177: \centering
! 178: \includegraphics[width=0.6\textwidth]{archive-dirs}
! 179: \caption{Verzeichnisstruktur für den Rohdaten-Archivbereich}
! 180: \label{fig:dir-arch-raw}
! 181: \end{figure}
1.1 casties 182:
1.7 ! casties 183: Die Rohdaten werden in einzelne Verzeichnisse gelegt, die jeweils
! 184: einzelnen Dokumenten entsprechen. Als Verzeichnisname wird die
! 185: \texttt{archive-id} verwendet. Je nach Art der Daten sollten
! 186: Unterordner nach den Empfehlungen in
! 187: Abschnitt~\ref{sec:dritte-eben-unter} angelegt werden. Für die
! 188: Dateinamen gelten ebenfalls die in
! 189: Abschnitt~\ref{sec:vierte-eben-date} angegebenen Regeln.
1.1 casties 190:
1.7 ! casties 191: Einen schematischen Überblick über die Verzeichnisstruktur zeigt
! 192: Abbildung~\ref{fig:dir-arch-raw}.
1.1 casties 193:
194:
1.6 casties 195:
1.7 ! casties 196: \subsection{Ablage von Produktdaten im Archiv}
! 197: \label{sec:ablage-von-produkt}
1.6 casties 198:
1.7 ! casties 199: \subsubsection{Erste Ebene: Projekte}
! 200: \label{sec:erste-eben-proj}
1.1 casties 201:
1.7 ! casties 202: Für jedes Projekt, das als Datenproduzent Archivdaten ablegen will,
! 203: wird ein Ordner mit dem Namen des Projektes angelegt:
1.1 casties 204:
1.7 ! casties 205: \url{archive/data/PROJEKTNAME}
1.1 casties 206:
1.7 ! casties 207: \noindent Bsp: das Humboldtprojekt
1.1 casties 208:
1.7 ! casties 209: \url{archive/data/humboldt}
1.1 casties 210:
1.7 ! casties 211: \noindent Innerhalb des eigenen Projektordners kann das Projekt, wenn nötig,
! 212: weitere Unterordner zur Untergliederung der Dokumente anlegen.
1.1 casties 213:
214:
1.7 ! casties 215: \subsubsection{Zweite Ebene: Dokumente}
! 216: \label{sec:zweite-eben-dokum}
1.1 casties 217:
1.7 ! casties 218: Für jedes abzulegende Dokument wird unterhalb des Projektordners ein
! 219: weiterer Ordner angelegt. Die Benennung dieser Ordner ist Teil des
! 220: Workflows des jeweiligen Projekts. Möglich die Verwendung
! 221: der \texttt{archive-id} als Ordnername analog zur Ablage der Rohdaten
! 222: (siehe Abschnitt~\ref{sec:ebene-dokumente}) aber auch andere Schemas.
! 223:
! 224: Jedes zu archivierende Dokument muss eine \texttt{archive-id}
! 225: haben. Bevor ein neuer Ordner für ein neues Dokument angelegt wird,
! 226: sollte vom Archive-ID-Server eine neue \texttt{archive-id} reserviert
! 227: werden.
1.1 casties 228:
229:
1.7 ! casties 230: \subsubsection{Dritte Ebene: Unterordner}
1.1 casties 231: \label{sec:dritte-eben-unter}
232:
1.2 casties 233: Innerhalb des Dokumentenordners werden weitere Unterordner für den
234: jeweiligen Datentyp angelegt:
1.1 casties 235:
1.6 casties 236: \url{TYPE}
1.1 casties 237:
1.2 casties 238: \noindent oder
1.1 casties 239:
1.7 ! casties 240: \url{TYPE-sernr}
1.1 casties 241:
1.2 casties 242: \begin{description}
1.7 ! casties 243: \item[TYPE] sollte den Inhalt beschreiben z.B \url{img} oder
! 244: \url{pageimg} für Scans einzelner Seiten oder \url{ocr} für
! 245: OCR-Texte oder \url{meta} für einzelne Metadaten-Dateien zu
! 246: Dateien in den anderen Ordnern.
1.1 casties 247:
1.2 casties 248: \item[sernr] eine Seriennummer falls mehrere
1.7 ! casties 249: Imagesätze zu einem Dokument gehören
1.2 casties 250: \end{description}
1.1 casties 251:
1.7 ! casties 252: \noindent Außerdem muss in jedem Dokumentenordner eine Datei
1.1 casties 253:
1.6 casties 254: \url{index.meta}
1.1 casties 255:
1.7 ! casties 256: \noindent liegen, die Metadaten zum Ordner selbst enthält. Das Format dieser
1.6 casties 257: Metadaten"=Datei ist im Dokument "`A simple metadata format for
1.7 ! casties 258: resource
! 259: bundles"'\footnote{\url{http://pythia.mpiwg-berlin.mpg.de/projects/storagesystem/metadaten.html}}
! 260: beschrieben.
1.1 casties 261:
262:
1.7 ! casties 263: \subsubsection{Vierte Ebene: Dateien in den Ordnern}
1.1 casties 264: \label{sec:vierte-eben-date}
265:
1.7 ! casties 266: Für Dateinamen gilt als Mindestanforderung, dass der Dateiname nur aus
! 267: zulässigen Zeichen besteht und die Dateiendung den Dateityp anzeigt.
! 268: Die alphabetische Ordnung der Namen muss der Reihenfolge der Daten
! 269: entsprechen. Nummerierte Dateien sollten daher Namen mit führenden
! 270: Nullen erhalten, z.B. \url{00001.jpg}. Empfohlen wird folgende
! 271: Benennung:
! 272:
! 273: \url{imagenummer.SUFFIX}
! 274:
! 275: \noindent Imagenummer ist eine fünfstellige Zahl. Das Suffix muss den
! 276: Dateityp angeben. Eine (nicht erschöpfende) Liste von Dateitypen zeigt
! 277: Tabelle~\ref{tab:benennung-dateien}.
1.1 casties 278:
279: \begin{table}[htbp]
280: \centering
281: \begin{tabular}{ll}
282:
1.2 casties 283: suffix & Dateityp\\ \hline
1.1 casties 284:
1.7 ! casties 285: \texttt{jpg}, \texttt{jpeg} & JPEG-Bilddateien\\
1.2 casties 286:
1.7 ! casties 287: \texttt{tif}, \texttt{tiff} & TIFF-Bilddateien \\
1.2 casties 288:
1.6 casties 289: \texttt{png} & PNG-Bilddateien
1.1 casties 290: \end{tabular}
1.2 casties 291: \caption{Dateiendungen}
292: \label{tab:benennung-dateien}
1.1 casties 293: \end{table}
294:
295:
296: \section{Ablage der Onlinedaten}
297: \label{sec:ablage-der-onlin}
298:
299: Für Daten die für die direkte Präsentation im Netz vorgesehen sind,
1.2 casties 300: werden auf foxridge zwei Pfade angeboten:
1.1 casties 301:
1.6 casties 302: \url{online/experimental}
1.1 casties 303:
1.2 casties 304: \noindent und
1.1 casties 305:
1.6 casties 306: \url{online/permanent}
1.1 casties 307:
1.2 casties 308: \noindent Für Dokumente, die nur temporär präsentiert werden sollen,
1.7 ! casties 309: ist \url{online/experimental} vorgesehen. Pfade innerhalb dieses
1.2 casties 310: Bereiches können verändert und gelöscht werden.
311:
312: Für Dokumente, die auf längere Zeit im Netz bleiben sollen, ist
1.6 casties 313: \url{online/permanent} vorgesehen. Pfade in diesem Bereich dürfen
1.2 casties 314: nicht geändert oder gelöscht werden, Dokumente dürfen nicht verschoben
1.6 casties 315: oder umbenannt werden.
1.1 casties 316:
1.6 casties 317: Die interne Struktur der Projekt- und Dokumentordner in
318: \url{online/permanent} entspricht der in
319: Abschnitt~\ref{sec:ablage-von-arch} dargestellten Struktur von
320: \url{archive/data}.
1.1 casties 321:
322:
323:
1.7 ! casties 324: \section{Workflow: Scannen durch die Digitalisierungsgruppe}
1.3 casties 325: \label{sec:workflow-fur-die}
326:
1.7 ! casties 327:
1.3 casties 328: Größere Mengen von Büchern und Manuskripten werden von der
1.6 casties 329: Digitalisierungsgruppe der Bibliothek in hoher Qualität gescannt.
330: Diese Digitalisierungen erfolgen im Auftrag von Projektem, einzelnen
331: Forschern oder auf eigene Initiative der Bibliothek. Die Digitalisate
1.7 ! casties 332: werden zunächst in drei verschiedenen Formen erzeugt.
! 333:
! 334: \subsection{Typen von Bilddaten}
! 335: \label{sec:daten-typen}
1.3 casties 336:
337: \begin{itemize}
338: \item Als \emph{Roh-Image} in hoher Auflösung direkt aus dem Scanner,
1.7 ! casties 339: ohne weitere Nachbearbeitung\footnote{Die Digitalisierungsgruppe
! 340: dokumentieren dazu welche Arbeits- und Bearbeitungsschritte bei
! 341: welchem Gerät als integraler Teil des Scanvorgangs betrachtet
! 342: werden.}. Diese Dateien sind nicht für die weitere Nutzung durch
! 343: Andere gedacht und sollen nur archiviert werden.
1.3 casties 344:
345: \item Als \emph{User-Image} in hoher Auflösung mit Nachbearbeitung wie
346: Farbkorrektur und Schärfung. Diese Dateien sind für die weitere
347: Nutzung durch die Projekte gedacht und sollen ebenfalls archiviert
348: werden.
349:
350: \item Als \emph{Online-Image} in reduzierter Auflösung für die
351: Online-Präsentation. Diese Dateien können ebenfalls durch andere
352: Projekte genutzt werden und müssen online zur Verfügung stehen.
353: \end{itemize}
354:
355: Die Scan-Arbeiten und die Erzeugung der Roh- und User-Images werden
1.7 ! casties 356: von der Digitalisierungsgruppe selbständig durchgeführt.
1.3 casties 357:
358:
1.7 ! casties 359: \subsection{Ablage und Übergabe der Rohdaten}
! 360: \label{sec:ablage-und-ubergabe}
1.3 casties 361:
362: \begin{enumerate}
363: \item Die Digigruppe erstellt Roh- und User-Images auf lokalen Platten
364: oder Bereichen für Bewegungsdaten.
365:
366: \item Die Digigruppe kopiert Roh-Images und User-Images in einen
1.7 ! casties 367: Dokumenten-Ordner mit den notwendigen Metadaten und einer neuen
! 368: Archiv-ID nach den Regeln in Abschnitt~\ref{sec:ebene-dokumente} im
! 369: Bereich \url{archive/data/library}. Roh-Images werden in einem
! 370: Unterordner \url{raw} abgelegt und User-Images in \url{pageimg}.
! 371:
! 372: \item Die Digigruppe benachrichtigt den Auftraggeber (wenn im Auftrag)
! 373: über den Ablageort der Daten.\footnote{Idealerweise würden die Roh-Images
! 374: bereits archiviert und von der Platte gelöscht während die User-Daten erhalten
1.6 casties 375: bleiben.}
376:
377: \item Der Auftraggeber verwendet die User-Images. Veränderte Formen
378: der Images erstellt und archiviert der Auftraggeber in seiner
379: eigenen Projekt"=Hierarchie.
380:
381: \item Der Auftraggeber veranlasst die vollständige Migration (Löschung
382: von der Festplatte) der von der Digigruppe erstellten Daten sobald
383: sie nicht mehr direkt verwendet werden.
1.3 casties 384: \end{enumerate}
385:
386:
387:
388: \subsection{Ablage der Online-Images}
389: \label{sec:ablage-der-online}
390:
1.6 casties 391: Die Erstellung und Ablage der Online"=Images erfolgt je nach Absprache
1.3 casties 392: mit dem Projekt
1.6 casties 393:
1.3 casties 394: \begin{itemize}
1.6 casties 395: \item als fertige Images in der Online"=Hierarchie der Bibliothek, wenn
1.3 casties 396: es ein Auftrag durch ein Projekt ohne eigene Online-Präsenz ist
397:
398: \item als fertige Images im Archivbereich bei den User-Images in einem
1.7 ! casties 399: Ordner \url{jpg} (o.ä.) zur Nutzung durch das Projekt in seinem
1.3 casties 400: Online-Bereich
401:
402: \item für Projekte, die selbst weiter verarbeitete Online-Images zur
403: Verfügung stellen werden keine Online-Images erzeugt.
404: \end{itemize}
405:
406:
1.7 ! casties 407:
! 408: \section{Erfassung der Metadaten für Archivdaten}
! 409: \label{sec:use-case-workflow}
! 410:
! 411:
! 412: \subsection{Abfrage der Metadaten}
! 413: \label{sec:abfr-der-metad}
! 414:
! 415: Den Entscheidungsbaum der Metadaten-Abfrage zeigt
! 416: Abbildung~\ref{fig:arch-meta-abfrage}.
! 417:
! 418: \begin{figure}[htbp]
! 419: \centering
! 420: \includegraphics[width=\textwidth]{meta-decision}
! 421: \caption{Entscheidungsbaum der Metadaten-Abfrage für Archivdaten}
! 422: \label{fig:arch-meta-abfrage}
! 423: \end{figure}
! 424:
! 425:
! 426: \subsubsection{Dokumentenstatus: Rohdaten}
! 427: \label{sec:dokum-rohd}
! 428:
! 429: Als Rohdaten gelten alle Daten, die aus externen Quellen eingekauft
! 430: wurden oder am Institut erzeugt werden und am Anfang eines möglichen
! 431: workflows stehen.
! 432:
! 433: Zu Rohdaten müssen weitere Informationen für einen
! 434: \texttt{acquisition} Block in den Metadaten eingegeben werden:
! 435:
! 436: \begin{description}
! 437: \item[acquisition] the acquisition source of this resource -- required
! 438: \begin{description}
! 439: \item[provider] where this resource came from --required
! 440: \begin{description}
! 441: \item[name] free-text name of the provider (institution or
! 442: individual)
! 443:
! 444: \item[address] address of the provider
! 445:
! 446: \item[contact] contact person at the provider (i.e. name and email)
! 447:
! 448: \item[url] URL related to the provider
! 449: \end{description}
! 450:
! 451: \item[date] date of acquisition -- required
! 452:
! 453: \item[description] free-text description of the acquisition source or
! 454: additional information
! 455:
! 456: \item[provider-id] id of the provider (internally used) -- deduced
! 457: \end{description}
! 458: \end{description}
! 459:
! 460:
! 461: \subsubsection{Dokumentenstatus: Verarbeitete Daten}
! 462: \label{sec:dokum-verarb-daten}
! 463:
! 464: Wenn die verarbeiteten Daten aus bereits abgelegten Rohdaten erzeugt
! 465: wurden, dann sollte ein Hinweis auf das Rohdaten-Verzeichnis im Tag
! 466: \texttt{derived-from} angebracht werden.
! 467:
! 468: \begin{description}
! 469: \item[derived-from] Container for the description of the original
! 470: resource if this resource is a modified version of another resource
! 471: -- required for processed data.
! 472:
! 473: \begin{description}
! 474: \item[archive-id] The ID of the original resource
! 475: -- required.
! 476:
! 477: \item[archive-path] The full path to the original resource
! 478: -- deduced.
! 479:
! 480: \item[description] An informal textual description of the relation
! 481: of this resource to the original resource -- optional.
! 482: \end{description}
! 483: \end{description}
! 484:
! 485:
! 486: \subsubsection{Medientyp: Video}
! 487: \label{sec:medientyp-video}
! 488:
! 489: Filme haben den Medientyp \texttt{video}. Sie können zusätzlich mit
! 490: Metadaten in einem \texttt{film-acquisition} Metadaten-ELement
! 491: beschrieben werden.
! 492:
! 493: \begin{description}
! 494: \item[film-acquisition] description of a (documentary) film --
! 495: required for documentary film
! 496: \begin{description}
! 497: \item[recording] specification of the recording process
! 498: \begin{description}
! 499: \item[author] the person or persons doing the recording
! 500:
! 501: \item[date] the date or time span when the film was recorded
! 502:
! 503: \item[location] the place where the film was recorded
! 504:
! 505: \item[device] recording device used (e.g. ``Sony CP-DV8 Camcorder'')
! 506:
! 507: \item[format] format of the recorded film -- required (e.g. ``DV 720x524 25fps
! 508: interlaced'')
! 509: \end{description}
! 510:
! 511: \item[description] free-form description of the recording and the
! 512: content of the film
! 513: \end{description}
! 514: \end{description}
! 515:
! 516:
! 517: \subsubsection{Medientyp: Audio}
! 518: \label{sec:medientyp-audio}
! 519:
! 520: Für den Medientyp \texttt{audio} exisitieren noch keine
! 521: Metadaten-Vorschläge.
! 522:
! 523:
! 524:
! 525: \subsubsection{Medientyp: Image}
! 526: \label{sec:medientyp-image}
! 527:
! 528: Der Medientyp \texttt{image} ist für Einzelbilder und Gruppen von
! 529: Bildern gedacht, die kein Buch o.ä. darstellen.
! 530:
! 531: Für die Beschreibung der Erfassung und das Format der digitalisierten
! 532: Bilder gibt es die Metadaten-Elemente \texttt{image-acquisition} und
! 533: \texttt{img}.
! 534:
! 535: \begin{description}
! 536: \item[image-acquisition] description of the image production process
! 537: -- required
! 538: \begin{description}
! 539: \item[device] acquisition device (e.g. ``flatbed scanner'')
! 540:
! 541: \item[image-type] type and color-depth of the image -- required (e.g. ``RGB 24
! 542: bit'')
! 543:
! 544: \item[production-comment] additional textual information about the
! 545: production process
! 546: \end{description}
! 547: \end{description}
! 548:
! 549: \begin{description}
! 550: \item[img] digital image information.
! 551:
! 552: \begin{description}
! 553: \item[original-size-x] The width of the original
! 554: image -- required. \\
! 555: The unit of measure can be contained as parameter \texttt{unit},
! 556: the default is meter ``m''. The width to be considered is the
! 557: total width of the scanned area.
! 558:
! 559: \item[original-size-y] The height of the original image -- required.
! 560:
! 561: \item[original-pixel-x] The width of the hi-res scan in pixels -- deduced.
! 562:
! 563: \item[original-pixel-y] The height of the hi-res scan in pixels -- deduced.
! 564: \end{description}
! 565: \end{description}
! 566:
! 567: Für die Inhaltliche Erfassung von Bildern gibt es bisher keinen
! 568: Metadaten-Vorschlag.
! 569:
! 570:
! 571: \subsubsection{Medientyp: Text}
! 572: \label{sec:medientyp-text}
! 573:
! 574: Für Volltexte, d.h. maschinenlesbaren Text in verschiedenen Formaten
! 575: ist der Medientyp \texttt{text} gedacht.
! 576:
! 577: Die inhaltliche Erfassung erfolgt über das Metadaten-Element
! 578: \texttt{bib} mit verschiedenen Untertypen, das sich an der
! 579: Projektbibliographie des MPIWG orientiert.
! 580:
! 581:
! 582:
! 583: \subsubsection{Medientyp: Scanned Text}
! 584: \label{sec:medi-scann-text}
! 585:
! 586: Zum Medientyp \texttt{scanned-text} gehören alle gescannten Bilder von
! 587: Texten, die als Text behandelt werden.
! 588:
! 589: Die Medienerfassung orientiert sich am Medientyp \texttt{image} mit
! 590: den Elementen \texttt{image-acquisition} und \texttt{img}.
! 591:
! 592: Die inhaltliche Erfassung orientiert sich am Medientyp \texttt{text}
! 593: mit dem \texttt{bib} Element.
! 594:
! 595:
! 596: \subsubsection{Medientyp: other}
! 597: \label{sec:medientyp-other}
! 598:
! 599: Die Vergabe und Behandlung von Medientypen sollte flexibel und
! 600: erweiterbar sein.
1.3 casties 601:
602:
1.1 casties 603: \end{document}
604:
605:
606:
607: %%% Local Variables:
608: %%% mode: latex
609: %%% TeX-master: t
610: %%% End:
611:
FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>