Annotation of storage/names/file-format.tex, revision 1.1
1.1 ! casties 1: \documentclass[a4paper, abstracton]{scrartcl}
! 2:
! 3: \usepackage{ngerman}
! 4:
! 5: \usepackage[latin1]{inputenc}
! 6: \usepackage[T1]{fontenc}
! 7: \usepackage{ae}
! 8: %\usepackage{times}
! 9: %\usepackage{courier}
! 10:
! 11: % create in-text links in black (with PDF)
! 12: %\usepackage[colorlinks=true,linkcolor=black]{hyperref}
! 13: % Format URLs nicely (without PDF)
! 14: %\usepackage{url}
! 15:
! 16: \title{Ablage von Massendaten im Archiv- und Backupsystem}
! 17:
! 18: \author{Dirk Wintergrün, Robert Casties}
! 19:
! 20: \begin{document}
! 21:
! 22: \maketitle
! 23:
! 24: \begin{abstract}
! 25: In diesem Dokument werden die Ablage von Massendaten auf dem
! 26: zentralen Archiv- und Filesystem des MPIWG beschrieben
! 27: \end{abstract}
! 28:
! 29: \tableofcontents
! 30:
! 31:
! 32: \section{Datentypen für die dieses Dokument gilt}
! 33: \label{sec:datentypen-fur-die}
! 34:
! 35:
! 36: Die in diesem Dokument definierten Regeln gelten für
! 37: \footnote{Empfehlungen zu Standards für Datenformate (fehlt noch)}
! 38:
! 39: \begin{description}
! 40: \item[Archivdaten], die innerhalb der Digitalisierungsprojekte des
! 41: Instituts anfallen und als Rohdaten in möglichst hoher Qualität ohne
! 42: ständigen Zugriff langfristig gesichert werden sollen (Pfad:
! 43: archive/data)
! 44:
! 45: \item[Präsentationsdaten], die über das Internet verfügbar gemacht werden
! 46: sollen und deren URL bzw. URI langfristig stabil gehalten werden
! 47: sollen (Pfad: \texttt{online/permanent})
! 48:
! 49:
! 50: \item[Präsentationsdaten], die zu experimentellen Zwecken kurzfristig
! 51: online verfügbar sein sollen (Pfad: \texttt{online/experimental})
! 52:
! 53: \item[Mirror] Daten größeren Umfangs, die am Institut innnerhalb von
! 54: Kooperationsprojekten gehalten werden und auf die ständiger Zugriff
! 55: z.B. zum Zwecke der Synchronisation notwendig ist.(Pfad:
! 56: \texttt{mirrors})
! 57: \end{description}
! 58:
! 59:
! 60: \section{Zugang zum Server}
! 61: \label{sec:zugang-zum-server}
! 62:
! 63: Die Ablage aller genannter Dokumente erfolgt auf dem Fileserver
! 64: \texttt{foxridge}, der physikalisch am FHI beheimatet ist.
! 65:
! 66: Zugang per FTP, SCP, SFTP über:
! 67:
! 68: \texttt{foxridge.mpiwg-berlin.mpg.de}
! 69:
! 70: Zugang zu den Daten in den Verzeichnissen
! 71: \texttt{/mpiwg/archive/data}, \texttt{/mpiwg/online/permanent},
! 72: \texttt{/mpiwg/online/experimental} und \texttt{/mpiwg/mirrors}
! 73:
! 74: Zugang per Appletalk (AFP) über:
! 75:
! 76: Auswahl des Servers \texttt{foxridge} in der Zone \texttt{Zentrale Fileserver}
! 77:
! 78: Zugang zu den Daten über die Freigaben \texttt{archive\_data},
! 79: \texttt{online\_permanent}, \texttt{online\_experimental} und
! 80: \texttt{mirrors}
! 81:
! 82:
! 83:
! 84: \section{Benutzerkennung}
! 85: \label{sec:benutzerkennung}
! 86:
! 87: Benutzerkennungen und Passworte für die Ablage der Massendaten werden
! 88: projektspezifisch vergeben.
! 89:
! 90:
! 91: \section{Erlaubte Zeichen in Datei- und Ordnernamen}
! 92: \label{sec:erla-zeich-datei}
! 93:
! 94: Erlaubte Zeichen in Datei- und Ordnernamen sind a-z, A-Z, 0-9, "`-"',
! 95: "`\_"', "`."'. Andere Zeichen und Leerzeichen sind zu vermeiden.
! 96:
! 97:
! 98: \section{Ablage von Archivdaten}
! 99: \label{sec:ablage-von-arch}
! 100:
! 101: Archivdaten werden nur temporär auf dem Server gehalten und dann auf
! 102: Band gesichert. Auf Foxridge ist dafür der Pfad
! 103:
! 104: \texttt{/mpiwg/archive/data} bzw \texttt{archive\_data}
! 105:
! 106: vorgesehen.
! 107:
! 108:
! 109: \subsection{Erste Ebene: Projekte}
! 110: \label{sec:erste-eben-proj}
! 111:
! 112: Für jedes Projekt, das Archivdaten ablegen will, wird ein Ordner mit
! 113: dem Namen des Projektes angelegt:
! 114:
! 115: \texttt{archive/data/PROJEKTNAME}
! 116:
! 117: Bsp: das Humboldtprojekt
! 118:
! 119: \texttt{archive/data/humboldt}
! 120:
! 121:
! 122: \subsection{Zweite Ebene: Dokumente (gescannte Artikel, Manuskripte,
! 123: Bücher)}
! 124: \label{sec:zweite-eben-dokum}
! 125:
! 126: Für jedes abzulegende Dokument wird innerhalb des Projektordners ein weiterer Ordner angelegt. Im Falle von Dokumenten, die aus gescannten Bilddaten bestehen wird folgende Bennenung vorgeschlagen:
! 127:
! 128: \texttt{AUTHOR\_TITLE\_SERNR\_lang\_year}
! 129:
! 130: Tipp: Großgeschriebe Ausdrücke sind jeweils obligatorisch
! 131:
! 132: \begin{table}[htbp]
! 133:
! 134: \begin{tabular}{lll}
! 135: &&Beispiel:\\ \hline
! 136:
! 137: AUTHOR&Autor, Vorschlag 5 stellig (falls nicht vorhanden anon.)&HUMBO\\
! 138:
! 139: TITLE&Abkürzung des Titels, Vorschlag 5 stellig&ENDEC\\
! 140:
! 141: SERNR&Seriennummer, falls AUTHOR und TITLE nicht eindeutig, beginnend mit 01, zweistellig, die Seriennummer ist obligatorisch also in der Regel 01.&01\\
! 142:
! 143: lang&Sprache in der zweistelligen ISO-Codierung&de\\
! 144:
! 145: year&Erscheinungsjahr, vierstellig&1803
! 146:
! 147: \end{tabular}
! 148: \caption{Benennung Ordner}
! 149: \label{tab:benennung}
! 150: \end{table}
! 151: Tabelle 1: Benennung Ordner
! 152:
! 153:
! 154:
! 155:
! 156: \subsection{Dritte Ebene: Unterordner (Images, Texte, Metadaten)}
! 157: \label{sec:dritte-eben-unter}
! 158:
! 159: Innerhalb des Dokumenten Ordners werden weitere Ordner angelegt:
! 160:
! 161:
! 162: \begin{table}[htbp]
! 163: \centering
! 164: \begin{tabular}{lll}
! 165: &Benennung&\\ \hline
! 166:
! 167: für die Images (verpflichtend)&id-sernr-TYPE\\
! 168:
! 169:
! 170:
! 171: oder\\
! 172:
! 173:
! 174:
! 175: TYPE&id: beschreibt eine eindeutige ID des Dokumentes (dreistellig), sernr: eine Seriennummer falls mehrere Imagesätze zu einem Dokument gehören, TYPE entweder img oder pageimg.\\
! 176:
! 177: weitere Ordner die sich auf die Images beziehen&id-sernr-TYPE\\
! 178:
! 179:
! 180:
! 181: oder\\
! 182:
! 183:
! 184:
! 185: TYPE&wie oben, TYPE sollte den Inhalt beschreiben z.B OCR oder figures\\
! 186:
! 187: Metadaten&meta&Einzelne Metadaten-Dateien zu den Dokumenten in den Ordnern
! 188:
! 189: \end{tabular}
! 190: \caption{Benennung Unterordner}
! 191: \label{tab:unter}
! 192: \end{table}
! 193:
! 194: Tabelle 2: Ordner
! 195:
! 196:
! 197:
! 198: Ausserdem liegt in jedem Dokumentenordner eine Datei:
! 199:
! 200: index.meta
! 201:
! 202: die die Metadaten zum Ordner selbst enthält.
! 203:
! 204:
! 205: \subsection{Vierte Ebene: Dateien in den Ordnern}
! 206: \label{sec:vierte-eben-date}
! 207:
! 208: Minimal müssen die Dateinamen so sein, dass ihre alphanumerische
! 209: Ordnung der Ordnung der Daten entspricht. Insbesondere sollten
! 210: nummerierte Dateien Namen mit führenden Nullen "00001.jpg" erhalten.
! 211:
! 212: Das Suffix muss den Dateityp angeben.
! 213:
! 214: \begin{table}[htbp]
! 215: \centering
! 216: \begin{tabular}{ll}
! 217:
! 218: suffix&Dateityp\\ \hline
! 219:
! 220: jpg&jpg-Bilddateien\\
! 221:
! 222: tif&tif-Format nicht komprimiert\\
! 223:
! 224: png&png
! 225:
! 226: \end{tabular}
! 227: \caption{Benennung Dateien}
! 228: \label{tab:benennung-dateien}
! 229: \end{table}
! 230:
! 231:
! 232: Empfohlen wird folgende Bennung:
! 233:
! 234: \texttt{id-sernr-imagenumber.suffx}
! 235:
! 236: wobei id und sernr, mit den entsprechenden Angaben des Ordners übereinstimmen. Imagenummer ist eine 4stellige Zahl.
! 237:
! 238: Übersicht:
! 239:
! 240:
! 241:
! 242:
! 243:
! 244:
! 245: \section{Ablage der Onlinedaten}
! 246: \label{sec:ablage-der-onlin}
! 247:
! 248: Für Daten die für die direkte Präsentation im Netz vorgesehen sind,
! 249: werden auf foxridge zwei Pfade angeboten
! 250:
! 251: \texttt{online/experimental}
! 252:
! 253: und
! 254:
! 255: \texttt{online/permanent}
! 256:
! 257: \texttt{online/eperimental} ist hierbei für Dokumente vorgesehen, die nur
! 258: temporär präsentiert werden sollen. Pfade innerhalb dieses Bereiches
! 259: können verändert und gelöscht werden.
! 260:
! 261: \texttt{online/permanent} ist für Dokumente die auf längere Zeit im
! 262: Netz bleiben sollen. Pfade in diesem Bereich dürfen nicht geändert
! 263: oder gelöscht werden, Dokumente dürfen nicht verschoben werden.
! 264:
! 265: Die interne Struktur der Dokumentordner in \texttt{online/permanent}
! 266: entspricht der oben dargestellten Struktur innerhalb von
! 267: \texttt{archive/data}.
! 268:
! 269:
! 270:
! 271: \end{document}
! 272:
! 273:
! 274:
! 275: %%% Local Variables:
! 276: %%% mode: latex
! 277: %%% TeX-master: t
! 278: %%% End:
! 279:
FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>