Changes between Version 35 and Version 36 of TeamMeeting


Ignore:
Timestamp:
Jan 19, 2011, 1:12:06 PM (13 years ago)
Author:
Wolfgang Schmidle
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • TeamMeeting

    v35 v36  
     1== Protokoll 2011-01-13 ==
     2
     3=== Snowball ===
     4
     5Snowball wird verwendet, wenn es keine andere Möglichkeit gibt, die Grundform eines Wortes zu ermitteln. Die von Snowball erzeugten Grundformen sind unter Umständen keine echten Wortformen. Beispiele:
     6 * Poincare wird zu Poincar
     7 * bei einer vom Backend nicht erkannten Silbentrennung:
     8  * characte wird zu charact
     9  * ristisch bleibt ristisch
     10
     11Poincar und charact erhalten dann vom backend eine Linkseite und ristisch nicht. Das Kriterium ist, dass Snowball eine Änderung gemacht hat. Die Snowball-Formen führen in diesen Fällen zu link-Seiten, wo kein link funktioniert. Es ist unklar, ob es Fälle gibt, wo Snowball eine sinnvolle Form liefert, die man nicht auf andere Weise bekommen kann.
     12
     13Josef schlägt deshalb vor, Snowball auszuschalten, muss dafür aber noch mehr Tests machen.
     14
     15=== Zeilenumbrüche ===
     16
     17Bei neuen Texten wird die Bindestrich-Information am Ende einer Zeile verdoppelt, d.h. vor dem <lb/> ist entweder ein Bindestrich oder ein Leerzeichen, aber nicht beides:
     18 * Silbe / Silbe wird zu Silbe <lb/>Silbe
     19 * Silbe- / Silbe wird zu Silbe-<lb/>Silbe
     20 
     21Das Backend soll nun erkennen, ob hier ein getrenntes Wort oder zwei Wörter sind. Die Hauptinformation ist der Bindestrich, die Sekundärinformation ist das Leerzeichen.
     22
     23Robert hatte in einem der letzten Meetings dafür plädiert, dass wir als Information trotzdem das Leerzeichen verwenden, damit wir den Fall unterscheiden können, dass ein Bindestrich am Ende einer Zeile keine Worttrennung signalisiert.
     24 
     25Jochen ist dagegen, weil man diese Konvention nicht gut als explizite Regel für das XML angeben kann, weil whitespace schwer zu kontrollieren ist. Stattdessen muss man sie dem Benutzer getrennt mitteilen. Das ist insbesondere dann ein Problem, wenn der Text weitergereicht wird. Jochen plädiert also dafür, den Bindestrich als Signal zu nehmen und Bindestriche, die keine Worttrennung anzeigen, anders zu markieren, zum Beispiel mit einem XML-tag.
     26
     27In Archimedes gibt es offenbar verschiedene Konventionen. Wolfgang wird das untersuchen. Vielleicht brauchen wir ein Metadatum, das die Verwendung der Bindestriche im Text beschreibt.
     28
     29=== Texte hochladen ===
     30
     31Texte hochladen belastet das System. Zwei Gründe:
     32 * Serverlast (PDF erstellen etc.)
     33 * eXist mag es nicht, wenn viele neue Versionen hochgeladen werden.
     34
     35Wenn Texte hochzuladen ein Problem ist, muss sofort ein Testserver aufgesetzt werden.
     36
     37Josef: Es ist zurzeit kein Problem, sondern nur ein Bitte, vor dem Hochladen zweimal zu überlegen, ob es nötig ist.
     38
     39
    140== Team Meeting: Themen ==
     41
     42[ab hier ist diese Wiki-Seite wahrscheinlich veraltet!]
    243
    344  * draft des Fortführungsantrags?