Arbeit mit dem Webinterface zum ParaSol

Simple query
Für eine Abfrage ist folgendes einzutragen (von links nach rechts):
Advanced query

Anfragesprache

Die Sprachen im Korpus sind unterschiedlich aufbereitet. Man kann
  1. nach Wortformen suchen:
    [word="czerwony"] oder [word="rot"] findet diese Worte in genau dieser Schreibweise, aber nicht `czerwona', `czerwoni' bzw. `rote', `röter'.
  2. nach Lemmata, d.h., nach Grundformen suchen:
    [lemma="czerwony"] oder [lemma="rot"] findet alle zu `czerwony' gehörenden Wortformen: auch `czerwona', `czerwoni', `czerwonych' bzw. `rote', `röter'.
  3. Im Russischen, Polnischen, Tschechischen und Slovakischen können wir zusätzlich nach sogenannten Tags suchen, d.h. nach morphosyntaktischen Informationen, die jedem Wort zugeordnet sind. Im folgenden polnischen Beispiel stehen unter den Worten die jeweils zugeordneten Tags und Lemmata:
    bitorekordskoczni
    bić:imps:imperfrekord:subst:sg:acc:m3skocznia:subst:sg:gen:f
    Die Bedeutung der Kürzel können hier nachgeschlagen werden:
    Russisch:
    MULTEXT-EAST, Beschreibung des Tagsets
    Slowakisch:
    Tagset des slowakischen Nationalkorpus - Übersicht über das Tagset
    Polnisch:
    Tagset des IPI PAN Korpus - Beschreibung des Tagsets
    Tschechisch:
    Tagset des Tschechischen Nationalkorpus - kurze Übersicht über die Tags, genauere Beschreibung.

    Beispielanfragen (für Polnisch):
    [tag=".*imps.*"] findet alle Vorkommen des bezosobnik, also `bito', `chodzono', etc. (zur Verwendung von `.*' siehe unten)
    [tag=".*acc.*"] findet alle Nomen im Akkusativ.

Reguläre Ausdrücke.

Um sowohl rot als auch Rot zu finden, kann man die Schreibweise [Rr]ot verwenden. Mit eckigen Klammern sucht man also nach mehreren alternativen Zeichen gleichzeitig. Mit einem Punkt bezeichnet man ein beliebiges Zeichen.
Der Ausdruck [word="[Rr]ot."] findet also alle Worte, die mit r oder R anfangen und mit ot und einem weiteren beliebigen Buchstaben enden.
Man kann auch nach Wiederholungen eines Zeichens suchen. Dazu stellt man einen von den folgenden drei Operatoren: Möchten wir also z.B. neben `rot' und `Rot' auch `roter' und `Roter' finden, so können wir z.B. folgende Muster verwenden:
[word="[Rr]ot.*"] suche alle Worte, die mit mit R oder r anfangen, mit ot weitergehen und mit irgendwelchen Buchstaben, egal wie vielen, enden.
Was finden die Anfragen [word="[Rr]ot.?"] und [word="[Rr]ot.+"] ?
Was finden die Anfragen [lemma="[Rr]ot.?"] und [lemma="[Rr]ot.+"] ?
Mehr zur Anfragesprache findet sich hier

Beispielabfragen

Weiteres

Mehrfache Übersetzungen desselben Textes werden als Übersetzungen in eine zusätzliche Sprache aufgefasst. Sprachvarianten (German-A, Russian-A) beziehen sich also auf solche Fälle und beinhalten jeweils die zusätzliche Übersetzung.
Die Textkürzel sind i.A. aus Autor und Titel gebildet, so etwa bezeichnet etwa StrugLebedi: Boris i Arkadij Strugackie, Gadkie lebedi. Ausnahmen sind z.Z. EUVerf - Die Verfassung der EU; SloOestHK - Newsletter der Slovakisch-Österreichischen Handelskammer. Genaueres siehe Liste der Sprachen und Texte



File translated from TEX by TTH, version 3.74.
On 25 Jun 2007, 16:28.