Kopfbild

Tagset

Auf dieser Seite sind die tags gelistet, mit denen das Korpus zur mehrfachen Vorfeldbesetzung annotiert ist. In Klammern steht das jeweilige Attribut, mit dem in der Korpusabfrage auf die entsprechenden Annotationen Bezug genommen werden kann (Details zur Anfragesprache hier und interaktiv bei der Korpussuche).


Wortarten und Lemmatisierung

Attribut:pos

Das gesamte Korpus wurde mit dem TreeTagger automatisch getaggt und lemmatisiert, das Tagset ist STTS.


Grammatische Kategorie und Funktion

In Sätzen mit mehrfacher Vorfeldbesetzzung wurden grammatische Kategorie und Funktion der Elemente im Vorfeld per Hand annotiert.

Kategorie

Attribut: cat
np Nominalphrase
pp Präpositionalphrase
adjAdjektiv
advAdverb
adv-pronPronominaladverb
konp Konjunktion(alphrase)

Funktion

Attribut: func
subj Subjekt
do direktes Objekt
io indirektes Objekt (Dativ)
po präpositionales Objekt
go Genitivobjekt
mod Modifizierer
pred Prädikat


Topologische Felder

Attribut: field

In Sätzen mit mehrfacher Vorfeldbesetzung sind einige der topologischen Felder benannt.
vf1 erstes Element im Vorfeld
vf2 zweites Element im Vorfeld
vf0 Element vor dem ersten Element im Vorfeld
vf3 Element nach dem zweiten Element im Vorfeld
lsk linke Satzklammer
rest rechte Satzklammer & Nachfeld


Informationsstruktur

Die Annotationen für die drei informationsstrukturellen Ebenen "Gegebenheit", "Topik" und "Fokus" folgen, mit leichten Modifikationen, den Richtlinien in Götze et al. (2007), die ihrerseits an Krifka (2007) angelehnt sind.

Gegebenheit

Attribut: inf-stat
giv-active aktiver Diskursreferent
(vorerwähnt im selben oder im vorangehenden Satz)
giv-inactive vorerwähnter Diskursreferent
acc "zugänglicher" Diskursreferent (Art unterspezifiziert)
acc-aggr zugänglich (Aggregation):
referierender Ausdruck denotiert Gruppe gegebener oder zugänglicher Referenten
acc-gen
Referent ist durch Weltwissen bekannt
acc-inf zugänglich (inferierbar):
referierender Ausdruck steht in einer "bridging relation" zu einem gegebenen oder zugänglichen Referenten ("part-whole", "set-relation" etc.)
new neuer Diskursreferent
nonrefnicht-referentielles Element
nonref.idiomnicht-referentielles Element als Bestandteil eines Idioms
inf-stat Gegebenheit nicht spezifiziert

Topik

Attribut: top
ab Aboutness-Topik
none kein Topik
topicalityTopikstatus nicht spezifiziert

Fokus

Attribut: foc
cf Kontrastfokus
nf-partTeil eines Informationsfokus (new-information focus)
cf-part Teil eines Kontrastfokus
none kein Fokus
focalityFokusstatus nicht spezifiziert