Tagset
Auf dieser Seite sind die tags gelistet, mit denen das Korpus zur mehrfachen Vorfeldbesetzung annotiert ist. In Klammern steht das jeweilige Attribut, mit dem in der Korpusabfrage auf die entsprechenden Annotationen Bezug genommen werden kann (Details zur Anfragesprache
hier und interaktiv bei der
Korpussuche).
Wortarten und Lemmatisierung
Attribut:
pos
Das gesamte Korpus wurde mit dem
TreeTagger automatisch getaggt und lemmatisiert, das Tagset ist
STTS.
Grammatische Kategorie und Funktion
In Sätzen mit mehrfacher Vorfeldbesetzzung wurden grammatische Kategorie und Funktion der Elemente im Vorfeld per Hand annotiert.
Kategorie
Attribut:
cat
np | Nominalphrase |
pp | Präpositionalphrase |
adj | Adjektiv |
adv | Adverb |
adv-pron | Pronominaladverb |
konp | Konjunktion(alphrase) |
Funktion
Attribut:
func
subj | Subjekt |
do | direktes Objekt |
io | indirektes Objekt (Dativ) |
po | präpositionales Objekt |
go | Genitivobjekt |
mod | Modifizierer |
pred | Prädikat |
Topologische Felder
Attribut:
field
In Sätzen mit mehrfacher Vorfeldbesetzung sind einige der topologischen Felder benannt.
vf1 | erstes Element im Vorfeld |
vf2 | zweites Element im Vorfeld |
vf0 | Element vor dem ersten Element im Vorfeld |
vf3 | Element nach dem zweiten Element im Vorfeld |
lsk | linke Satzklammer |
rest | rechte Satzklammer & Nachfeld |
Informationsstruktur
Die Annotationen für die drei informationsstrukturellen Ebenen "Gegebenheit", "Topik" und "Fokus" folgen, mit leichten Modifikationen, den Richtlinien in Götze et al. (2007), die ihrerseits an Krifka (2007) angelehnt sind.
Gegebenheit
Attribut:
inf-stat
giv-active | aktiver Diskursreferent (vorerwähnt im selben oder im vorangehenden Satz) |
giv-inactive | vorerwähnter Diskursreferent |
acc | "zugänglicher" Diskursreferent (Art unterspezifiziert) |
acc-aggr | zugänglich (Aggregation):
referierender Ausdruck denotiert Gruppe gegebener oder zugänglicher Referenten |
acc-gen | Referent ist durch Weltwissen bekannt |
acc-inf | zugänglich (inferierbar):
referierender Ausdruck steht in einer "bridging relation" zu einem gegebenen oder zugänglichen Referenten ("part-whole", "set-relation" etc.) |
new | neuer Diskursreferent |
nonref | nicht-referentielles Element |
nonref.idiom | nicht-referentielles Element als Bestandteil eines Idioms |
inf-stat | Gegebenheit nicht spezifiziert |
Topik
Attribut:
top
ab | Aboutness-Topik |
none | kein Topik |
topicality | Topikstatus nicht spezifiziert |
Fokus
Attribut:
foc
cf | Kontrastfokus |
nf-part | Teil eines Informationsfokus (new-information focus) |
cf-part | Teil eines Kontrastfokus |
none | kein Fokus |
focality | Fokusstatus nicht spezifiziert |