INGLESE:
The Prague Dependency Treebank 2.0 (PDT 2.0) contains a large amount of Czech texts with complex and interlinked morphological (2 million words), syntactic (1.5 MW) and complex semantic annotation (0.8 MW); in addition, certain properties of sentence information structure and coreference relations are annotated at the semantic level.
PDT 2.0 is based on the long-standing Praguian linguistic tradition, adapted for the current Computational Linguistics research needs. The corpus itself uses the latest annotation technology. Software tools for corpus search, annotation and language analysis are included. Extensive documentation (in English) is provided as well.
ITALIANO:
Il "Prague Dependency Treebank 2.0 (PDT 2.0)" è un database che contiene una grande quantità di testi in lingua ceca con una morfologia complessa e interconnessa (2 milioni di parole), sintattica (1,5 MW) e una complessa annotazione semantica (0,8 MW); inoltre, alcune proprietà della struttura delle informazioni sulle frasi e delle relazioni di coreferenza sono annotate a livello semantico.
PDT 2.0 si basa sulla tradizione linguistica praguiana, adattata alle attuali esigenze di ricerca della Linguistica Computazionale. Il corpus stesso utilizza la più recente tecnologia di annotazione. Sono inclusi nel sito strumenti software per la ricerca del corpus, l'annotazione e l'analisi del linguaggio. Viene fornita anche un'ampia documentazione (in lingua inglese).
Ultima modifica scheda: 13 dicembre 2023