Формат корпуса основан на TEI, поскольку этот стандарт обеспечивает разумный баланс между потенциальной общностью модели и простотой реализации большинства случаев, требуемых для разметки. Кроме того, в TEI присутствует большое количество средств для представления метаинформации о текстах, входящих в состав корпуса. Наконец, он используется во многих других проектах и можно будет использовать существующие средства, предназначенные для работы с этим форматом.
Формат морфосинтаксической разметки обсуждается в документе
corpus-format.zip.
|