Основные вехи создания
компьютерных корпусов:
1960-е: |
Брауновский корпус,
(США), 1 млн. слов |
1970-е: |
LOB корпус
(Великобритания,
Норвегия), 1 млн. слов |
1980-е: |
Машинный Фонд
русского языка |
|
Уппсальский корпус
русского языка
(Швеция), 1 млн. слов |
|
The Bank of English, Birmingham, 20
млн. слов |
1990-е: |
British National Corpus, 100 млн.
слов |
|
национальные
корпуса (венгерский,
итальянский,
хорватский, чешский,
японский) объемом 100
млн. слов |
|
The Bank of English, Birmingham, 600
млн. слов |
2000-е: |
American National Corpus, 100 млн.
слов |
|
Gigaword corpora:
английский, арабский,
китайский, 1 млрд. слов |
|