Основные вехи создания
компьютерных корпусов:
| 1960-е: |
Брауновский корпус,
(США), 1 млн. слов |
| 1970-е: |
LOB корпус
(Великобритания,
Норвегия), 1 млн. слов |
| 1980-е: |
Машинный Фонд
русского языка |
| |
Уппсальский корпус
русского языка
(Швеция), 1 млн. слов |
| |
The Bank of English, Birmingham, 20
млн. слов |
| 1990-е: |
British National Corpus, 100 млн.
слов |
| |
национальные
корпуса (венгерский,
итальянский,
хорватский, чешский,
японский) объемом 100
млн. слов |
| |
The Bank of English, Birmingham, 600
млн. слов |
| 2000-е: |
American National Corpus, 100 млн.
слов |
| |
Gigaword corpora:
английский, арабский,
китайский, 1 млрд. слов |
|