el corpus del español


Los corpus
Tamaño
Comparar con otros corpus
   CORPES (RAE)
   Corpus más grandes
Otros recursos
Problemas (en inglés)
Contactar


 


English Español

Creado por Mark Davies (BYU). Subvencionado por el programa National Endowment for the Humanities de Estados Unidos (2001-2002, 2015-2017).

  Corpus # palabras Creado Más información
1 Género / Histórico 100 millones de palabras 2001-02 Info
2 Web / Dialectos 2.000 millones de palabras 2016 Info
3 NOW (2012 - 2019) 5.100 millones de palabras 2018 Info
4 Google Books n-grams (BYU) 45.000 millones de palabras 2011 Info
5 WordAndPhrase 40.000 palabras más frecuentes 2017 Info

Este es el Corpus del Español "original" (2001), pero con la interfaz de 2016.

El corpus contiene 100 millones de palabras de entre el siglo XIII y el siglo XX, y se puede utilizar para analizar la historia del español. Para el siglo XX, los datos están divididos equitativamente entre textos orales, de ficción, de periódicos y académicos, lo que permite realizar búsquedas para comparar géneros en español.

La interfaz que se puso en línea en 2016 permite crear "corpus virtuales" (p. ej.: un conjunto determinado de autores, fuentes o temas), además de tener un diseño mucho más "limpio", con mejores archivos de ayuda y mejor soporte para dispositivos móviles.

(Clique aquí para usar la interfaz más antigua de 2008).