The following is a summary of the composition of the corpus. You can also download a file that lists all of the ~14,000 texts in the corpus.
 
CENTURY WORDS # TEXTS SOURCES

   Historical

1200s 7,079,164 71
  • [HSMS] Electronic Texts and Concordances of the Madison Corpus of Early Spanish Manuscripts and Printings. Preparado por John ONeill. (Madison y  New York, 1999).

  • ADMYTE (Archivo Digital de Manuscritos y Textos Españoles). Vol 0 y 2.
  • Biblioteca Virtual
  • Gonzalo de Berceo: Obras Completas
1300s 2,667,810 50
1400s 8,747,963 160
1500s 17,774,762 323
  • Biblioteca Virtual [1500s-1700s]
  • COMEDIA (Univ. de Arizona) [1600s]
  • Proyecto Filosofía en español [1700s]
1600s 13,355,483 498
1700s 10,324,328 176
1800s 20,822,142 392 novels
  • Biblioteca Virtual
 

   Modern Spanish: Genres

1900s-News 5,144,631 6810 articles
  • ABC Cultural 1991-95
  • Noticias - Argentina - La Prensa
  • Noticias - Argentina - El Cronista
  • Noticias - Bolivia - ERBOL
  • Noticias - Perú - Caretas
  • Noticias - Colombia -Semana
  • Noticias - Cuba/EEUU -CubaNet
1900s-Lit 5,144,073 850 novels+
short stories
  • Biblioteca Virtual
  • [BYU] Humanities Research Center, Brigham Young University
  • [ARG] Corpus lingüístico de referencia de la lengua española en Argentina
  • [CHILE] Corpus lingüístico de referencia de la lengua española en Chile
  • Proyecto Sherezade
  • Badosa.com
  • Ficticiosa.com
1900s-Oral 5,113,249 2040+  interviews+
transcripts

  • Habla Culta
  • [ESP-ORAL] Corpus oral de referencia de la lengua española contemporánea, including CORLEC, Corpus Oral de Referencia de la Lengua Española
  • Cortes de Castilla-La Mancha
  • Congreso de España
  • ABC Cultural 1991-95
  • Chiapas (La República) - Entrevistas
  • Ernesto Zedillo - Entrevistas / discursos
  • Fidel Castro - Entrevistas / discursos
  • Partido PAN - Entrevistas
  • Partido PRI - Entrevistas
1900s-Acad 5,138,077 2931 articles

  • Encarta en español
TOTAL 101,311,682 13,926