Download a list of texts

The following is a summary of the composition of the corpus. Via the link at the bottom of this page, you can download a file that lists all of the nearly 10,000 texts in the corpus.

CENTURY

WORDS

# TEXTS

SOURCES

1200s

7,079,164

71

  • [HSMS] Electronic Texts and Concordances of the Madison Corpus of Early Spanish Manuscripts and Printings. Preparado por John ONeill. (Madison y  New York, 1999).

  • ADMYTE (Archivo Digital de Manuscritos y Textos Españoles). Vol 0 y 2.

  • Biblioteca Virtual

  • Gonzalo de Berceo: Obras Completas

1300s

2,667,810

50

1400s

8,747,963

160

1500s

17,774,762

323

  • Biblioteca Virtual [1500s-1700s]

  • COMEDIA (Univ. de Arizona) [1600s]

  • Proyecto Filosofía en español [1700s]

1600s

13,355,483

498

1700s

10,324,328

176

1800s

20,822,142

392 novels

  • Biblioteca Virtual

1900s-Acad

5,138,077

2931 articles

  • Encarta

1900s-News 5,144,631 6810 articles
  • ABC Cultural 1991-95

  • Noticias - Argentina - La Prensa

  • Noticias - Argentina - El Cronista

  • Noticias - Bolivia - ERBOL

  • Noticias - Perú - Caretas

  • Noticias - Colombia -Semana

  • Noticias - Cuba/EEUU -CubaNet

1900s-Lit

5,144,073

850 novels / short stories

  • Biblioteca Virtual

  • [BYU] Humanities Research Center, Brigham Young University

  • [ARG] Corpus lingüístico de referencia de la lengua española en Argentina

  • [CHILE] Corpus lingüístico de referencia de la lengua española en Chile

  • Proyecto Sherezade

  • Badosa.com

  • Ficticiosa.com

1900s-Oral

5,113,249

2040+  interviews and transcripts

  • Habla Culta

  • [ESP-ORAL] Corpus oral de referencia de la lengua española contemporánea, including CORLEC, Corpus Oral de Referencia de la Lengua Española

  • Cortes de Castilla-La Mancha

  • Congreso de España

  • ABC Cultural 1991-95

  • Chiapas (La República) - Entrevistas

  • Ernesto Zedillo - Entrevistas / discursos

  • Fidel Castro - Entrevistas / discursos

  • Partido PAN - Entrevistas

  • Partido PRI - Entrevistas

TOTAL

101,311,682

13,926

 

List of texts

The Excel spreadsheet shown above contains complete information on the texts used in the corpus. The [textID] column refers to the [t] value in the URL in the [title] column of the Keyword in Context display. For example, if the URL is http://www.corpusdelespanol.org/x4.asp?t=1782&ID=92380534, then the [textID] is [1782], and this corresponds to [Los pies de barro] in the speadsheet.