el corpus del español

Creado por Mark Davies. Subvencionado por el programa National Endowment for the Humanities de Estados Unidos (2001-2002, 2015-2017).

		Corpus	# palabras	Creado
1	Info	Género / Histórico	100 millones de palabras	2001
2	Info	Web / Dialectos *	2.000 millones de palabras	2016
3	Info	NOW (2012 - 2019)	7.326 millones de palabras	2018
4	Info	Google Books n-grams	45.000 millones de palabras	2011

Esta es nuestra interfaz para los datos n-gramas de Google Books. Se basa en 45 mil millones de palabras en decenas de millones de libros del 1800 al 2000.

Los datos de n-gramas no permiten la gama completa de consultas que un corpus normal, pero todavía se puede encontrar la frecuencia de palabras y frases a lo largo del tiempo, así como encontrar los colocados de una palabra dada (incluyendo los colocados a lo largo del tiempo, para ver el cambio semántico). Y debido a que está basado en 45 mil millones de palabras, es una información increíblemente rica.