el corpus del español

el corpus del español


Hay varios recursos creados a partir de la antigua versión del Corpus del Español (publicado en 2001), como por ejemplo:

El antiguo Corpus del Español era bastante pequeño (solo 20 millones de palabras para el siglo XX), por lo que muchos de los recursos que hemos creado para el inglés no podían elaborarse para el español hasta que no existiera un corpus mucho mayor. Con el nuevo corpus de dos mil millones de palabras, podemos crear muchos de estos recursos, que incluirán:

  • Datos con textos completos, lo que significa que el usuario tendría acceso a casi dos mil millones de palabras en su equipo

  • Datos actualizados similares a los datos de frecuencias de palabras, colocados, y y n-gramas data (con los primeros 40 000 lemas en español)

  • WordAndPhrase para el español, que permite explorar los primeros 40 000 lemas para ver información de frecuencia, definiciones, colocados, concordancias y sinónimos (todos en una misma página). Además, el usuario también puede introducir sus propios textos y analizarlas con los datos del corpus.