Datasets
A continuación se muestra información sobre conjuntos de datos textuales en español creados con el objetivo de resolver tareas de PLN. En este caso, se trata de colecciones de textos, generalmente enriquecidas con anotaciones.
-
EXIST-2023-EN
SocialInglésPublicado en 20234,152Tuitsdetección de odio -
EXIST-2023-ES
SocialEspañol , InglésPublicado en 20234,653Tuitsdetección de odio -
DIANN-2023-EN
SaludInglésPublicado en 2023600Resúmenes de artículos científicosreconocimiento de entidades nombradas -
DIANN-2023-ES
SaludEspañol , InglésPublicado en 2023600Resúmenes de artículos científicosreconocimiento de entidades nombradas -
DIPROMATS 2023
PolíticaEspañol , InglésPublicado en 2023Tuitsclasificación de textos -
MLDoc-EN
NoticiasInglésPublicado en 201814,458Noticiasclasificación de textos -
STS 2017-en-en
InglésPublicado en 20171,884Pares de oracionessimilitud textual -
SQuAD 1.1
GeneralInglésPublicado en 2016107,785Entradas de enciclopediasistemas de pregunta-respuesta