Datasets
A continuación se muestra información sobre conjuntos de datos textuales en español creados con el objetivo de resolver tareas de PLN. En este caso, se trata de colecciones de textos, generalmente enriquecidas con anotaciones.
-
EXIST-2023-EN
SocialInglésPublicado en 20234,152Tuitsdetección de odio -
EXIST-2023-ES
SocialEspañol , InglésPublicado en 20234,653Tuitsdetección de odio -
DIANN-2023-EN
SaludInglésPublicado en 2023600Resúmenes de artículos científicosreconocimiento de entidades nombradas -
DIANN-2023-ES
SaludEspañol , InglésPublicado en 2023600Resúmenes de artículos científicosreconocimiento de entidades nombradas -
DIPROMATS 2023
PolíticaEspañol , InglésPublicado en 2023Tuitsclasificación de textos -
MultiCoNER-EN
EspañolPublicado en 2022233,987Wikipedia Preguntas Búsquedasreconocimiento de entidades nombradas -
SQAC
General, NoticiasEspañolPublicado en 20228,817Entradas de enciclopedia Noticiassistemas de pregunta-respuesta -
MultiCoNER-ES
DiversosEspañolPublicado en 2022233,987Wikipedia Preguntas Búsquedasreconocimiento de entidades nombradas -
EXIST-2022-ES
EspañolPublicado en 20226,226Tuitsdetección de odio -
MLDoc-EN
NoticiasInglésPublicado en 201814,458Noticiasclasificación de textos -
MLDoc-ES
NoticiasEspañolPublicado en 201814,458Noticiasclasificación de textos -
STS 2017-en-en
InglésPublicado en 20171,884Pares de oracionessimilitud textual -
STS 2017-es-es
EspañolPublicado en 20171,884Pares de oraciones -
SQuAD 1.1
GeneralInglésPublicado en 2016107,785Entradas de enciclopediasistemas de pregunta-respuesta