private://user_outputs/197/6415/task1_1_hard_CodeHerGuard_1.json

Evaluation

Evall log

				{"files":{"EXIST2025_T1_1_en_es_hard_test_gold.json":{"description":"The file is correctly parser without errors or warnings.\\nFile name: EXIST2025_T1_1_en_es_hard_test_gold.json.","errors":{},"gold":true,"name":"EXIST2025_T1_1_en_es_hard_test_gold.json","status":"OK"},"task1_1_hard_CodeHerGuard_1.json":{"description":"The file is correctly parser without errors or warnings.\\nFile name: task1_1_hard_CodeHerGuard_1.json.","errors":{},"gold":false,"name":"task1_1_hard_CodeHerGuard_1.json","status":"OK"}},"metrics":{"Accuracy":{"acronym":"Acc","description":"Coming soon!","name":"Accuracy","results":{"average_per_test_case":0.8184836745987825,"test_cases":[{"average":0.8184836745987825,"name":"EXIST2025"}]},"status":"OK"},"FMeasure":{"acronym":"F1","description":"Coming soon!","name":"F-Measure","results":{"average_per_test_case":0.7583577022675878,"test_cases":[{"average":0.7583577022675878,"classes":{"NO":0.7807056721750781,"YES":0.7360097323600974},"name":"EXIST2025"}]},"status":"OK"},"ICM":{"acronym":"ICM","description":"Coming soon!","name":"Information Contrast model","results":{"average_per_test_case":0.4395866748067102,"test_cases":[{"average":0.4395866748067102,"name":"EXIST2025"}]},"status":"OK"},"ICMNorm":{"acronym":"ICM-Norm","description":"Coming soon!","name":"Normalized Information Contrast Model","results":{"average_per_test_case":0.7209372693353978,"test_cases":[{"average":0.7209372693353978,"name":"EXIST2025"}]},"status":"OK"},"Kappa":{"acronym":"Kappa","description":"Coming soon!","name":"Cohen's Kappa","results":{"average_per_test_case":0.6302979343451606,"test_cases":[{"average":0.6302979343451606,"name":"EXIST2025"}]},"status":"OK"},"Precision":{"acronym":"Pr","description":"Coming soon!","name":"Precision","results":{"average_per_test_case":0.7173579116529896,"test_cases":[{"average":0.7173579116529896,"classes":{"NO":0.6942017474185862,"YES":0.7405140758873929},"name":"EXIST2025"}]},"status":"OK"},"Recall":{"acronym":"Re","description":"Coming soon!","name":"Recall","results":{"average_per_test_case":0.8116982947955482,"test_cases":[{"average":0.8116982947955482,"classes":{"NO":0.8918367346938776,"YES":0.7315598548972189},"name":"EXIST2025"}]},"status":"OK"},"SystemPrecision":{"acronym":"SP","description":"Coming soon!","name":"System Precision","results":{"average_per_test_case":0.7124277456647399,"test_cases":[{"average":0.7124277456647399,"name":"EXIST2025"}]},"status":"OK"}}}

ICM Norm

0.72

metric_params

{"FMeasure":{"alfa_param":0.5,"custom":false},"ICM":{"alpha_1":2,"alpha_2":2,"beta":3,"custom":false}}

System

EXist2025_hybridSexism

Results split

All

Task

EXIST 2025 1.1: Sexism Identification in Tweets (Hard-Hard)

Source

Publication

Precisión

0.72

Recall

0.81

0.76

Accuracy

0.82

ICM

0.44

SystemPrecision

0.71

Kappa

0.63