1 décembre 2011
Ce document est lié à :
10.4067/S0718-09342011000300004
info:eu-repo/semantics/openAccess
Marcelo Mendoza et al., « Categorización de texto en bases documentales a partir de modelos computacionales livianos », Revista Signos - Estudios de lingüística, ID : 10670/1.d22sab
En este trabajo se presenta un nuevo categorizador de texto para bases de datos documentales. El categorizador propuesto corresponde a una extensión del categorizador Naive Bayes que permite obtener buenos resultados en bases documentales con desbalance en datos de entrenamiento. Resultados experimentales permiten afirmar que el categorizador supera a Naive Bayes y se compara favorablemente con otras técnicas más sofisticadas como máquinas de soporte vectorial y regresión logística sin incurrir en costos computacionales significativos en la fase de entrenamiento.