Cabeza Ruiz, Robin2019-03-042019-03-042017-06-121692-5238http://hdl.handle.net/10906/84479En este trabajo se propone la utilización de los campos aleatorios condicionales para la resolución de la tarea de segmentación de textos por idioma, considerándola como una tarea de etiquetado de secuencias. La metodología considera que el cambio entre un idioma y otro en los documentos ocurrirá en cualquier parte del texto y asume que las observaciones en el sistema estarán dadas por las palabras en el texto y que los estados serán los diferentes idiomas. De la investigación se concluye que los campos aleatorios condicionales son una herramienta muy poderosa para la segmentación de textos multilingües.This work presents using conditional random fields for solving the task of text segmentation by language, considering it as a sequence tagging task. Language changes are considered to occur in every part of the text, observations are assumed to be the words in the text, and the states are the different languages. Research let conclude that conditional random fields are a powerful tool for segmentation of multilingual text.19 páginasDigitalspaEL AUTOR, expresa que la obra objeto de la presente autorización es original y la elaboró sin quebrantar ni suplantar los derechos de autor de terceros, y de tal forma, la obra es de su exclusiva autoría y tiene la titularidad sobre éste. PARÁGRAFO: en caso de queja o acción por parte de un tercero referente a los derechos de autor sobre el artículo, folleto o libro en cuestión, EL AUTOR, asumirá la responsabilidad total, y saldrá en defensa de los derechos aquí autorizados; para todos los efectos, la Universidad Icesi actúa como un tercero de buena fe. Esta autorización, permite a la Universidad Icesi, de forma indefinida, para que en los términos establecidos en la Ley 23 de 1982, la Ley 44 de 1993, leyes y jurisprudencia vigente al respecto, haga publicación de este con fines educativos. Toda persona que consulte ya sea la biblioteca o en medio electrónico podrá copiar apartes del texto citando siempre la fuentes, es decir el título del trabajo y el autor.http://creativecommons.org/licenses/by-nc-nd/4.0/Conditional random fields in text segmentation by languageLos campos aleatorios condicionales en la segmentación de textos por idiomainfo:eu-repo/semantics/openAccesshttps://doi.org/10.18046/syt.v15i43.2712Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)SegmentaciónHerramienta tecnológicaHerramientas computacionalesTextos digitaleshttp://purl.org/coar/resource_type/c_2df8fbb1instname:Universidad Icesireponame:Biblioteca Digitalrepourl:https://repository.icesi.edu.co/http://purl.org/coar/access_right/c_abf2