Conditional random fields in text segmentation by language

No hay miniatura disponible

Fecha

2017-06-12

Director de tesis/Asesor

Título de la revista

ISSN de la revista

Título del volumen

Publicador

Universidad Icesi

Editor

Compartir

Resumen

This work presents using conditional random fields for solving the task of text segmentation by language, considering it as a sequence tagging task. Language changes are considered to occur in every part of the text, observations are assumed to be the words in the text, and the states are the different languages. Research let conclude that conditional random fields are a powerful tool for segmentation of multilingual text.

Descripción

En este trabajo se propone la utilización de los campos aleatorios condicionales para la resolución de la tarea de segmentación de textos por idioma, considerándola como una tarea de etiquetado de secuencias. La metodología considera que el cambio entre un idioma y otro en los documentos ocurrirá en cualquier parte del texto y asume que las observaciones en el sistema estarán dadas por las palabras en el texto y que los estados serán los diferentes idiomas. De la investigación se concluye que los campos aleatorios condicionales son una herramienta muy poderosa para la segmentación de textos multilingües.

Palabras clave

Citación

ARK

ARXIV

Barcode

Bibcode

EAN13

DOI

https://doi.org/10.18046/syt.v15i43.2712

EISSN

GOVDOC

Handle

IGSN

ISBN

ISMN

ISSN

1692-5238

ISTC

ISSN-L

LSID

Local

Other

OLIB

PISSN

PMID

PURL

SICI

Slug

SoundCloud

UPC

URL

URN

YouTube

WOS