[titulo]

Publicada el 29-04-2020
Detectar sentimientos en redes sociales: un trabajo de minería de textos

Un proyecto de investigación analizó opiniones publicadas en la red social Twitter y creó un método automatizado para la identificación de los sentimientos que se presentan en los mensajes.


Whatsapps UCASAL

Visitas: 0

[Click aqui para descargar foto-redes.jpg]

El Grupo de Análisis de Datos de la Facultad de Ingeniería y del Instituto de Estudios Interdisciplinarios de Ingeniería (IESIING) de la Universidad Católica de Salta, estudió diversas opiniones vertidas por usuarios en redes sociales. Mediante el análisis de mensajes de Twitter, se elaboró un sistema de detección y clasificación de los sentimientos presentes en las expresiones.

El proyecto se enmarca en el campo de la llamada minería de textos: un proceso mediante el cual se puede extraer información interesante de textos no estructurados (publicaciones en redes sociales, correos electrónicos, resoluciones, etc.). Se trata, además, de la continuidad de una línea de trabajo que el equipo de investigación viene desarrollando en esta materia.

Inicialmente, se recopilaron más 60.000 tweets de opiniones sobre temas de actualidad de nuestro país. En un segundo momento, tras un proceso de clasificación y descarte, ese número se redujo a 8.000 mensajes, los cuales conformaron el corpus de la investigación.

Dentro del campo de la minería de textos, las opiniones y los sentimientos aportan información subjetiva de gran valor para las empresas y organizaciones que se desenvuelven en el terreno de la inteligencia de negocios. Los datos recabados son clave para la toma de decisiones y posibilitan la optimización de recursos y una mejor capacidad de respuesta.

 

Minería de opiniones: definición y casos

La minería de opiniones es una técnica de detección y análisis [Click aqui para descargar foto-redes.jpg] de sentimientos, actitudes, consideraciones y emociones de las personas, sobre temas específicos. Consiste en la vinculación del contenido de varios textos, mediante la identificación automática de regularidades o patrones que se encuentran en ellos. Los textos utilizados provienen de publicaciones en redes sociales, blogs, portales de noticias y foros de opinión, entre otros.

Por lo general, los estudios sobre minería de opiniones trabajan en la detección de la polaridad de la opinión, es decir, determinan si ésta es positiva o negativa. Algunos análisis, incluso, trabajan con un corpus de valoraciones ubicadas dentro de un rango que va de 1 a 5. Es el caso de las investigaciones referidas a críticas de cine, significando el 1 una película muy mala (polo negativo) y el 5 una película muy buena (polo positivo).

Otros estudios sobre minería de opinión realizan un análisis del sentimiento basado en características del producto que se pone a consideración. Por ejemplo, existen trabajos que recopilaron las opiniones sobre sitios gastronómicos, en las que se califica la comida, el ambiente y el servicio. Así, en estas opiniones, se pudo identificar la valoración (positiva, negativa o neutra) que se le otorga a cada uno de los ítems mencionados.

 

El sentimiento es el mensaje

Siguiendo la línea de trabajos anteriores en el campo de la minería de textos, el Grupo de Análisis de Datos de la UCASAL se adentró, en la presente investigación, en el análisis de sentimientos. Pero, a diferencia de los estudios de detección de polaridad, en los que (como ya fue mencionado) las opiniones se valoran como positivas, negativas o neutras, en este trabajo se identificaron los sentimientos a los que correspondían los textos.

De esta manera, se trabajó con mensajes de la red social Twitter, clasificando apreciaciones de distintos usuarios según éstas indicaran: ira, asco, tristeza o felicidad.

Primero  se llevó a cabo un trabajo de limpieza y preparación del material, descartando los mensajes que carecían de información relevante para el análisis. Luego se clasificaron los textos utilizando dos métodos: el aprendizaje automático y el de diccionarios léxicos.

El aprendizaje automático se realizó en dos etapas: una supervisada y otra semi supervisada. En la primera, se pusieron a prueba distintos algoritmos y se seleccionaron los dos que mejor funcionaron para la categorización de los textos. En la etapa semi supervisada, en tanto, se emplearon esos dos algoritmos y así, pudo conformarse el corpus de 8.000 tweets clasificados según las emociones indicadas.

En la siguiente instancia se utilizaron dos diccionarios referidos a emociones de manera combinada, para identificar la emoción expresada en cada tweet. Si bien los resultados se consideraron aceptables, los investigadores plantearon “la necesidad de contar con un diccionario de palabras más completo y acorde a los modismos de nuestro país”. El grupo de investigación continúa investigando la temática, aplicando otras técnicas de procesamiento de lenguaje natural y aprendizaje automático.

Equipo de investigación

Directora: Mg.Lic. Alejandra Carolina Cardoso
Investigadores: Mg.Lic. María Lorena Talamé, Ing. Matías Nicolás Amor
Alumna: Agustina Monge

Publicación:

Cardoso, A. C., Pérez Abelleira, M. A., & Notario, E. (2018). Búsqueda de respuestas como aplicación del problema de extracción de relaciones. Revista Tecnología y Ciencia, (33), 45-64. https://doi.org/10.33414/rtyc.33.45-64.2018: http://rtyc.utn.edu.ar/index.php/rtyc/article/view/26

Franja UCASAL

Ver más noticias

Azul UCASAL
Sede Central: Campo castañares - (Salta - Argentina) Tel.: 54-0387-4268800 / 0810-555-822725 (UCASAL)
Anexo Centro: Pellegrini 790 (Salta - Argentina) - Código Postal A4402FYP.
Dirección de Informática - © - 1963 - 2017 UCASAL - Todos los derechos Reservados.