¡“Ingenieros del ICAI para el Desarrollo” ha cumplido ya 10 años!

La RSC, concepto esencial y comprometedor

Deberes para 2011

El tiempo, un recurso escaso

Management Reporting

Consideraciones técnicas sobre el sistema gasista

Holografía de microondas

INTECO-CERT

Análisis de opiniones en Internet a partir de la red social Twitter

Nicolás Oriol Consejero Delegado de UNIENCE e Ingeniero del ICAI

Siempre legal

Fé de erratas

Home > Análisis de opiniones en Internet a partir de la red social Twitter

Palabras clave: redes sociales, análisis de sentimiento, aprendizaje automático, Twitter.

Key words: social networking, sentiment analysis, opinion mining, Twitter.

Resumen: El auge de las redes sociales como medio de difusión de información ha provocado que gran cantidad de usuarios acudan a ellas para expresar sus opiniones sobre diversos temas de actualidad. En este trabajo se presentan las bases formales de un proceso que permite sondear a la opinión pública acerca de un producto, marca, persona, etc. Para alcanzar este fin se analizan los mensajes publicados en la red social Twitter, extrayendo la información complementaria de las páginas web referenciadas en ellos. Además, se ha desarrollado un proceso de valoración fundamentado en modelos de aprendizaje automático y técnicas de procesamiento del lenguaje natural. Por último, se proponen unas guías para la aplicación de técnicas de Soft-Computing, que permiten obtener una valoración final, partiendo de un conjunto de valoraciones heterogéneas.

Abstract: The high level of acceptance of social networks as a way to broadcast information has caused a great number of users to employ them to express their opinions about current issues. This paper introduces a procedure able to evaluate public opinion on products, brands, people, etc. So that, the messages displayed on the social network Twitter are analyzed to obtain the relevant information of the web sites referenced by these messages. Therefore, an assessment process has been developed using machine learning models plus natural language processing techniques. Finally, some guidelines are proposed to improve the assessment process by means of Soft Computing techniques, to obtain a final evaluation through a set of heterogeneous opinions.

Autores: Roberto Merlo Álvarez, David Contreras Barcena, Cristina Puente Águeda

Roberto Merlo Álvarez Ingeniero en Informática de la Escuela Técnica Superior de Ingeniería (ICAI). Actualmente, consultor estratégico en The Boston Consulting Group.

David Contreras Barcena Doctor Ingeniero del ICAI. Actualmente, Profesor del Departamento de Sistemas Informáticos (ICAI) de la Universidad Pontificia Comillas e Investigador del Instituto de Investigación Tecnológica (IIT).

Cristina Puente Águeda Doctora Ingeniera del ICAI. Actualmente, Profesora del Departamento de Sistemas Informáticos (ICAI) de la Universidad Pontificia Comillas.

Introducción

Figura 1. Página principal de Twitter

Las redes sociales y la Web 2.0

Internet es un medio de difusión cada vez más utilizado y se ha convertido en uno de los medios más consultados a la hora de buscar información antes de tomar una decisión de compra, por delante de revistas especializadas o de consumo.

La evolución de Internet hacia la Web 2.0, basada en la participación activa del usuario mediante las redes sociales, ha permitido que la opinión del usuario tenga su importancia en el conjunto global de la red. Cualquier usuario mediante la utilización de blogs y sin prácticamente conocimientos tecnológicos puede escribir sus experiencias en la Web. Además, puede participar de los contenidos de sitios web de referencia opinando sobre noticias, películas, restaurantes, etc.

Microblogging

El microblogging es una forma cada vez más popular de comunicación en Internet, que permite a sus usuarios escribir breves entradas de texto de forma pública o a un grupo de contactos. La aplicación de referencia hoy en día para este fin es Twitter. Multitud de deportistas, famosos y usuarios en general emplean esta red social para expresar sus experiencias u opiniones.

Los mensajes escritos en esta red social son extremadamente cortos en comparación con las entradas típicas de un blog, ya que tienen un máximo de 140 caracteres y pueden escribirse a través de la web o de teléfonos móviles. Esta brevedad de los mensajes, equivalente aproximadamente al título y subtítulo de una noticia en un periódico, los hace fáciles de escribir (producir) y de leer (consumir). Esta característica es lo que hace a los microblogs únicos frente a otros medios electrónicos, como son los blogs y las páginas web.

Un paradigma que ayuda a comprender el creciente interés de las empresas en los medios de difusión por Internet es la llamada “Economía de la atención” [2], donde las marcas compiten constantemente por la atención de sus clientes potenciales. Bajo este paradigma, el microblogging supone una nueva forma de comunicación donde los usuarios pueden describir objetos de interés o expresar opiniones que están dispuestos a compartir con otros usuarios.

Los sitios de microblogging tienen un impacto directo en la comunicación denominada “boca a boca” electrónica, ya que permite a los usuarios compartir opiniones con cualquier persona conectada a la red social en una escala nunca vista hasta ahora. El tipo de información intercambiado suelen ser recomendaciones e información de carácter general, expresado de una manera informal y personal. Además, estas recomendaciones pueden ser realizadas desde cualquier lugar, gracias a los dispositivos móviles. El fenómeno del boca a boca, también denominado boca a oreja o Word-Of-Mouth (WOM), es el proceso por el cual los individuos intercambian información por medios verbales.

Figura 2. Ejemplo de opinión de un usuario mediante Twitter

El boca a boca en Internet: Word Of Mouth (WOM)

El WOM tradicional (offline) ha demostrado jugar un papel muy importante en la decisión de compra de los consumidores [11], ya que el “qué piensan los demás” ha sido siempre un factor importante en el proceso de toma de decisiones. En situaciones comerciales, el WOM implica a los consumidores compartiendo con otras personas sus opiniones, puntos de vista o reacciones sobre negocios, productos o servicios. El marketing WOM se define como influyente, multifacético y típicamente difícil de influenciar. Conseguir un WOM positivo está considerado un poderoso medio con el que las empresas pueden influir en sus consumidores.

La comunicación WOM está basada en las redes sociales y en la confianza: las personas confían en sus familias, amigos y otras personas dentro de su red social. Sin embargo, las investigaciones en el campo demuestran cómo las personas también parecen confiar en las opiniones aparentemente desinteresadas de otras personas fuera de su red social inmediata, como en el caso de las reseñas por Internet [3]. Precisamente la expansión de Internet ha ampliado las opciones de los consumidores para obtener información no sesgada sobre productos de otros consumidores, a la vez que les permite ofrecer su propio consejo u opinión relacionada con éstos. Esta nueva forma se conoce como electronic WOM o eWOM [7].

El amplio alcance del eWOM proporciona a los consumidores una gran influencia sobre las percepciones de los demás, y por tanto, se considera como algo cada vez más importante por las empresas y organizaciones preocupadas con la gestión de su reputación. Esta nueva forma de expresión online es importante porque puede afectar (positiva o negativamente) a la imagen de marca de la empresa, que a su vez repercute en el comportamiento de compra del consumidor (Fig. 2).

La importancia del eWOM ha sido demostrada estadísticamente en varias investigaciones de las que se extraen las siguientes conclusiones: aunque una mayoría de los usuarios afirman haber tenido experiencias positivas en la búsqueda online sobre productos, un 58% de los usuarios encuestados afirmaron haber sufrido alguna dificultad en este proceso. En algunos casos el usuario se sintió frustrado por la falta de información encontrada para tomar la decisión de compra, en otros se encontró confundido por la información contradictoria que encontró y otros se declararon abrumados por la cantidad de información encontrada [6][1].

Estos estudios ponen de manifiesto que, aunque el eWOM es un hecho en Internet, la gran cantidad de información y la dispersión de la misma hacen necesario un sistema que sea capaz de separar las valoraciones del resto del contenido y que organice los resultados de forma sencilla.

Figura 3. Ejemplo de una opinión con enlace

Twitter como fuente de información

Tradicionalmente, la clasificación de textos mediante técnicas de aprendizaje automático es un campo que ha suscitado un gran interés. Así, el análisis de las opiniones de los usuarios ha sido estudiado en el dominio de los blogs, las páginas de noticias o las reseñas online [8][9].

Desde la aparición de Twitter, red social de microblogging de referencia, se ha explotado su potencial como fuente de información para monitorizar el eWOM. Se han estudiado las correlaciones de las opiniones expresadas en esta red de microblogging con fenómenos socio-económicos y se ha modelado el estado de ánimo y emociones de los usuarios. De estos estudios desarrollados, se destacan dos principalmente.

En el primero se ha intentado extraer de forma automática la opinión de los usuarios de Twitter, utilizando un enfoque muy sencillo. Éste se basa en dos listas con un reducido número de palabras consideradas positivas o negativas, a partir de las cuales, se clasifica el mensaje según las palabras que contenga en su interior. Debido a la simplicidad de este enfoque, la calidad de los resultados conseguidos no es muy buena [13].

En el segundo se ha desarrollado un sistema utilizando un enfoque de clasificación supervisado mediante aprendizaje automático, cuyos resultados son muy superiores al enfoque anteriormente nombrado basado en listas de palabras. El aspecto negativo de esta propuesta son los pobres resultados que se obtienen trabajando con mensajes neutrales, es decir, con aquéllos que no expresan una opinión [7][5].

En todos los trabajos desarrollados de extracción de opiniones de Twitter se ha limitado a analizar los propios comentarios escritos por los usuarios, sin percatarse de la evolución que está sufriendo esta red social. Hoy en día, los usuarios de Twitter, además de comentar sus opiniones en los 140 caracteres destinados a ello, incluyen enlaces a otros contenidos de la web que expresan opinión, también denominados medios eWOM (Fig. 3). Esta práctica desea llamar la atención de los lectores mediante un breve comentario de un contenido más amplio que no tendría cabida en este tipo de red social. En estos casos, se observa cómo la opinión del usuario no se limita únicamente al mensaje de Twitter, sino que se debería encontrar en el contenido relacionado con éste.

Figura 4. Esquema de funcionamiento del sistema

Figura 5. Ejemplo de un comentario con repetición de caracteres en una palabra

Figura 6. Ejemplo de un comentario con palabras coloquiales

Sistema desarrollado de análisis de opinión en la red

Objetivos

El objetivo del sistema desarrollado es facilitar a las empresas el acceso al conocimiento que los usuarios tienen sobre ellas y sus productos. Además se desea mejorar la experiencia de los consumidores que deseen buscar información para asesorarse en su decisión de compra. Para lograr estos dos objetivos, se combina el análisis de las opiniones de los mensajes escritos en Twitter, junto con otros medios eWOM relacionados existentes en la Web, como blogs, páginas web y reseñas. Esta información extraída conjuntamente es procesada en busca de opiniones y valoraciones. Una vez analizadas, se presentan en un informe, sintetizando el sentimiento general en la red sobre el producto o la marca deseada.

Funcionamiento

En este apartado se describe el funcionamiento del sistema a grandes rasgos. En primer lugar se introduce el producto o marca a buscar en Twitter, obteniendo todos los mensajes relacionados. A continuación, se obtiene de forma cuantitativa la opinión expresada en cada mensaje. Además de procesar el sentimiento del propio mensaje, se analiza el sentimiento existente en el medio eWOM referenciado mediante una URL, si existiera. Finalmente, se agregan todas las opiniones de cada mensaje individual para obtener una síntesis de la opinión general de los usuarios de la red de microblogging.

En el sistema se diferencian tres módulos (Fig. 4), los cuales serán descritos en profundidad posteriormente:

Análisis de opinión en Twitter (A): consiste en el análisis de cada mensaje de Twitter con el fin de detectar opiniones y expresiones subjetivas, y clasificarlas en positivas o negativas.
Análisis de opinión en otros medios eWOM (B): tiene una función muy similar al anterior, pero en lugar de analizar los mensajes de Twitter, este módulo procesa otros medios eWOM, como blogs o reseñas online.
Generación de resultados (C): posee la función de determinar la opinión expresada a través del mensaje y de calcular la agregación de todas las opiniones de los usuarios de la red respecto de la consulta lanzada.

Análisis de opiniones en Twitter

El denominador común de los mensajes escritos en Twitter es su estilo informal. La limitación de caracteres y la naturaleza de esta red social hacen que los mensajes incorporen expresiones y símbolos coloquiales, como por ejemplo, los emoticonos. Este hecho, dificulta aun más la tarea de desarrollar un sistema de aprendizaje automático capaz de identificar el sesgo de un mensaje.

Para resolver esta problemática se realizan diversos procedimientos de normalización que ayudan a convertir las expresiones coloquiales de los mensajes en lenguaje formal. Por ejemplo, es muy frecuente encontrar letras repetidas en una palabra o adjetivo para enfatizar el sentimiento del mismo. En la Figura 5 se muestra un ejemplo donde el usuario enfatiza el superlativo de la palabra rica con la expresión “riquíiiiiisima”. Por este motivo, el sistema debe normalizar estas expresiones eliminando las letras repetidas en cada palabra.

Otro de los procedimientos de normalización desarrollados es el encargado de eliminar la jerga de Internet (denominada Netspeak), muy extendida entre los usuarios más jóvenes. Para ello se aplica un diccionario con más de 5.000 términos de esta jerga. Este proceso de conversión sustituiría en los mensajes procesados la palabra “weno” por “bueno” o “bn” por “bien”. En el caso de los comentarios escritos en inglés, idioma empleado en el desarrollo de este sistema, la utilización de estas expresiones es algo casi habitual, como se puede ver en la Figura 6.

Una vez normalizado el mensaje, el sistema debe decidir la polaridad del sentimiento u opinión de cada mensaje mediante los clasificadores que se describen a continuación.

Clasificación de sentimiento

El objetivo principal de este módulo es desarrollar una herramienta que decida de forma automática el sentimiento individual (positivo o negativo) de cada uno de los mensajes procesados. Este proceso se ha llevado a cabo mediante la implementación de un clasificador estadístico utilizando SVMs (Support Vector Machines) como algoritmo de aprendizaje automático.

Para implementar este clasificador es necesario contar con un conjunto de entrenamiento basado en mensajes de Twitter. Para ello se han necesitado procesar previamente, y de forma automática, más de 3 millones de mensajes con un etiquetado de sentimiento adicional al contenido [10]. Por este motivo, se ha utilizado la presencia de emoticonos del tipo “:)” para los ejemplos positivos y “:(” para los negativos.

Una vez eliminados todos los mensajes no aptos para el entrenamiento, se han seleccionado un millón de mensajes positivos y un millón negativos, haciendo un conjunto de entrenamiento total de dos millones. Este conjunto de entrenamiento será generado una sola vez, formando parte de la base del sistema para todos los usos posteriores.

Clasificación de subjetividad

El clasificador de sentimiento anteriormente descrito está pensado para catalogar mensajes de opinión como positivos o negativos. Sin embargo, si se introduce un mensaje que no contiene ninguna opinión (por ejemplo, el titular de una noticia), también será clasificado como positivo o negativo. Por tanto, es importante asegurarse de que el clasificador sólo recibe mensajes que realmente contengan opiniones o comentarios subjetivos.

Se ha desarrollado un clasificador de subjetividad, previo al clasificador de sentimiento, que distingue cada uno de los mensajes entre objetivo y subjetivo. Para generar el conjunto de entrenamiento se ha utilizado un clasificador basado en reglas, que controla la presencia o ausencia de una lista de palabras y locuciones subjetivas [12]. Este clasificador entrena a su vez al clasificador de aprendizaje automático definitivo.

Análisis de opiniones en otros medios eWOM

Otro fenómeno que se produce en Twitter es la alta densidad de mensajes que contienen enlaces a otra dirección web. De hecho, los servicios de acortamiento de URL surgieron para poder incluir estos enlaces en el número reducido de caracteres de un mensaje de microblog.

La mayor parte de los mensajes, cuando son conversaciones o tratan sobre el estado inmediato del usuario, no contienen enlaces de ningún tipo (por ejemplo, “¡Hoy estoy contento!”). Sin embargo, cuando hacen referencia a temas citados en otros medios eWOM, el volumen de mensajes que contienen un enlace a esos medios es muy alto.

Por ejemplo, de los 1.149 mensajes recolectados buscando mensajes por el texto “Oscar Awards” en los días previos a la ceremonia de los Oscar, un 71,7% de ellos contenían un enlace a otros medios, principalmente blogs y páginas de noticias. Igualmente, en búsquedas realizadas por “iPad”, en 14 de los 20 primeros mensajes mostrados que hablaban de este dispositivo aparecía un enlace a otro medio, lo que supone un 70%.

Por tanto, el potencial de Twitter para permitir encontrar otros medios eWOM en la red es bastante alto y, a diferencia de un buscador web tradicional, el recuperar estos medios a través de Twitter proporciona dos interesantes ventajas:

El concepto de relevancia clásica se sustituye por una “relevancia-actualidad”. Se añade la importancia de que se comparta ese tema en un instante de tiempo dado.
A cada usuario se le puede asociar la opinión que exprese el medio referenciado. De esta manera, se puede establecer mayor importancia a los medios referenciados por mayor número de usuarios. En un buscador, la única manera de ponderar los medios entre sí es utilizando su posición en la lista de resultados. Esta posición, en ocasiones, está determinada por factores externos al contenido de la misma, como pueden ser algunas técnicas de optimización de motores de búsqueda (SEO).

El módulo desarrollado en este sistema para analizar la opinión en medio eWOM (Fig. 4) funciona de la forma siguiente: una vez que se detecta un enlace en el mensaje, se solicita la página referenciada y se procesa para identificar el texto relevante. De ella, se excluyen las partes sin contenido importante, como son el código HTML, índices de contenidos, anuncios, pies de página, etc. Finalmente, se clasifica el sentimiento del texto según un esquema de clasificación jerárquica diferente al empleado en el análisis de opinión en Twitter, ya que el tipo de lenguaje en la red de microbbloging tiene particularidades que lo hacen diferente al utilizado en los demás medios eWOM.

Generación de resultados

En los apartados anteriores se ha descrito cómo obtener la opinión expresada en un mensaje de Twitter y en el posible medio eWOM relacionado. Este módulo es el encargado de proporcionar un resultado final de opinión sobre un tema determinado. Para ello, se asigna un valor único de opinión a cada mensaje (combinando el mensaje y el posible medio que referencie) y se sintetizan las opiniones de todos los mensajes en un solo indicador final.

Opinión de mensaje

Esta función se encarga de asignar una opinión global a cada uno de los mensajes. Ésta será la suma de la opinión expresada en el mensaje más la opinión expresada en otro medio eWOM referenciado (si existe). Para ello se tienen las salidas de los dos analizadores de opinión, Twitter y web respectivamente, que pueden ser positivas o negativas. A la opinión positiva se le asigna el valor +1 y a la negativa el valor -1. Finalmente, se suman ambos valores.

Inicialmente, se asigna el mismo peso al mensaje y al medio referenciado, aunque se tienen en cuenta distintas consideraciones. Por un lado, los mensajes de microblogging son muy fáciles de consumir (leer) por su brevedad, por lo que muchos usuarios pueden no seguir el enlace, concediendo mayor importancia o peso al contenido del mensaje. Por otro lado, los medios eWOM, gracias a su mayor extensión, suelen estar más justificados y tener más fuerza argumentativa que los breves mensajes de Twitter. Por tanto, la decisión de igualdad de pesos se justifica por la existencia de argumentos en los dos sentidos.

Agregación de opiniones

Esta segunda función tiene la tarea de sintetizar las opiniones de todos los mensajes recuperados en una opinión general que englobe a toda la red.

En el modelo propuesto se parte de un conjunto de valores de opiniones de mensajes, estando cada una de ellas en el intervalo [-2, +2]. Se han evaluado dos posibles formas de agregar estas opiniones:

“Sufragio universal”: un mensaje, un voto. Esto quiere decir que todos los mensajes tienen el mismo peso, independientemente de quién fue su autor y, por tanto, la agregación de todas las opiniones será la suma directa de éstas.
Cada mensaje tiene un factor de repercusión r relacionado con el número de seguidores (usuarios que automáticamente visualizan el mensaje) que tiene su autor en la red. La agregación de las opiniones es la suma de todos los mensajes multiplicados por su correspondiente factor de repercusión.

Después de analizar las dos alternativas se extrae lo siguiente: el segundo enfoque tiene el problema de que al ponderar cada opinión junto a su factor de repercusión consigue anular las opiniones de las personas y sólo tiene en cuenta las opiniones de los usuarios más relevantes. Estos usuarios son generalmente la representación en Twitter de medios de comunicación (periódicos, revistas, etc). Por este motivo, la forma de agregación elegida para el modelo consiste en realizar la suma de todas las opiniones de los mensajes (enfoque de sufragio universal), cuyo valor final representará tanto la orientación de la opinión (positiva-negativa), como la intensidad de ésta (cuántas personas están participando en esta opinión).

Conclusiones

En este trabajo se ponen de manifiesto las técnicas más relevantes en la clasificación y valoración de opiniones mediante redes sociales.

Se utilizan las técnicas de clasificación que mejores resultados ofrecen en su ámbito y se adaptan a la búsqueda de mensajes escritos en Twitter. Además, como trabajo innovador, se combina el análisis de opiniones en Twitter junto con otros medios eWOM. De esta manera, se produce un acercamiento a los nuevos tipos de comentarios que se generan hoy en día en el microblogging. Así, los medios referenciados por los usuarios en sus mensajes pasan a convertirse en opiniones.

Descargar este artículo en formato PDF

Créditos-Comité Editorial

Normas para Autores