¿Qué es el análisis del sentimiento?

Desde que empecé a trabajar en Bitext, me han preguntado ya muchas veces qué es el análisis del sentimiento (o, en inglés, “sentiment analysis”): es el proceso por el que determinamos si una frase o acto de habla contiene una opinión, positiva o negativa, sobre una entidad concreta o sobre un concepto. Es un término que está muy ligado a las redes sociales pero que, en realidad, no está limitado a ellas.

Mediante el análisis del sentimiento, aspiramos a entender, en primer lugar, con qué guarda relación el texto que analizamos. Por ejemplo, nos interesa saber si la frase en cuestión trata sobre nuestra marca o sobre el concepto que nos interesa analizar (p. ej. – “hoteles”). Idealmente, querremos saber esto pero con mayor nivel de granularidad: ¿a qué se refiere exactamente la frase? ¿A nuestra marca, en general, o a un aspecto de nuestro producto o servicio (envase, precio, la habitación, la atención recibida…)? Una vez que el sistema tiene claro sobre qué es la opinión, nuestro segundo objetivo será conocer el sentido de esa opinión (positiva o negativa, básicamente), así como la intensidad de esa opinión. A esa puntuación, técnicamente, la llamamos “intensidad de la polaridad”.

Los sistemas más sencillotes se limitan a leer una frase y buscar en ella palabras que tienen registradas en su diccionario como buenas o como malas. Si aparece una palabra buena (p. ej. – “estupendo”), es una opinión positiva. Si aparece una palabra mala (p. ej. – “decepcionada”), es una opinión negativa. Si no encuentran ninguna palabra que, según su diccionario, exprese algo negativo o positivo, estos sistemas más sencillos suelen hablar de “opiniones neutras”, aunque para mí sería preferible entender que lo que ocurre es que no hay opinión como, por ejemplo, si yo tuiteo “Estoy esperando a mi primo en el McDonald’s”. Paradójicamente, muchos de esos sistemas simples también te dirán que una opinión es neutra si han encontrado una palabra negativa y otra positiva. Esto último debería provocar sonrojo a más de uno, pero no.

A partir de ese mínimo, los distintos sistemas de análisis del sentimiento que hay en el mercado van incrementando su refinamiento y su capacidad de proporcionar información realmente útil. Las áreas en las que se notan las mejoras son:

  • Capacidad para interpretar correctamente construcciones complejas como, por ejemplo, las oraciones comparativas (“McDonald’s es mucho mejor que Burger King”), negativas (“La tercera parte de El Hobbit no me ha gustado”) o condicionales (“Me compraría un iPhone si no fuera tan caro”) y, en general, para lidiar con todas las particularidades del habla natural: desde el uso de la ironía, el lenguaje informal o los errores en la escritura.
  • Capacidad para identificar exactamente a qué está haciendo referencia la opinión. Los sistemas más burdos sólo son capaces de saber que la frase tiene algo que ver con el concepto que estamos monitorizando, pero no interpretan la frase realmente. Dicho de otro modo, para un sistema básico, si tu marca está en la frase, entonces la opinión es sobre tu marca, incluso en casos tan evidentes para un humano como “No hay nada peor que te interrumpan mientras te bebes una Coca-Cola”, que un sistema simple identificaría como negativo hacia tu marca (es una frase de tono negativo, sin duda, pero no hacia la marca).

Los sistemas que se limitan a detectar la presencia de palabras en las frases analizadas son, generalmente, incapaces de alcanzar la mínima eficacia en esas dos áreas. Las complejidades del idioma humano son tales que ningún sistema puede aspirar, hoy por hoy, a la eficacia absoluta, pero los sistemas de análisis del sentimiento más avanzados sí son capaces de superar la mayor parte de los obstáculos y pueden proporcionar a las marcas información fiable.

En el caso de Bitext, nuestra tecnología va mucho más allá de la mera detección de palabras. También va más allá de los mecanismos matemáticos y estadísticos del machine learning, puesto que la tecnología de Bitext analiza la frase hasta “comprender” su estructura profunda, por lo que es capaz de detectar giros de significado, la presencia de múltiples opiniones sobre conceptos distintos y, por supuesto, a qué elemento concreto se refiere cada opinión. Todo esto hace que los resultados del análisis del sentimiento realizado con nuestra plataforma no sólo sean mucho más precisos y fiables, sino que además son más fácilmente convertibles en información “accionable” para las marcas: saber que un 60% de las opiniones detectadas sobre tu marca son positivas no es más que un dato bonito; en cambio, puedes tomar decisiones si sabes, por ejemplo, que hay muchos clientes que se quejan sobre el envase de tu producto o que lo más valorado de tu hotel es el desayuno.

¿Para qué se usa el análisis de sentimiento?

Como decía al principio, lo habitual es identificar el análisis del sentimiento con su uso en las redes sociales pero, en realidad, su aplicación va mucho más allá. Analizar tuits es importante, pero muchas marcas no se limitan a eso y monitorizan de forma constante toda la web, principalmente aquellos lugares donde es más probable que se viertan opiniones relevantes, como las webs de comercio electrónico, los agregadores, los comparadores, etc.

Las marcas que cuentan con un buen motor de análisis del sentimiento, extraen conclusiones y toman decisiones concretas basadas en la información que les proporcionan: modificar elementos de su offering, lanzar acciones correctivas cuando detectan un problema con la experiencia del cliente o construir sus mensajes de marketing.

Elementos de un sistema completo de análisis del sentimientoEs evidente que, para poder llevar a cabo estas prácticas de sentiment analysis, necesitamos algo más que un buen motor de análisis del sentimiento. Los otros dos elementos fundamentales suelen ser:

  • Un motor de monitorización (a menudo llamado “crawler“), que encuentra los textos que se deben analizar. Estas herramientas suelen incorporar capacidades de búsqueda en redes sociales y en la web, para encontrar todas las menciones de las palabras clave que hayamos definido y pasárselas al motor de análisis para que las evalúe.
  • Una herramienta de visualización y explotación de la información, que recoge la información proporcionada por el motor de análisis del sentimiento y compone con ella la interfaz de usuario. También, en este “lado” de la ecuación se realiza la agregación de la información sobre sentimiento con otros datos relevantes disponibles.

¿Existe alguna herramienta 100% precisa?

Ojalá, pero no. El análisis de sentimiento no es, por el momento, 100% preciso. De hecho, en función del contexto, las cifras de acierto pueden andar docenas de puntos por debajo de la perfección. Los motivos más habituales son:

  • Ni siquiera los seres humanos somos capaces de estar 100% de acuerdo sobre la “intensidad de la polaridad” de la mayoría de las frases. Si pides a cinco personas que analicen el sentimiento de un conjunto de frases, en la mayoría de las frases no conseguirás que coincidan más de cuatro de esas personas. Cuando hablamos de la precisión de una herramienta automatizada, lo hacemos comparándola con la de esos grupos de control humanos, así que es imposible alcanzar el 100% de eficacia real.
  • La complejidad y riqueza de nuestros idiomas y de nuestro lenguaje nos permite hacer frases tremendamente complicadas, jugar con conocimiento implícito que no se refleja de forma explícita en nuestros actos de habla o, sencillamente, confiar en el contexto para que se entienda el significado real de lo que queremos decir, contexto que no tiene por qué estar disponible para el motor de análisis. Podemos detectar las ironías más evidentes, pero no las más sutiles, por ejemplo.
  • En ocasiones, las distintas variedades dialectales o el argot de los diversos grupos sociales puede impedir el correcto análisis de algunos textos, aunque esto es algo que se puede amortiguar si el proveedor del sistema es suficientemente concienzudo.

Por eso, es importante no fiarse de quienes afirman, sin justificación técnica, gozar de cifras de precisión escandalosamente altas y, al mismo tiempo, hay que ser muy consciente de cuánta confianza podemos depositar en las herramientas que usamos.

8 comentarios

  1. Pablo J. Domínguez

    19/01/2015 a las 22:47

    Gran artículo, gracias. Después de leerlo sigo teniendo la duda de cuánto nos podemos fiar de los resultados del análisis de sentimiento y qué porcentajes de acierto tiene. ¿Podría aclararme esto? Gracias.

    • Manuel Delgado Tenorio

      20/01/2015 a las 12:04

      Gracias a ti, Pablo. Por lo que explico en el artículo, es difícil hablar de porcentajes de efectividad pero, si de lo que hablamos es de un número gordo, yo no me quedaría contento con nada que estuviera por debajo del 80% de precisión y, de ahí hacia arriba, cuanta más mejor.

      Y, por si tienes curiosidad, en Bitext superamos el 90% de precisión, de manera demostrable. Y, además, a nivel de “topic”, no de frase, que es lo que hace que el resultado sea útil para el negocio.

      Si trabajas con una herramienta de análisis del sentimiento que te da más del 90% de precisión y lo que estás monitorizando es relevante para tu negocio, no veo por qué no ibas a poder fiarte de esos datos para tomar decisiones de negocio. De hecho, no es que puedas, es que debes.

  2. Tengo una consulta, ¿podemos usar el análisis del sentimiento para medir la performance de nuestras acciones online?

    • Manuel Delgado Tenorio

      22/01/2015 a las 08:02

      Cada empresa decidirá usar el análisis de sentimiento para lo que mejor se ajuste a sus objetivos de negocio. Efectivamente, una de las opciones es aplicarlo a la medición de la eficacia de nuestras acciones. Desde la perspectiva más simple, se puede medir y analizar la evolución del sentiment y su relación con la inversión en marketing. Ese ejercicio nos permite colocar en una línea temporal las acciones realizadas, el número de menciones detectadas y el sentimiento detectado en ellas, para intentar entender cómo las acciones influyen en el número y el sentido de las opiniones.

      Para mi gusto, las aplicaciones del análisis de textos más ricas e interesantes para las marcas son las que van más allá del mero análisis del sentimiento y profundizan en otras áreas, como la categorización o la extracción de entidades y conceptos. Con esas técnicas, podemos acercarnos mucho más al impacto que han tenido nuestras acciones, puesto que conseguimos información mucho más rica y más fácil de convertir en decisiones de negocio.

  3. Hola buenas tardes, me gustó el artículo, es claro y me ha ayudado en la investigación que realizo actualmente. Quería preguntarle si podría ayudarme para encontrar más información acerca del análisis de sentimientos. Como menciono me encuentro investigando y necesito escribir referencias así que me gustaría saber si ha escrito otros artículos o alguna publicación en revista para poder citarlo en mi trabajo. Gracias.

  4. como se mide la exactitud en el análisis de sentimientos? existe alguna prueba estándar formal o de facto que mida los resultados? donde podemos comprobar su exactitud de mas del 90%?

    gracias

    • Manuel Delgado Tenorio

      08/01/2016 a las 09:37

      Como digo en el post, la manera de medir el nivel de calidad del análisis del sentimiento es comparar el resultado de la herramienta con los resultados de un panel humano. Es la práctica habitual en la industria.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

*

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

© 2018 Manuel Delgado Tenorio

Subir ↑