El análisis de sentimiento o “Opinion Mining” (minería de opinión) es un proceso que se basa en relaciones estadísticas y de asociación, mediante las cuales se intenta determinar el tono emocional y la intención detrás de opiniones, emociones y actitudes expresadas a través del Machine Learning.
Consiste en procesar el lenguaje natural (NLP), lingüística computacional y el análisis de texto para identificar, procesar y extraer información subjetiva de los datos o recursos. Cabe destacar que este análisis, como se mencionó anteriormente, se basa en estadística y asociaciones, no en análisis lingüístico como tal.
¿Cómo se realiza un Análisis de Sentimiento?
De manera técnica, para este proceso se utiliza un DataSets de reviews, donde se aplican algoritmos como Bag Of Words (BOW) o Tf-idf que es una mejora que se puede aplicar a Bag Of Words, para posteriormente aplicar BERT (Bidirectional Encoder Representations For Transformers).
Para entender mejor este análisis es necesario comprender ciertos términos utilizados, como:
- Bag of Words (BOW):
También conocido como “Modelo bolsa de palabras”, este es un método que se utiliza en el procesado del lenguaje para representar documentos ignorando el orden de las palabras; en este caso, se utiliza específicamente para ver qué palabras aparecen en una frase determinada y si éstas contribuyen a un review positivo o negativo.
Una vez se procesa la review, se aplica un algoritmo clasificador KNN, el cual determinará si esa muestra cuenta con “vecinos” de un tipo u otro y asigna la clase por mayoría.
- Tf-idf:
Esto es una medida numérica que expresa lo relevante que es una palabra para un documento, es decir, el valor Tf-idf aumentará proporcionalmente al número de veces que aparezca una palabra en un documento; sin embargo, este valor es compensado por la frecuencia de la palabra en la colección total de documentos, lo que permite esclarecer que algunas palabras son generalmente más comunes que otras.
- BERT:
El BERT o Representación de Codificador Bidireccional de Transformadores, es un algoritmo desarrollado por Google, que tiene como objetivo interpretar el lenguaje de nuestras búsquedas de una forma más natural (PNL).
A diferencia de BOW, BERT tiene en cuenta el orden de las palabras, suposición y contexto.
En resumen, el proceso de Análisis de Sentimiento dentro del Machine Learning, nos permite determinar las emociones positivas o negativas que puedan tener las personas dentro de cualquier red respecto a un servicio, noticia, producto, tema, etc. Este proceso nos asiste para conocer de manera objetiva la subjetividad de opiniones, de manera que podamos conocer los sentimientos reales de los usuarios, consumidores o clientes y crear estrategias efectivas.
En Impulso nuestra Unidad de Inteligencia de Datos analiza millones de datos que nos permiten conocer tanto la tendencia de los consumidores como la reputación que pueda tener una marca, empresa y/o personas.
Comunícate con nosotros y te explicaremos más al respecto.