2 December, 2020 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

¿Son tus tuits positivos o negativos?

Aguascalientes, Aguascalientes.  (Agencia Informativa Conacyt).- Un grupo de científicos mexicanos, adscritos al Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación (Infotec), desarrolló una herramienta informática para conocer las emociones de los usuarios de redes sociales a partir del análisis de sus publicaciones.

Conocido como Servicio Web de Análisis de Polaridad (SWAP), la herramienta trabaja con un algoritmo capaz de identificar al instante cuando un tuit —mensaje de texto emitido en la red social Twitter— tiene una carga emotiva positiva, negativa o neutra.

“Actualmente se desarrollan algoritmos que de manera automática pueden predecir la polaridad emotiva de un comentario. Se dice fácil, pero es un problema de mucha actualidad; Google recientemente lanzó una app de procesamiento del lenguaje natural que hace esta tarea, lo que nos confirmó que este es un tema de actualidad”, explicó Elio Villaseñor García, profesor investigador del Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación (Infotec).

Elio VIllasenor 0416Elio Villaseñor.El equipo, conformado por tres investigadores de Cátedras Conacyt: Eric Sadit Téllez Ávila, Mario Graff Moreno y Sabino Miranda Jiménez, así como dos del Centro de Investigación en Geografía y Geomática (Centrogeo): Daniela Moctezuma Ochoa y Óscar Sánchez Siordia, ha comparado la herramienta SWAP con la aplicación de Google y han observado una mayor efectividad, no solo con relación a dicha app, sino también con otros productos de empresas tecnológicas que realizan ejercicios similares.

“El Inegi (Instituto Nacional de Estadística y Geografía), como se sabe, es el instituto encargado de generar estadísticas del país en distintos ámbitos, ellos se acercaron con nosotros para decirnos que habían recolectado más de 80 millones de tuits a nivel nacional y habían hecho un ejercicio de etiquetado de una muestra de esos tuits”, señaló Elio Villaseñor.

Infotec creó un algoritmo capaz de identificar de manera inmediata cuándo un tuit debe ser clasificado como positivo, negativo, neutro o sin una carga emotiva.

“Hicimos un concurso para ver quién desarrollaba el método que mejor clasificaba los tuits, fue interesante porque cada uno de nosotros tiene un área de especialidad distinta, al final, los mejores clasificadores se pudieron ensamblar y generar un algoritmo que tenía una precisión bastante buena si lo comparamos con los métodos que se reportan en las publicaciones científicas, y bueno, al final ese fue el que terminó usando el Inegi para clasificar los 80 millones de tuits”, afirmó, haciendo referencia al estudio estado de ánimo de los tuiteros en México que publicó Inegi el año pasado.

Ese mismo algoritmo se utilizará en la herramienta de análisis que están por lanzar al mercado, la cual podrá ser utilizada por agencias de publicidad para analizar el impacto de las campañas propagandísticas de sus clientes en las redes sociales; asimismo, los gobiernos podrán monitorear la aceptación de diversas políticas públicas o servicios, y también podrá ser utilizada para medir el pulso de las campañas políticas en las redes sociales, entre otras acciones.

“Se pueden analizar todos los tuits que se descarguen sobre cierto tema, por ejemplo, mediante un hashtag, el servicio te los devuelve con la etiqueta positivo, negativo o neutro, efectivamente no es una estadística representativa de la población en su conjunto; sin embargo, sí es representativa de una población muy importante, que es de los jóvenes entre 18 y 40 años, y cada vez va a ser más representativa esa población”, manifestó.

¿Qué dice el idioma digital?

Sabino Miranda Jiménez, investigador de Cátedras Conacyt, mencionó que el análisis de sentimientos ha sido un hot topic por la necesidad del gobierno y de la iniciativa privada de extraer la información vertida en las redes sociales y aprovechar las opiniones que realizan los internautas.

“Nos enfocamos solamente en lo que es Twitter y clasificar los mensajes como positivo o negativo, entonces lo que se hace es crear un modelo, que se llama espacio vectorial, donde tienen muchos componentes estos vectores, y se puede usar un marco de trabajo matemático, entonces se usan vectores y podemos utilizar cuestiones de álgebra lineal para poder mapear muchos mensajes”, explicó.

Oscar Salas Siordia0416Oscar Sánchez Siordia.Detalló que el texto del tuit se somete a un preprocesamiento, en el cual se consideran los URL, emoticones, hashtags y códigos específicos de Twitter, los cuales se agrupan. Asimismo, se lleva a cabo un proceso llamado streaming, el cual consiste en cortar los sufijos de las palabras, por ejemplo: en niños queda ‘niñ’ y ‘os’ se elimina, de esta forma niño, niña, niños y niñas, estas cuatros expresiones se reducen a una sola: ‘niñ’, pues con ello, en teoría, resulta más fácil encontrar parecidos y agruparlos.

“Eso es parte del procesamiento, se trata de estructurar ese mensaje a nivel de los humanos, de manera que pueda entenderlo un modelo matemático para hacer los cálculos y clasificar ese mensaje”, apuntó.

A su vez, Eric Sadit Téllez, investigador de Cátedras Conacyt, puntualizó que para el análisis de sentimientos también se requiere un clasificador, cuya función consiste en decidir a qué clase pertenece un mensaje por medio de patrones, para ello se utiliza una máquina de soporte vectorial que lleva a cabo este proceso de etiquetamiento utilizando hiperplanos.

“Intentamos resolver los problemas que vamos viendo, por ejemplo, los que escriben en Twitter tienen muchísimos errores ortográficos, variantes que son inducidas, expresiones; tratamos de entender ese lenguaje que no es un español estándar, estamos experimentando técnicas semánticas e ‘iqgramas’ (sic) para resolver esos problemas, y queremos además que sea una técnica que se pueda aplicar a cualquier idioma”, concluyó.

Análisis de datos

Óscar Sánchez Siordia, profesor investigador de Centrogeo, comentó que se ha vuelto necesario el análisis de las redes sociales por la gran cantidad de información que se registra en estas: en el mundo se generan 278 mil tuits cada minuto, se suben tres mil 600 fotos en Instagram cada segundo y en Facebook se dan 41.8 millones de likes. La información digital al 2014 se calculaba en 4.4 millones de zettabytes y se pronosticaba que dicha cifra se duplicaría cada 1.2 años, 70 por ciento de esa información la generaron los propios internautas y 90 por ciento se generó en los últimos dos años.

“El 59 por ciento de los mexicanos mayores a seis años ya tiene acceso a Internet, entre 13 y 34 años de edad el grueso de ellos, de nivel socioeconómico alto, medio y medio-bajo, con mayor penetración en el norte del país, en el sur casi no. El principal uso del Internet son las redes sociales, la más utilizada es Facebook, luego siguen Whatsapp, YouTube y Twitter; 90 por ciento de las personas tiene al menos una red social, tienen cinco en promedio. Los teléfonos celulares son los más utilizados para acceder a Internet”, precisó.

Para concluir, Sánchez Siordia destacó que en la actualidad es más fácil y económico poder almacenar información, por lo cual ahora lo que adquiere importancia es poder extraer información útil de ese cúmulo de datos, ya con las técnicas tradicionales no se puede analizar cualquier información, pues se requiere de estadística, matemáticas y de la interpretación de resultados.

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Con desarrollo de un biopolímero, científicos mexicanos rehabilitan médula espinal lesionada

18 agosto, 2016

18 agosto, 2016

FUENTE: AGENCIA ID Al reanudar la comunicación con el cerebro, se significa como el primer tratamiento en lograrlo en el...

Cristalografía de proteínas: una alternativa en el desarrollo de fármacos

9 agosto, 2017

9 agosto, 2017

Por Danya Irene Villegas Ciudad de México. (Agencia Informativa Conacyt).- Manuel Soriano García descubrió las propiedades medicinales en el amaranto, la...

Obtienen dos patentes científicos mexicanos por desarrollos que descontaminan el agua mediante la energía solar

22 marzo, 2018

22 marzo, 2018

Ambos han comprobado su efectividad en comunidades tarahumaras, donde el uso de cloro como desinfectante (descontaminante) no es aceptado El...

Científico mexicano participa de la primera secuenciación del genoma de un connacional con una enfermedad genética rara

26 octubre, 2016

26 octubre, 2016

El estudio lo realizó la Universidad de Harvard, y en el cual colaboró el genetista yucateco basado en Escocia donde...

Innovan biomédicos mexicanos metodología con técnicas nucleares para valorar calidad de leche materna

22 febrero, 2018

22 febrero, 2018

El desarrollo complementa las metodologías promovidas por el Organismo Internacional de la Energía Atómica y gana primer lugar en Investigación...

Estudiante diseña sistema administrador de combustible

18 noviembre, 2016

18 noviembre, 2016

Fresnillo, Zacatecas.  (Agencia Informativa Conacyt).- Con la finalidad de administrar el combustible en los vehículos, Jorge Andrés Luna Rosales, estudiante recién...

Laboratorio de Partículas Elementales, generador de conocimiento y tecnología en altas energías

23 septiembre, 2018

23 septiembre, 2018

Por Israel Pérez León, Guanajuato.  (Agencia Informativa Conacyt).- La Universidad de Guanajuato, campus León, es sede del Laboratorio de Partículas...

Bioseguridad en el espacio

5 julio, 2016

5 julio, 2016

AUTOR: Tania Robles FUENTE: AGENCIA INFORMATIVA CONACYT   Ciudad de México. 15 de junio de 2016 (Agencia Informativa Conacyt).- Para cumplir con...

Previene antioxidante daño causado por paracetamol

3 marzo, 2017

3 marzo, 2017

INSTITUTO POLÍTECNICO NACIONAL Ciudad de México, a 13 de febrero de 2017 COMUNICADO DE PRENSA C-102 La sobredosis y uso...

POLITÉCNICAS CREAN PERFUME QUE REGULA EL PH DEL CUERPO

2 marzo, 2016

2 marzo, 2016

Por Agencia Id Para neutralizar la acidez (pH) del cuerpo de las personas, estudiantes del Centro de Estudios Científicos y...

Diseñan pijamas quirúrgicas ergonómicas

17 marzo, 2017

17 marzo, 2017

Por Tomás Dávalos Aguascalientes, Aguascalientes.  (Agencia Informativa Conacyt).- Por invitación del Departamento de Estomatología de la Universidad Autónoma de Aguascalientes (UAA),...

Patentan científicos mexicanos innovador método para recuperar plomo de baterías de ácido-plomo

19 febrero, 2018

19 febrero, 2018

México es el quinto productor mundial del metal y las tendencias en el orbe apuntan a obtener mejor aprovechamiento aprovechamiento...

Crean nuevo dispositivo para implantes dentales

17 junio, 2016

17 junio, 2016

AUTOR: Boletín de prensa   FUENTE: CONACYT, AGENCIA INFORMATIVA CONACYT Aguascalientes, Aguascalientes.  (Agencia Informativa Conacyt).-David Masuoka Ito, profesor investigador del Departamento...

Estrés ocasionado por ruido, origen de enfermedades crónico degenerativas

8 julio, 2017

8 julio, 2017

Por Génesis Gatica Porcayo Ciudad de México.  (Agencia Informativa Conacyt).- La contaminación acústica está definidacomo el exceso de sonido y...

Ramiro Iglesias Leal, pionero mexicano de la cardiología espacial

19 noviembre, 2016

19 noviembre, 2016

Guadalajara, Jalisco.  (Agencia Informativa Conacyt).- El primer electrocardiograma enviado a la Tierra desde la órbita lunar fue interpretado por el doctor...