26 June, 2022 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Desarrollan en la UNAM prototipo para detectar similitud de oraciones en textos diferentes

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx

• “Símil” es un proyecto del Grupo de Ingeniería Lingüística del Instituto de Ingeniería; hace comparaciones para saber si hay similitud o paráfrasis, pero no dictamina si se viola el derecho de autor, explicó Gerardo Sierra Martínez

El delito del plagio digital podría llegar a su fin. Los artífices del copy-paste pueden sentirse vulnerados ante una herramienta que se desarrolla en la UNAM. “Símil” es el nombre de este proyecto, en estado de prototipo; se trata de unsoftware que detecta la paráfrasis o similitud total de oraciones en diferentes textos, y los ordena y categoriza de mayor a menor.

Gerardo Sierra Martínez, titular del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, explicó que se pretende detectar la semejanza entre textos, aunque la idea no se exprese con las mismas palabras.

Este programa compara un par de textos para saber si hay similitud y paráfrasis, no dictamina si se citó o no se citó, o si se viola el derecho de autor; simplemente determina: “este texto es similar a este otro, eso es todo”, enfatizó.

Puede ser que leamos todo un documento y retomemos una idea de un párrafo, y una más de otro, y las combinemos para crear un texto propio, eso es paráfrasis; es reutilizar información que se tiene de otro documento, explicó.

Símil

El abordaje de “Símil” para buscar textos coincidentes es complejo, porque se indagan caracteres y se encuentran aquellos que están escritos tal cual en una oración.

Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia, apuntó el académico del II.

Para probar el programa se hizo un corpus propio de paráfrasis. “Regularmente se ensaya con los encabezados de las noticias; en nuestro caso fue con un texto de la historia del sushi, extraído de Wikipedia; es un escrito relativamente pequeño, con 27 frases, y se le proporcionó a varias personas (expertos, estudiantes e incluso niños) para que lo parafrasearan, con ciertas condiciones”.

Logramos que nuestro método hiciera una detección objetiva, pues mediante el uso de las matemáticas, números y la ciencia no hay manera de mentir al comparar automáticamente textos o corpus paralelos. “Así se establece cuáles son las palabras emparentadas, es decir, la similitud textual”, subrayó.

El programa universitario sistematiza las frases y muestra en una tabla en rojo las que tienen mucha cercanía al texto original, en amarillo las que tienen menor grado, y en gris las que casi no tienen similitud.

Sierra Martínez ejemplificó con una oración con paráfrasis baja del mencionado texto de Wikipedia. La original reza: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, y la oración parafraseada se lee: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Aumento del reúso de frases

Según el integrante del II, se ha incrementado el reúso de frases y de información, y es un hecho que se ha vuelto un hábito desde la educación básica. “A los niños les dicen que si sacan información de Internet no hay problema”.

Entonces, aunque alguien transcriba una tesis con sus propias palabras de principio a fin y le añada una serie de citas e información adicional, e incluso se usen recursos para disfrazar que se trata del mismo documento, siempre habrá cierto léxico que coincidirá.

Esta investigación se realiza con patrocinio del Consejo Nacional de Ciencia y Tecnología y fue derivada de otra que se emprendió hace cuatro años en la licenciatura en Ciencia Forense de la UNAM, la Universidad de Avignon y la Universidad Pompeu Fabra.

“La aportación de esta herramienta no será tan positiva para la gente que está acostumbrada a parafrasear, pero será benéfica en el ámbito académico, para que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”.

No es malo copiar y pegar, siempre y cuando se establezca dentro de ciertos límites. “Símil” es un proyecto de largo aliento que requiere auspicio y apoyo financiero para su continuidad, concluyó.

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Crea ITESM arena de drones

15 marzo, 2016

15 marzo, 2016

AUTOR: Israel Pérez FUENTE: AGENCIA INFORMATIVA CONACYT Santiago de Querétaro, Querétaro. 11 de marzo de 2016 (Agencia Informativa Conacyt).- Ante la necesidad...

¿Miel de México o de China?

21 abril, 2018

21 abril, 2018

Por Ricardo Capilla Ciudad de México.  (Agencia Informativa Conacyt).- El Centro de Investigación y Asistencia en Tecnología y Diseño del...

Investigadores mexicanos diseñan compresor de datos e imágenes

10 agosto, 2017

10 agosto, 2017

Por Tomás Dávalos Aguascalientes, Aguascalientes.  (Agencia Informativa Conacyt).- Hermilo Sánchez Cruz, secretario técnico de la Maestría en Ciencias con opción...

¿Por qué es importante la preservación digital del conocimiento?

30 noviembre, 2016

30 noviembre, 2016

Ciudad de México.  (Agencia Informativa Conacyt).- La producción y distribución de los recursos educativos y culturales a los que se tiene...

Cibnor innova tecnologías hidropónicas para climas áridos

27 abril, 2016

27 abril, 2016

AUTOR: Joel Cosío FUENTE: AGENCIA INFORMATIVA CONACYT La Paz, Baja California Sur.  (Agencia Informativa Conacyt).- En el Centro de Investigaciones Biológicas del...

Celebra 10 años Aeroclúster de Querétaro

26 agosto, 2016

26 agosto, 2016

AUTOR: Israel Pérez FUENTE: AGENCIA INFORMATIVA CONACYT Santiago de Querétaro, Querétaro. (Agencia Informativa Conacyt).- A 10 años de distancia, el Aeroclúster de...

Youtuber mexicana al servicio de la ciencia

18 octubre, 2017

18 octubre, 2017

Por Génesis Gatica Porcayo Ciudad de México.  (Agencia Informativa Conacyt).- Comúnmente se conoce a YouTube como un medio de entretenimiento...

Crean estudiantes mexicanos singular prototipo que optimiza la extracción y trituración de piedra para producir cemento

18 febrero, 2018

18 febrero, 2018

El dispositivo será financiado e incubado por inversionistas de Estados Unidos Un grupo interdisciplinario de alumnos y egresados de la...

¿Qué hay que saber sobre los virus?

7 enero, 2017

7 enero, 2017

Ciudad de México.  (Agencia Informativa Conacyt).- Aunque son agentes infecciosos que han estado presentes a lo largo de la historia del...

Presenta General Motors ¡llantas que no se ponchan!

10 junio, 2019

10 junio, 2019

General Motors presentó el prototipo de ¡una llanta que no se poncha!, se llama Uptis y se fabricó en alianza con Michelin

Firman Convenio de Colaboración el Instituto Mexicano de la Propiedad Industrial y el Observatorio Nacional Ciudadano

24 abril, 2017

24 abril, 2017

Ciudad de México, .- El día de ayer se llevó a cabo la firma del Convenio de Colaboración entre el...

Los automóviles del futuro se comunicarán entre sí: Raúl Rojas

19 abril, 2016

19 abril, 2016

AUTOR: Verenise Sánchez FUENTE: AGENCIA INFORMATIVA CONACYT Guadalajara, Jalisco.  (Agencia Informativa Conacyt).- Con la próxima entrada al mercado de los vehículos autónomos...

Seguridad en minas: patentan activación controlada de cerillos eléctricos

26 agosto, 2016

26 agosto, 2016

AUTOR: Erika Socorro Rodríguez FUENTE: AGENCIA INFORMATIVA CONACYT Guadalupe, Zacatecas.  (Agencia Informativa Conacyt).- La empresa zacatecana Hardware and Software Integrated Technologies...

Mexicano en Australia logra cultivar neuronas en mini cerebro impreso en 3D

9 febrero, 2017

9 febrero, 2017

En los modelos creados se demostró que las células cerebrales no se dañaron, permanecieron vivas y se reprodujeron A fin...

Desarrolla IPN turbina eólica de uso residencial

28 septiembre, 2018

28 septiembre, 2018

Por Armando Bonilla Ciudad de México.  (Agencia Informativa Conacyt).- Un prototipo de aerogenerador de uso residencial que cuenta con un...