25 August, 2019 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Desarrollan en la UNAM prototipo para detectar similitud de oraciones en textos diferentes

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx

• “Símil” es un proyecto del Grupo de Ingeniería Lingüística del Instituto de Ingeniería; hace comparaciones para saber si hay similitud o paráfrasis, pero no dictamina si se viola el derecho de autor, explicó Gerardo Sierra Martínez

El delito del plagio digital podría llegar a su fin. Los artífices del copy-paste pueden sentirse vulnerados ante una herramienta que se desarrolla en la UNAM. “Símil” es el nombre de este proyecto, en estado de prototipo; se trata de unsoftware que detecta la paráfrasis o similitud total de oraciones en diferentes textos, y los ordena y categoriza de mayor a menor.

Gerardo Sierra Martínez, titular del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, explicó que se pretende detectar la semejanza entre textos, aunque la idea no se exprese con las mismas palabras.

Este programa compara un par de textos para saber si hay similitud y paráfrasis, no dictamina si se citó o no se citó, o si se viola el derecho de autor; simplemente determina: “este texto es similar a este otro, eso es todo”, enfatizó.

Puede ser que leamos todo un documento y retomemos una idea de un párrafo, y una más de otro, y las combinemos para crear un texto propio, eso es paráfrasis; es reutilizar información que se tiene de otro documento, explicó.

Símil

El abordaje de “Símil” para buscar textos coincidentes es complejo, porque se indagan caracteres y se encuentran aquellos que están escritos tal cual en una oración.

Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia, apuntó el académico del II.

Para probar el programa se hizo un corpus propio de paráfrasis. “Regularmente se ensaya con los encabezados de las noticias; en nuestro caso fue con un texto de la historia del sushi, extraído de Wikipedia; es un escrito relativamente pequeño, con 27 frases, y se le proporcionó a varias personas (expertos, estudiantes e incluso niños) para que lo parafrasearan, con ciertas condiciones”.

Logramos que nuestro método hiciera una detección objetiva, pues mediante el uso de las matemáticas, números y la ciencia no hay manera de mentir al comparar automáticamente textos o corpus paralelos. “Así se establece cuáles son las palabras emparentadas, es decir, la similitud textual”, subrayó.

El programa universitario sistematiza las frases y muestra en una tabla en rojo las que tienen mucha cercanía al texto original, en amarillo las que tienen menor grado, y en gris las que casi no tienen similitud.

Sierra Martínez ejemplificó con una oración con paráfrasis baja del mencionado texto de Wikipedia. La original reza: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, y la oración parafraseada se lee: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Aumento del reúso de frases

Según el integrante del II, se ha incrementado el reúso de frases y de información, y es un hecho que se ha vuelto un hábito desde la educación básica. “A los niños les dicen que si sacan información de Internet no hay problema”.

Entonces, aunque alguien transcriba una tesis con sus propias palabras de principio a fin y le añada una serie de citas e información adicional, e incluso se usen recursos para disfrazar que se trata del mismo documento, siempre habrá cierto léxico que coincidirá.

Esta investigación se realiza con patrocinio del Consejo Nacional de Ciencia y Tecnología y fue derivada de otra que se emprendió hace cuatro años en la licenciatura en Ciencia Forense de la UNAM, la Universidad de Avignon y la Universidad Pompeu Fabra.

“La aportación de esta herramienta no será tan positiva para la gente que está acostumbrada a parafrasear, pero será benéfica en el ámbito académico, para que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”.

No es malo copiar y pegar, siempre y cuando se establezca dentro de ciertos límites. “Símil” es un proyecto de largo aliento que requiere auspicio y apoyo financiero para su continuidad, concluyó.

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Estudiante de Conalep crea sistema de asistencia acústica para personas discapacidad visual

12 diciembre, 2016

12 diciembre, 2016

Tepic, Nayarit.  (Agencia Informativa Conacyt).- Pamela Nicole Miranda Arreola, estudiante del Colegio Nacional de Educación Profesional y Técnica (Conalep) 169 de...

El hongo que amenaza al vino mexicano

25 junio, 2017

25 junio, 2017

Por Karla Navarro Ensenada, Baja California.  (Agencia Informativa Conacyt).- Estudios en torno al funcionamiento molecular del hongo Lasiodiplodia theobromae son...

Diseñan en Centro de Investigación en Querétaro sistema que emplea energía solar para deshidratación de productos en la industria alimentaria

11 mayo, 2016

11 mayo, 2016

FUENTE: AGENCIA ID Además de amigable con el ambiente es un concepto modular de aplicación versátil. A solicitud de una empresa...

Conacyt y el INEE lanzan convocatoria de Investigación para la Evaluación de la Educación

21 enero, 2017

21 enero, 2017

Ciudad de México. (Agencia Informativa Conacyt).- El Consejo Nacional de Ciencia y Tecnología (Conacyt) y el Instituto Nacional para la Evaluación...

Revelan patente de Microsoft de computadora plegable

4 julio, 2019

4 julio, 2019

El aparato es bastante similar al Surface Book 2 de Microsoft, pues ambos son plegables y cuenta con dos pantallas que se unen a través de una bisagra

Patentan científicos mexicanos método para obtener biocombustibles de microalgas

21 junio, 2018

21 junio, 2018

El proyecto dio pie al registro de cuatro patentes y la publicación de cinco textos indexados, además de hacer la...

Desarrollan técnica de ozonización para tratamiento de aguas residuales

23 septiembre, 2016

23 septiembre, 2016

Por Janneth Aldecoa Culiacán, Sinaloa. 29 de agosto de 2016 (Agencia Informativa Conacyt).- La Junta de Agua Potable y Alcantarillado de...

Diseñan sistema para apoyo a zonas de desastre

3 abril, 2017

3 abril, 2017

Por Amelia Gutiérrez Solís Colima, Colima.  (Agencia Informativa Conacyt).- En la empresa colimense Rasoft S.A. de C.V., desarrollan el prototipo...

¿Alegría? La UNAM desarrolla antidepresivo a partir del amaranto

10 mayo, 2017

10 mayo, 2017

Fuente: sin embargo, www.sinembargo.mx Con base en el contenido de la proteína de esta semilla mexicana, Manuel Soriano García, investigador...

Destaca científica mexicana en GB en el entendimiento de la mecánica de la piel con fines médicos

7 junio, 2018

7 junio, 2018

La connacional interpreta la operatividad del órgano más grande del cuerpo desde su perfil como ingeniera y forma parte de...

El uso de la computadora: su relevancia en la economía y el trabajo

19 agosto, 2018

19 agosto, 2018

Por Felipe Sánchez Banda Saltillo, Coahuila. (Agencia Informativa Conacyt).- Actualmente en México, cerca de 50 por ciento de la población...

Nueva clase de fármaco aparte de regular glucosa del paciente diabético posibilita otros beneficios

3 julio, 2016

3 julio, 2016

FUENTE: AGENCIA ID   La cápsula además disminuye triglicéridos, eleva colesterol bueno y regula la presión arterial, pero debe tener seguimiento...

Premian investigación para el tratamiento de hemangioma infantil

9 febrero, 2016

9 febrero, 2016

Por Alan Gómez FUENTE: Agencia Informativa CONACYT Ensenada, Baja California. 8 de febrero de 2016 (Agencia Informativa Conacyt).- El Premio Nacional...

¿Qué son las ciencias penales?

24 noviembre, 2016

24 noviembre, 2016

Ciudad de México. 6 (Agencia Informativa Conacyt).- Las ciencias penales son áreas de investigación fundamentales en el juicio penal, la investigación...

Diseñan estructuras para focalizar energía undimotriz

24 marzo, 2017

24 marzo, 2017

Por Karla Navarro Ensenada, Baja California. (Agencia Informativa Conacyt).- El diseño de una estructura que sumergida en el mar focalice la...