19 March, 2024 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Desarrollan en la UNAM prototipo para detectar similitud de oraciones en textos diferentes

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx

• “Símil” es un proyecto del Grupo de Ingeniería Lingüística del Instituto de Ingeniería; hace comparaciones para saber si hay similitud o paráfrasis, pero no dictamina si se viola el derecho de autor, explicó Gerardo Sierra Martínez

El delito del plagio digital podría llegar a su fin. Los artífices del copy-paste pueden sentirse vulnerados ante una herramienta que se desarrolla en la UNAM. “Símil” es el nombre de este proyecto, en estado de prototipo; se trata de unsoftware que detecta la paráfrasis o similitud total de oraciones en diferentes textos, y los ordena y categoriza de mayor a menor.

Gerardo Sierra Martínez, titular del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, explicó que se pretende detectar la semejanza entre textos, aunque la idea no se exprese con las mismas palabras.

Este programa compara un par de textos para saber si hay similitud y paráfrasis, no dictamina si se citó o no se citó, o si se viola el derecho de autor; simplemente determina: “este texto es similar a este otro, eso es todo”, enfatizó.

Puede ser que leamos todo un documento y retomemos una idea de un párrafo, y una más de otro, y las combinemos para crear un texto propio, eso es paráfrasis; es reutilizar información que se tiene de otro documento, explicó.

Símil

El abordaje de “Símil” para buscar textos coincidentes es complejo, porque se indagan caracteres y se encuentran aquellos que están escritos tal cual en una oración.

Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia, apuntó el académico del II.

Para probar el programa se hizo un corpus propio de paráfrasis. “Regularmente se ensaya con los encabezados de las noticias; en nuestro caso fue con un texto de la historia del sushi, extraído de Wikipedia; es un escrito relativamente pequeño, con 27 frases, y se le proporcionó a varias personas (expertos, estudiantes e incluso niños) para que lo parafrasearan, con ciertas condiciones”.

Logramos que nuestro método hiciera una detección objetiva, pues mediante el uso de las matemáticas, números y la ciencia no hay manera de mentir al comparar automáticamente textos o corpus paralelos. “Así se establece cuáles son las palabras emparentadas, es decir, la similitud textual”, subrayó.

El programa universitario sistematiza las frases y muestra en una tabla en rojo las que tienen mucha cercanía al texto original, en amarillo las que tienen menor grado, y en gris las que casi no tienen similitud.

Sierra Martínez ejemplificó con una oración con paráfrasis baja del mencionado texto de Wikipedia. La original reza: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, y la oración parafraseada se lee: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Aumento del reúso de frases

Según el integrante del II, se ha incrementado el reúso de frases y de información, y es un hecho que se ha vuelto un hábito desde la educación básica. “A los niños les dicen que si sacan información de Internet no hay problema”.

Entonces, aunque alguien transcriba una tesis con sus propias palabras de principio a fin y le añada una serie de citas e información adicional, e incluso se usen recursos para disfrazar que se trata del mismo documento, siempre habrá cierto léxico que coincidirá.

Esta investigación se realiza con patrocinio del Consejo Nacional de Ciencia y Tecnología y fue derivada de otra que se emprendió hace cuatro años en la licenciatura en Ciencia Forense de la UNAM, la Universidad de Avignon y la Universidad Pompeu Fabra.

“La aportación de esta herramienta no será tan positiva para la gente que está acostumbrada a parafrasear, pero será benéfica en el ámbito académico, para que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”.

No es malo copiar y pegar, siempre y cuando se establezca dentro de ciertos límites. “Símil” es un proyecto de largo aliento que requiere auspicio y apoyo financiero para su continuidad, concluyó.

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Estudiantes construyen detector de partículas de bajo costo

10 junio, 2018

10 junio, 2018

Por Verenise Sánchez  Ciudad de México.  (Agencia Informativa Conacyt).- Con mucha creatividad y un incipiente pero sólido talento científico, siete jóvenes...

La extracción de gas shale en México, una apuesta costosa: Luca Ferrari

7 agosto, 2017

7 agosto, 2017

Boletín de prensa no.369 La extracción de gas shale en México, una apuesta costosa: Luca Ferrari La inversión para extraer el...

Crean dispositivo que disminuye 20% del uso de combustible en camiones de carga

3 agosto, 2016

3 agosto, 2016

FUENTE: AGENCIA ID La innovación no daña al motor ni genera un sobrecalentamiento, además contribuye a reducir los gases de efecto...

Sistemas híbridos de energía del CICY

20 julio, 2017

20 julio, 2017

Por Marytere Narváez Mérida, Yucatán.  (Agencia Informativa Conacyt).- Creada en 2015, a partir de la llegada de investigadores de Cátedras Conacyt,...

Laboratorio de Internet de las Cosas

23 marzo, 2016

23 marzo, 2016

AUTOR: Erika Socorro Rodríguez   FUENTE:  AGENCIA INFORMATIVA CONACYT   Zacatecas, Zacatecas. 16 de marzo de 2016 (Agencia Informativa Conacyt).- El Consejo...

Proyectos de desarrollo científico y tecnológico para atender problemas regionales y nacionales

2 agosto, 2018

2 agosto, 2018

Por Mercedes López Ciudad de México.  (Agencia Informativa Conacyt).- El Consejo Nacional de Ciencia y Tecnología (Conacyt), a través del...

Crean ambientes inteligentes para adultos mayores

22 septiembre, 2016

22 septiembre, 2016

Por Karla Navarro Ensenada, Baja California. 26 de agosto de 2016 (Agencia Informativa Conacyt).- Investigadores del Cuerpo Académico de Tecnologías para...

Premian a científico mexicano por sus aportes e innovación en antivenenos

2 marzo, 2018

2 marzo, 2018

Desde hace más de 30 años se dedica al estudio e investigación básica de las proteínas del veneno del alacrán...

Tecnólogos de la mixteca crean sistema opto-mecatrónico que realiza funciones biológicas del ojo humano

15 noviembre, 2016

15 noviembre, 2016

Se contempla su implementación en visión robótica, diagnóstico de padecimientos ópticos y con fines educativos A fin de profundizar en...

Muchas universidades y pocas patentes

27 noviembre, 2018

27 noviembre, 2018

Por Génesis Gatica  Ciudad de México.  (Agencia Informativa Conacyt).- La medicina traslacional es uno de los modelos de investigación más utilizados...

Transformará CDMX desechos plásticos en bienes útiles

1 agosto, 2017

1 agosto, 2017

Boletín de prensa no.355 Transformará CDMX desechos plásticos en bienes útiles  ·        Inauguran centro especializado que permitirá el desarrollo de la...

Crean app para optimizar rutas de transporte público de Zacatecas

30 diciembre, 2016

30 diciembre, 2016

Zacatecas, Zacatecas.  (Agencia Informativa Conacyt).- En la Unidad Profesional Interdisciplinaria de Ingeniería, campus Zacatecas (UPIIZ) del Instituto Politécnico Nacional (IPN), el...

Google y la UAS documentan biodiversidad de Sinaloa

19 febrero, 2017

19 febrero, 2017

Culiacán, Sinaloa. 2 de febrero de 2017 (Agencia Informativa Conacyt).- Un convenio de colaboración entre la compañía Google y la Universidad...

Se reúnen más de 600 talentos innovadores en Guadalajara

8 abril, 2016

8 abril, 2016

Por Verenise Sánchez Guadalajara, Jalisco. 6 de abril de 2016 (Agencia Informativa Conacyt).- Provenientes de más de 34 países, más de...

Participa en el Premio Cofece de Investigación 2016

15 enero, 2017

15 enero, 2017

Ciudad de México. (Agencia Informativa Conacyt).- La Comisión Federal de Competencia Económica (Cofece) convoca al Premio Cofece de Investigación 2016, cuyo...