17 January, 2020 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Desarrollan en la UNAM prototipo para detectar similitud de oraciones en textos diferentes

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx

• “Símil” es un proyecto del Grupo de Ingeniería Lingüística del Instituto de Ingeniería; hace comparaciones para saber si hay similitud o paráfrasis, pero no dictamina si se viola el derecho de autor, explicó Gerardo Sierra Martínez

El delito del plagio digital podría llegar a su fin. Los artífices del copy-paste pueden sentirse vulnerados ante una herramienta que se desarrolla en la UNAM. “Símil” es el nombre de este proyecto, en estado de prototipo; se trata de unsoftware que detecta la paráfrasis o similitud total de oraciones en diferentes textos, y los ordena y categoriza de mayor a menor.

Gerardo Sierra Martínez, titular del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, explicó que se pretende detectar la semejanza entre textos, aunque la idea no se exprese con las mismas palabras.

Este programa compara un par de textos para saber si hay similitud y paráfrasis, no dictamina si se citó o no se citó, o si se viola el derecho de autor; simplemente determina: “este texto es similar a este otro, eso es todo”, enfatizó.

Puede ser que leamos todo un documento y retomemos una idea de un párrafo, y una más de otro, y las combinemos para crear un texto propio, eso es paráfrasis; es reutilizar información que se tiene de otro documento, explicó.

Símil

El abordaje de “Símil” para buscar textos coincidentes es complejo, porque se indagan caracteres y se encuentran aquellos que están escritos tal cual en una oración.

Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia, apuntó el académico del II.

Para probar el programa se hizo un corpus propio de paráfrasis. “Regularmente se ensaya con los encabezados de las noticias; en nuestro caso fue con un texto de la historia del sushi, extraído de Wikipedia; es un escrito relativamente pequeño, con 27 frases, y se le proporcionó a varias personas (expertos, estudiantes e incluso niños) para que lo parafrasearan, con ciertas condiciones”.

Logramos que nuestro método hiciera una detección objetiva, pues mediante el uso de las matemáticas, números y la ciencia no hay manera de mentir al comparar automáticamente textos o corpus paralelos. “Así se establece cuáles son las palabras emparentadas, es decir, la similitud textual”, subrayó.

El programa universitario sistematiza las frases y muestra en una tabla en rojo las que tienen mucha cercanía al texto original, en amarillo las que tienen menor grado, y en gris las que casi no tienen similitud.

Sierra Martínez ejemplificó con una oración con paráfrasis baja del mencionado texto de Wikipedia. La original reza: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, y la oración parafraseada se lee: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Aumento del reúso de frases

Según el integrante del II, se ha incrementado el reúso de frases y de información, y es un hecho que se ha vuelto un hábito desde la educación básica. “A los niños les dicen que si sacan información de Internet no hay problema”.

Entonces, aunque alguien transcriba una tesis con sus propias palabras de principio a fin y le añada una serie de citas e información adicional, e incluso se usen recursos para disfrazar que se trata del mismo documento, siempre habrá cierto léxico que coincidirá.

Esta investigación se realiza con patrocinio del Consejo Nacional de Ciencia y Tecnología y fue derivada de otra que se emprendió hace cuatro años en la licenciatura en Ciencia Forense de la UNAM, la Universidad de Avignon y la Universidad Pompeu Fabra.

“La aportación de esta herramienta no será tan positiva para la gente que está acostumbrada a parafrasear, pero será benéfica en el ámbito académico, para que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”.

No es malo copiar y pegar, siempre y cuando se establezca dentro de ciertos límites. “Símil” es un proyecto de largo aliento que requiere auspicio y apoyo financiero para su continuidad, concluyó.

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

Alexandria, educación para médicos y estudiantes a través de realidad virtual

6 febrero, 2017

6 febrero, 2017

Ciudad de México.  (Agencia Informativa Conacyt).- La palabra Alexandria se remonta al siglo III a. C., el lugar donde se construyó...

Conoce el Banco de Germoplasma

15 julio, 2017

15 julio, 2017

Por Tomás Dávalos Pabellón de Arteaga, Aguascalientes.  (Agencia Informativa Conacyt).- El Instituto Nacional de Investigaciones Forestales, Agropecuarias y Pecuarias (INIFAP)...

IPN combate la tuberculosis con extracto vegetal

2 octubre, 2016

2 octubre, 2016

Los compuestos de la planta aceitilla tienen la capacidad de atravesar la pared celular de las bacterias La tuberculosis es...

Dispositivo a bajo costo para detectar gases tóxicos

9 junio, 2018

9 junio, 2018

Por Karla Navarro Ensenada, Baja California.  (Agencia Informativa Conacyt).- Un calentador que funciona por medio de gas LP genera dióxido...

Estudiantes crean casa inteligente que es controlada a través del celular

12 julio, 2016

12 julio, 2016

AUTOR: Janet Cacelín FUENTE: AGENCIA INFORMATIVA CONACYT Ciudad de México. (Agencia Informativa Conacyt).- Ante los altos índices de delincuencia registrados en diversas...

Soluciones para el Futuro en el IPN

7 abril, 2018

7 abril, 2018

Para la edición 2018 del “Premio al Emprendimiento Politécnico” se busca alcanzar 2 mil registros, por lo que se establecieron...

Llega vocho eléctrico al Zócalo de la Ciudad de México

20 octubre, 2016

20 octubre, 2016

Ciudad de México.  (Agencia Informativa Conacyt).- Entre las piezas que el Centro de Ciencias de Sinaloa (CCS) exhibe en la Semana...

Huerto IBERO: Naturación de azoteas urbanas para cuidar el medio ambiente

8 abril, 2017

8 abril, 2017

UNIVERSIDAD IBEROAMERICANA Ciudad de México – Tijuana DCI-2017P180 http://www.ibero.mx/prensa Twitter: @prensaibero Lunes 27 de marzo de 2017 · La Universidad Iberoamericana...

Creó investigador mexicano un topógrafo corneal de alta competitividad

29 marzo, 2016

29 marzo, 2016

  FUENTE: AGENCIA ID   * Evalúa de manera precisa deformaciones de la superficie de la córnea y posibilita la detección de...

Desarrolla consorcio científico mexicano sistema que detecta en tiempo real fugas y tomas clandestinas de ductos para Pemex

18 enero, 2019

18 enero, 2019

Se basa en inteligencia artificial y ha probado su eficacia en la propia paraestatal, en la UNAM y el IMP;...

Descubren polímero para vacunar contra bacteria que provoca la tristeza de cítricos

7 noviembre, 2016

7 noviembre, 2016

De no tratarse, el patógeno podría secar al 100 por ciento de cultivos de cítricos en varios estados de la...

Mexicanos innovan recubrimiento que captura y degrada gases contaminantes

23 agosto, 2016

23 agosto, 2016

FUENTE: AGENCIA ID El material nano estructurado convierte las sustancias tóxicas en biodegradables Ante la creciente necesidad de generar alternativas...

Crean estudiantes biofertilizante para zonas áridas

19 febrero, 2018

19 febrero, 2018

Por Tomás Dávalos El Llano, Aguascalientes.  (Agencia Informativa Conacyt).- Un equipo de estudiantes del Instituto Tecnológico El Llano —perteneciente al Tecnológico...

Desarrollan software para monitoreo de signos vitales

23 septiembre, 2016

23 septiembre, 2016

Por Amelia Gutiérrez Solís Colima, Colima. 11 de agosto de 2016 (Agencia Informativa Conacyt).- PlaIMoS App es uno de los productos...

Gesture Therapy mejora la movilidad tras accidentes cardiovasculares

25 diciembre, 2018

25 diciembre, 2018

Por Dalia Patiño González  Tonantzintla, Puebla.  (Agencia Informativa Conacyt).- El 13 de mayo, don José, un hombre de 67 años, se...