24 April, 2024 Revista Digital sobre Patentes, Marcas y Propiedad Intelectual

Desarrollan en la UNAM prototipo para detectar similitud de oraciones en textos diferentes

FUENTE: Asociación Nacional de Universidades e Instituciones de Educación Superior, ANUIES, www.anuies.mx

• “Símil” es un proyecto del Grupo de Ingeniería Lingüística del Instituto de Ingeniería; hace comparaciones para saber si hay similitud o paráfrasis, pero no dictamina si se viola el derecho de autor, explicó Gerardo Sierra Martínez

El delito del plagio digital podría llegar a su fin. Los artífices del copy-paste pueden sentirse vulnerados ante una herramienta que se desarrolla en la UNAM. “Símil” es el nombre de este proyecto, en estado de prototipo; se trata de unsoftware que detecta la paráfrasis o similitud total de oraciones en diferentes textos, y los ordena y categoriza de mayor a menor.

Gerardo Sierra Martínez, titular del Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería (II) de la UNAM, explicó que se pretende detectar la semejanza entre textos, aunque la idea no se exprese con las mismas palabras.

Este programa compara un par de textos para saber si hay similitud y paráfrasis, no dictamina si se citó o no se citó, o si se viola el derecho de autor; simplemente determina: “este texto es similar a este otro, eso es todo”, enfatizó.

Puede ser que leamos todo un documento y retomemos una idea de un párrafo, y una más de otro, y las combinemos para crear un texto propio, eso es paráfrasis; es reutilizar información que se tiene de otro documento, explicó.

Símil

El abordaje de “Símil” para buscar textos coincidentes es complejo, porque se indagan caracteres y se encuentran aquellos que están escritos tal cual en una oración.

Las personas utilizan sinónimos, pero los sustantivos, que son las palabras clave, difícilmente saben decirlas de otra manera; por eso es importante indicar que el texto o idea referida no es propia, apuntó el académico del II.

Para probar el programa se hizo un corpus propio de paráfrasis. “Regularmente se ensaya con los encabezados de las noticias; en nuestro caso fue con un texto de la historia del sushi, extraído de Wikipedia; es un escrito relativamente pequeño, con 27 frases, y se le proporcionó a varias personas (expertos, estudiantes e incluso niños) para que lo parafrasearan, con ciertas condiciones”.

Logramos que nuestro método hiciera una detección objetiva, pues mediante el uso de las matemáticas, números y la ciencia no hay manera de mentir al comparar automáticamente textos o corpus paralelos. “Así se establece cuáles son las palabras emparentadas, es decir, la similitud textual”, subrayó.

El programa universitario sistematiza las frases y muestra en una tabla en rojo las que tienen mucha cercanía al texto original, en amarillo las que tienen menor grado, y en gris las que casi no tienen similitud.

Sierra Martínez ejemplificó con una oración con paráfrasis baja del mencionado texto de Wikipedia. La original reza: “El resultado era un pescado conservado en una pieza y con un olor desagradable”, y la oración parafraseada se lee: “Lo que concluyó que el pescado conservado tiene mal olor y en una sola pieza”.

Aumento del reúso de frases

Según el integrante del II, se ha incrementado el reúso de frases y de información, y es un hecho que se ha vuelto un hábito desde la educación básica. “A los niños les dicen que si sacan información de Internet no hay problema”.

Entonces, aunque alguien transcriba una tesis con sus propias palabras de principio a fin y le añada una serie de citas e información adicional, e incluso se usen recursos para disfrazar que se trata del mismo documento, siempre habrá cierto léxico que coincidirá.

Esta investigación se realiza con patrocinio del Consejo Nacional de Ciencia y Tecnología y fue derivada de otra que se emprendió hace cuatro años en la licenciatura en Ciencia Forense de la UNAM, la Universidad de Avignon y la Universidad Pompeu Fabra.

“La aportación de esta herramienta no será tan positiva para la gente que está acostumbrada a parafrasear, pero será benéfica en el ámbito académico, para que los alumnos aprendan a citar lo que toman de otro documento y sepan dar referencias adecuadas”.

No es malo copiar y pegar, siempre y cuando se establezca dentro de ciertos límites. “Símil” es un proyecto de largo aliento que requiere auspicio y apoyo financiero para su continuidad, concluyó.

Comparte tu opinión sobre este artículo

Comentarios

Related Posts

¿Cómo se ve una escultura arqueológica en un tomógrafo?

6 febrero, 2017

6 febrero, 2017

Tepic, Nayarit. (Agencia Informativa Conacyt).- Dos de las esculturas arqueológicas más importantes de Nayarit, de la tradición de las tumbas de...

Crean investigadores mexicanos sistema que clasifica e interpreta ladridos de perros ante posibles eventos de alarma

16 abril, 2018

16 abril, 2018

Para situaciones de seguridad, el software califica cuatro estados emocionales del can y envía señales a computadoras o teléfonos Una...

Semáforos inalámbricos, solares y sincronizados

17 abril, 2017

17 abril, 2017

Por Amelia Gutiérrez Solís Colima, Colima. (Agencia Informativa Conacyt).- La Universidad de Colima (Ucol), el Centro de Investigación y de...

Investigan tratamiento del agua con nanomateriales

18 septiembre, 2016

18 septiembre, 2016

AUTOR: Tomás Dávalos FUENTE: AGENCIA INFORMATIVA CONACYT Aguascalientes, Aguascalientes.  (Agencia Informativa Conacyt).- Iliana Ernestina Medina Ramírez, profesora investigadora de la Universidad...

Ingenieros del Tec diseñan detector de infuenza

24 julio, 2017

24 julio, 2017

Por Érika Rodríguez Zacatecas, Zacatecas. 12 de julio de 2017 (Agencia Informativa Conacyt).- Un equipo interdisciplinario de ingenieros recién egresados...

Crean científicos juguete para invidentes

20 julio, 2017

20 julio, 2017

Boletín de prensa no.347   Crean científicos juguete para invidentes   ·        Los investigadores del CINVESTAV-Saltillo buscan además que con el...

Conacyt y el gobierno de Yucatán lanzan convocatoria de fortalecimiento de la infraestructura tecnológica

14 octubre, 2017

14 octubre, 2017

Por Mercedes López Ciudad de México.  (Agencia Informativa Conacyt).- Con el propósito de apoyar proyectos científicos, tecnológicos y de innovación...

Hydropure: tratamiento de aguas con flores y bacterias

28 marzo, 2017

28 marzo, 2017

Por Montserrat Muñoz Guadalajara, Jalisco.  (Agencia Informativa Conacyt).- Un equipo de expertos del Centro de Investigación y Asistencia en Tecnología y...

Alexa de Amazon podría escucharte antes de que le hables

24 mayo, 2019

24 mayo, 2019

Amazon Echo podrían hacer cualquier tarea sin que tengas que pronunciar en voz alta la palabra Alexa para abrir el comando para ordenar tareas

Convocan a Semana del Cerebro en Querétaro

8 marzo, 2016

8 marzo, 2016

Por  Israel Perez Fuente: Agencia Informativa CONACYT   Santiago de Querétaro, Querétaro. 3 de marzo de 2016 (Agencia Informativa Conacyt).- Con...

México frente al desarrollo de inteligencia artificial

27 marzo, 2017

27 marzo, 2017

Por Armando Bonilla Ciudad de México. (Agencia Informativa Conacyt).- Con el objetivo de discutir el panorama y desarrollo de la inteligencia...

Trick Eye: el primer museo de realidad aumentada en México

10 diciembre, 2018

10 diciembre, 2018

Por Hugo Valencia Juliao Ciudad de México.  (Agencia Informativa Conacyt).- El primer museo de realidad aumentada en México acercará las obras...

Revolucionan medios de comunicación la forma como se percibe el mundo

27 enero, 2017

27 enero, 2017

UNIVERSIDAD AUTÓNOMA METROPOLITANA Campus Xochimilco Boletín Número 021 13 de enero de 2017 En los últimos tres años se ha...

Construyen microsatélite en la Ucol

14 abril, 2016

14 abril, 2016

Colima, Colima. 11 de abril de 2016 (Agencia Informativa Conacyt).- Estudiantes de la Facultad de Telemática de la Universidad de Colima...

Tratamiento quirúrgico controla la diabetes tipo 2 en más de 85% de pacientes

31 agosto, 2017

31 agosto, 2017

Existen estudios serios que garantizan el éxito del procedimiento en las personas con poco sobrepeso La práctica de la cirugía...