Evidencias linguisticas del plagio en el periodismo espanol/Linguistic evidence of plagiarism in Spanish journalism

En disputas legales por posible plagio se requiere la pericia de un lingüista forense. Los estudios en detección de plagio han establecido un umbral máximo del 50% de similitud léxica en textos producidos de forma independiente. En este artículo, se investiga la posibilidad de que los artículos peri...

Full description

Saved in:
Bibliographic Details
Published in:Estudios sobre el mensaje periodístico Vol. 24; no. 2; p. 1559
Main Authors: Queralt, Sheila, Zarauza, Montse Marquina, García, Roser Giménez
Format: Journal Article
Language:Spanish
Published: Universidad Complutense de Madrid 01-07-2018
Subjects:
Online Access:Get full text
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:En disputas legales por posible plagio se requiere la pericia de un lingüista forense. Los estudios en detección de plagio han establecido un umbral máximo del 50% de similitud léxica en textos producidos de forma independiente. En este artículo, se investiga la posibilidad de que los artículos periodísticos requieran un umbral propio puesto que parten de un mismo contenido informativo ("qué", "quién", "cuándo", "dónde", "cómo" y "por qué"). Para ello, se aplican 4 variables lingüísticas cuantitativas a dos corpus estructurados alrededor de 10 temas: un corpus de estudio formado por 50 artículos y un corpus de caso con 20 textos provenientes de un caso real. A partir del primero, se extraen umbrales para cada variable que reflejan los porcentajes de coincidencia esperables entre textos independientes. Estos umbrales se aplican después al corpus del caso para determinar si los nuevos umbrales permiten detectar todos los casos de plagio. Palabras clave: Periodismo; información; plagio; lingüística forense. The expertise of a forensic linguist is required in legal disputes about possible plagiarism cases. Studies in plagiarism detection have established a maximum threshold of 50% of lexical similarity in independently produced texts. This paper explores the possibility that journalistic articles require a specific similarity threshold since they share informative content ("what", "who", "when", "where", "how", and "why"). In order to do this, 4 quantitative linguistic variables are applied to two corpora structured around 10 different topics: a corpus of study comprising 50 articles and a case corpus including 20 texts from a real case. On the basis of the former, thresholds for each variable reflecting the expectable coincidence percentages between independent texts are extracted. These thresholds are then applied to the corpus of the case to determine whether the new thresholds allow for all the plagiarism cases to be detected. Keywords: Journalism; information; plagiarism; forensic linguistics.. Sumario. 1. Introducción. 2. Marco teórico; 2.1. La lingüística forense; 2.2. Detección de plagio; 2.3. Plagio en el ámbito del periodismo. 3. El caso. 4. Hipótesis y objetivos. 5. Metodología; 5.1. Corpus de estudio; 5.2. Corpus del caso Bryce; 5.3. Análisis; 5.4. Variables. 5.5. Stop list del caso. 6. Resultados; 6.1. Resultados por tema; 6.1.1. Umbral de similitud; 6.1.2. Frases coincidentes; 6.1.3. Vocabulario exclusivo; 6.1.4. Vocabulario compartido una sola vez; 6.1.5. Resultados finales del corpus de control; 6.2. Resultados del caso; 6.2.1. Umbral de similitud; 6.2.2. Frases coincidentes; 6.2.3. Vocabulario exclusivo; 6.2.4. Vocabulario compartido una sola vez. 7. Discusión. 8. Conclusiones. 9. Referencias bibliográficas. Cómo citar: Queralt, Sheila; Marquina Zarauza, Montse; y Giménez-García, Roser (2018): "Evidencias lingüísticas del plagio en el periodismo español ". Estudios sobre el Mensaje Periodístico 24 (2), 1559-1578.
ISSN:1134-1629
DOI:10.5209/ESMP.62234