Inicio  /  Historias
CIENCIA Y TECNOLOGíA

Algoritmo identifica ‘fake news’ con alta precisión

Las Universidades de Michigan, en Estados Unidos, y Ámsterdam, en Países Bajos, colaboraron en la creación de un algoritmo que identifica de forma automática contenido falso en internet, a través de la construcción de bases de datos que comparan las diferencias lingüísticas existentes entre noticias falsas, conocidas como “fake news”, y verdaderas, con una precisión comparable a la de una persona.

Este trabajo no se centra en el uso de noticias satíricas ni de noticias que fueron comprobadas por organizaciones especializadas, al contrario, emplearon noticias falsas y verdaderas para desarrollar un algoritmo que las pueda diferenciar, mediante un sistema de procesamiento de lenguaje natural (NLP System, en inglés), explicaron los desarrolladores.

Los humanos identifican con mayor facilidad las noticias falsas relacionadas con personas famosas. (AP, archivo)

Los investigadores establecieron ciertos aspectos necesarios para separar contenido verdadero y falso en noticias, entre los que destacan tener disponibles ejemplos tanto veraces como engañosos para comparar que las noticias estén en formato de texto digital, recoger contenido que tenga una base de verdad verificable, que los textos a comparar mantengan una extensión y estructura similares o considerar los factores lingüísticos y culturales, ya que pueden modificar el contenido de una publicación.

Después de marcar estos parámetros de identificación, los investigadores crearon dos bases de datos donde recoger las noticias que sirven para configurar el algoritmo.

La primera de las fases contiene noticias verdaderas de seis temáticas: Deportes, negocios, entretenimiento, política, tecnología y educación, procedentes de medios de comunicación legítimos, como CNN, New York Times, entre otros, que los investigadores comprobaron de forma manual.

También, contiene noticias falsas procedentes de la comunidad de Amazon Mechanical Turk (AMT).

Las noticias falsas se crearon a partir de las noticias verdaderas, ya presentes en la base de datos. Los participantes de AMT retocaron ciertos aspectos de esas noticias, pero mantuvieron la estructura y la mayoría de los rasgos con el objetivo de que permaneciera al máximo el estilo periodístico, para facilitar las comparaciones.

Una vez realizada la primera base, se creó la segunda base de datos, integrada exclusivamente por contenido extraído directamente de la web.

El algoritmo detecta con una mayor precisión las noticias falsas relacionadas con temas serios. (AP, archivo)

El objetivo de la segunda fase era encontrar “fake news” que se habían generado directamente en internet. El contenido proviene en gran medida de cuentas de compañías y personalidades famosas.

También, se trabajó con dos pares de noticias: Con el titular falso y el legítimo.

Además, los investigadores realizaron una comparación de eficacia entre la habilidad de las personas para identificar estas noticias falsas y las del algoritmo.

Los investigadores concluyeron que los humanos identifican con mayor facilidad las noticias falsas relacionadas con personas famosas, mientras que el algoritmo detecta con una mayor precisión las “fake news” relacionadas con temas serios.

 

Con información de Excelsior.

 

RMT