Algoritmo identifica ‘fake news’ con alta precisión

Algoritmo identifica ‘fake news’ con alta precisión

Los investigadores buscan identificar con precisión las 'fake news'. (Getty Images, archivo)

Las Universidades de Michigan, en Estados Unidos, y Ámsterdam, en Países Bajos, colaboraron en la creación de un algoritmo que identifica de forma automática contenido falso en internet, a través de la construcción de bases de datos que comparan las diferencias lingüísticas existentes entre noticias falsas, conocidas como “fake news”, y verdaderas, con una precisión comparable a la de una persona.

Este trabajo no se centra en el uso de noticias satíricas ni de noticias que fueron comprobadas por organizaciones especializadas, al contrario, emplearon noticias falsas y verdaderas para desarrollar un algoritmo que las pueda diferenciar, mediante un sistema de procesamiento de lenguaje natural (NLP System, en inglés), explicaron los desarrolladores.

Los humanos identifican con mayor facilidad las noticias falsas relacionadas con personas famosas. (AP, archivo)

Los humanos identifican con mayor facilidad las noticias falsas relacionadas con personas famosas. (AP, archivo)

Los investigadores establecieron ciertos aspectos necesarios para separar contenido verdadero y falso en noticias, entre los que destacan tener disponibles ejemplos tanto veraces como engañosos para comparar que las noticias estén en formato de texto digital, recoger contenido que tenga una base de verdad verificable, que los textos a comparar mantengan una extensión y estructura similares o considerar los factores lingüísticos y culturales, ya que pueden modificar el contenido de una publicación.

Después de marcar estos parámetros de identificación, los investigadores crearon dos bases de datos donde recoger las noticias que sirven para configurar el algoritmo.

Facebook calificará credibilidad de usuarios que denuncian fake news

La primera de las fases contiene noticias verdaderas de seis temáticas: Deportes, negocios, entretenimiento, política, tecnología y educación, procedentes de medios de comunicación legítimos, como CNN, New York Times, entre otros, que los investigadores comprobaron de forma manual.

También, contiene noticias falsas procedentes de la comunidad de Amazon Mechanical Turk (AMT).

Las noticias falsas se crearon a partir de las noticias verdaderas, ya presentes en la base de datos. Los participantes de AMT retocaron ciertos aspectos de esas noticias, pero mantuvieron la estructura y la mayoría de los rasgos con el objetivo de que permaneciera al máximo el estilo periodístico, para facilitar las comparaciones.

Una vez realizada la primera base, se creó la segunda base de datos, integrada exclusivamente por contenido extraído directamente de la web.

El algoritmo detecta con una mayor precisión las noticias falsas relacionadas con temas serios. (AP, archivo)

El algoritmo detecta con una mayor precisión las noticias falsas relacionadas con temas serios. (AP, archivo)

El objetivo de la segunda fase era encontrar “fake news” que se habían generado directamente en internet. El contenido proviene en gran medida de cuentas de compañías y personalidades famosas.

También, se trabajó con dos pares de noticias: Con el titular falso y el legítimo.

Además, los investigadores realizaron una comparación de eficacia entre la habilidad de las personas para identificar estas noticias falsas y las del algoritmo.

Los investigadores concluyeron que los humanos identifican con mayor facilidad las noticias falsas relacionadas con personas famosas, mientras que el algoritmo detecta con una mayor precisión las “fake news” relacionadas con temas serios.

Fake News: Sismo en CDMX por festejos tras gol de México a Alemania

 

Con información de Excelsior.

 

RMT

CARGANDO...