A content analysis software system for efficient monitoring and detection of hate speech in online media
Електронна бібліотека НАПН України
View Archive InfoField | Value | |
Relation |
https://lib.iitta.gov.ua/id/eprint/742533/
http://CEUR-WS.org/Vol-3679/Paper.06.pdf |
|
Title |
A content analysis software system for efficient monitoring and detection of hate speech in online media
Програмна система аналізу контенту для ефективного моніторингу та виявлення мови ворожнечі в онлайн-ЗМІ |
|
Creator |
Krylova-Grek, Yuliya
Burov, O. Yu. |
|
Subject |
004.77 General networking applications and services
32 Politics 80 General questions relating to both linguistics and literature. Philology |
|
Description |
This paper presents the results of interdisciplinary project that is a combination of computer program and psycholinguistic approach to media study. In the research we presented the programs that can be used for monitoring and analysis of media content to identify hate speech at its early stage. The aims of research were the following: 1) develop content analysis program for monitoring Russian media outlets; 2) apply the psycholinguistic approach for identifying hidden and manipulative hate speech. In the research there were used two types of content-analysis: quantitative and qualitative. Quantitative content analysis was conducted with computer program that was developed to select publication that could have contained hate speech. For qualitative content analysis the psycholinguistic method of text analysis was used. The method applies for identification methods and tolls that journalists use to incriminate hidden and manipulative hate speech. It is hypothesized that programs of content-analysis help to optimize work and makes it less time-consuming and more effective for analyst, journalists and other specialists who involved into media study. Methods. Quantitative content analysis, psycholinguistic method of qualitative content-analysis. Quantitative content analysis was developed with Python programming language. The publications were selected according to the key words, periods of search (month) and the name of outlet. The list of key words includes words that are used in media for discrimination, dehumanization, and marginalization of objects of hate. Implementation such a program helped to reduce time of monitoring of media outlets. The qualitative content-analysis was conducted with the authors’ psycholinguistic method of text analysis that can be applied for analyzing media texts. The programs of content analysis were applied within the project “Hate Speech in Online Media Publicizing Events in Crimea”. The results were published in a data analysis report on spreading the hate speech in the Russian language media communicating the armed Ukraine – Russia conflict and events related to it in Crimea on a regular base (December 2020 – May 2021). The research showed that the content analysis programs used in the project are useful tools for systematizing and processing data in humanities research and can be used by a wide range of specialist who have deal with collection and processing of information (media, communication, human rights and so on).
Ця стаття представляє результати міждисциплінарного проекту, який є поєднанням комп’ютерної програми та психолінгвістичного підходу до вивчення медіа. У дослідженні ми представили програми, які можна використовувати для моніторингу та аналізу медіаконтенту для виявлення мови ворожнечі на ранній стадії. Цілями дослідження були: 1) розробка програми контент-аналізу для моніторингу російських ЗМІ; 2) застосувати психолінгвістичний підхід для виявлення прихованої та маніпулятивної мови ворожнечі. У дослідженні було використано два види контент-аналізу: кількісний та якісний. Кількісний контент-аналіз проводився за допомогою комп’ютерної програми, розробленої для відбору публікацій, які могли містити мову ворожнечі. Для якісного контент-аналізу використовувався психолінгвістичний метод аналізу тексту. Метод застосовується до методів ідентифікації та зборів, які журналісти використовують для інкримінації прихованої та маніпулятивної мови ворожнечі. Існує гіпотеза, що програми контент-аналізу допомагають оптимізувати роботу та роблять її менш трудомісткою та більш ефективною для аналітиків, журналістів та інших спеціалістів, які займаються вивченням ЗМІ. методи. Кількісний контент-аналіз, психолінгвістичний метод якісного контент-аналізу. Кількісний контент-аналіз розроблено за допомогою мови програмування Python. Публікації відбиралися за ключовими словами, періодами пошуку (місяць) та назвою видання. Перелік ключових слів включає слова, які використовуються в ЗМІ для дискримінації, дегуманізації та маргіналізації об’єктів ненависті. Впровадження такої програми дозволило скоротити час моніторингу ЗМІ. Якісний контент-аналіз проводився за авторською психолінгвістичною методикою аналізу тексту, яка може бути застосована для аналізу медіатекстів. Програми контент-аналізу були застосовані в рамках проекту «Мова ворожнечі в онлайн-ЗМІ, які висвітлюють події в Криму». Результати опубліковані в звіті про аналіз даних про поширення мови ворожнечі в російськомовних ЗМІ, які регулярно розповідають про збройний українсько-російський конфлікт і пов’язані з ним події в Криму (грудень 2020 – травень 2021). Дослідження показало, що програми контент-аналізу, які використовуються в проекті, є корисними інструментами для систематизації та обробки даних у гуманітарних дослідженнях і можуть використовуватися широким колом спеціалістів, які мають справу зі збором та обробкою інформації (медіа, комунікація, права людини тощо). |
|
Publisher |
CEUR Workshop Proceedings
|
|
Date |
2024
|
|
Type |
Article
PeerReviewed |
|
Format |
text
|
|
Language |
en
|
|
Identifier |
https://lib.iitta.gov.ua/id/eprint/742533/1/paper06.pdf
- Krylova-Grek, Yuliya (orcid.org/0000-0002-2377-3781 <http://orcid.org/0000-0002-2377-3781>) and Burov, O. Yu. (orcid.org/0000-0003-0733-1120 <http://orcid.org/0000-0003-0733-1120>) (2024) A content analysis software system for efficient monitoring and detection of hate speech in online media Proceedings of the 11th Workshop on Cloud Technologies in Education (CTE 2023). Kryvyi Rih, Ukraine, December 22, 2023 (3679). pp. 224-233. ISSN 1613-0073 |
|