ЗАСТОСУВАННЯ ПРОГРАМНОГО ПАКЕТУ R У НАУКОВИХ ДОСЛІДЖЕННЯХ МАЙБУТНІХ ФІЛОЛОГІВ
Інформаційні технології і засоби навчання
View Archive InfoField | Value | |
Title |
ЗАСТОСУВАННЯ ПРОГРАМНОГО ПАКЕТУ R У НАУКОВИХ ДОСЛІДЖЕННЯХ МАЙБУТНІХ ФІЛОЛОГІВ
USING R IN THE RESEARCH BY FUTURE PHILOLOGISTS ПРИМЕНЕНИЕ ПРОГРАММНОГО ПАКЕТА R В НАУЧНЫХ ИССЛЕДОВАНИЯХ БУДУЩИХ ФИЛОЛОГОВ |
|
Creator |
Zhukovska, Victoriia V.
Mosiiuk, Oleksandr O. Komarenko, Veronika V. |
|
Subject |
статистична система аналізу даних R; корпус академічного мовлення; маркери зменшення категоричності; -критерій Колмогорова-Смірнова; U-критерій Манна-Уітн
R statistical software environment; corpus of academic speech; hedges; the Kolmogorov-Smirnov test; the Mann-Whitney U Test статистическая система анализа данных R; корпус академической речи; маркеры уменьшение категоричности; -критерий Колмогорова-Смирнова; U-критерий Манна-Уитни |
|
Description |
Одним із новітніх напрямів прикладного мовознавства є корпусна лінгвістика, яка займається побудовою, обробленням та експлуатацією текстових корпусів. На сьогодні якісний аналіз величезних масивів емпіричного мовного матеріалу, що надає в розпорядження лінгвіста корпус, неможливо здійснити без залучення комп’ютерних технологій і відповідних статистичних методів. Відтак навчання майбутніх філологів ефективно застосовувати прикладні статистичні програми є важливим етапом наукової підготовки спеціалістів цього напряму. Запропонована стаття розкриває можливості використання однієї з найпоширеніших у західній лінгвістиці, але маловідомої в Україні, статистичної системи аналізу даних – програмного комплексу R – у дослідженнях майбутніх філологів. У роботі розкриваються переваги й недоліки цього продукту порівняно з іншими подібними програмними пакетами (SPSS і Statistica), а також надаються посилання на матеріали в мережі Internet для самостійного опанування зазначеним програмним засобом. Гнучкість й ефективність застосування програмного комплексу R для розв’язання мовознавчих завдань продемонстровано на прикладі статистичного аналізу вживання маркерів зменшення категоричності у корпусі американського академічного мовлення. Для правильного розуміння філологами-початківцями особливостей проведення лінгвостатистичного експерименту в R наведено детальний опис кожного етапу здійсненого дослідження. Статистична верифікація вживання маркерів зменшення категоричності висловлення в мовленні студентів і викладачів була здійснена з використанням таких статистичних методів як -критерій Колмогорова-Смірнова та U-критерій Манна-Уітні. У статті наводяться розроблені алгоритми для проведення розрахунків за допомогою зазначених критеріїв із використанням вбудованих команд і різних спеціалізованих бібліотечних функцій R, створених співтовариством користувачів для розширення функціональності зазначеного програмного комплексу. Кожен скрипт, написаний на R для проведення статистичних розрахунків, супроводжується детальним описом та характеристикою отриманих результатів обчислень. Серед перспектив подальших досліджень з окресленої проблематики необхідно звернути увагу на реалізацію низки заходів, спрямованих на підвищення обізнаності майбутніх спеціалістів із статистичною системою аналізу даних і навчання їх роботи з R, що є важливим для фахового зростання майбутнього науковця-філолога.
Corpus linguistics is a newly emerging field of study in applied linguistics that deals with construction, processing, and exploitation of text corpora. To date, a high-quality analysis of vast amounts of empirical language data provided by computerized corpora is impossible without computer technologies and relevant statistical methods. Therefore, teaching future philologists to effectively apply statistical computer programs is an important stage in their research training. The article discusses the possibilities of using one of the leading in Western linguistics, but not well-known in Ukraine, software packages for statistical data analysis – R statistical software environment – in the research by future philologists. The paper reveals the advantages and disadvantages of this program in comparison with other similar software packages (SPSS and Statistica) and provides Internet links to R self-learn tutorials. The flexibility and efficacy of R for linguistic research are demonstrated on the example of a statistical analysis of the use of hedges in the corpus of academic speech. For novice philologists to properly understand the peculiarities of conducting a statistical linguistic experiment with R, a detailed description of each stage of the study is provided. The statistical verification of hedges in the speech of students and lecturers was carried out using such statistical methods as the Kolmogorov–Smirnov test and the Mann-Whitney U Test. The article presents the developed algorithms to calculate the specified tests applying the built-in commands and various specialized library functions, created by R user community to enhance the functionality of this statistical software. Each script for statistical calculations in R is accompanied by a detailed description and interpretation of the results obtained. Further study of the issue will involve a number of activities aimed at raising awareness and improving skills of future philologists in using R statistical software, which is important for their professional development as researchers. Одним из новейших направлений прикладного языкознания является корпусная лингвистика, которая занимается построением, обработкой и эксплуатацией текстовых корпусов. Сегодня качественный анализ огромных массивов эмпирического языкового материала, который предоставляет в распоряжение лингвиста корпус, невозможно осуществить без привлечения компьютерных технологий и соответствующих статистических методов. Поэтому обучение будущих филологов эффективно использовать прикладные статистические программы является важным этапом научной подготовки специалистов этого направления. Предложенная статья раскрывает возможности использования одной из наиболее распространенных в западной лингвистике, но малоизвестной в Украине, статистической системы анализа данных – программного комплекса R – в исследованиях будущих филологов. В работе раскрываются преимущества и недостатки этого продукта по сравнению с другими подобными программными пакетами (SPSS и Statistica), а также предоставляются ссылки на материалы в сети Internet для самостоятельного освоения указанного программного средства. Гибкость и эффективность применения программного комплекса R для решения языковедческих задач продемонстрировано на примере статистического анализа употребления маркеров уменьшение категоричности в корпусе американской академической речи. Для правильного понимания начинающими филологами особенностей проведения лингвостатистического эксперимента в R предоставлено подробное описание каждого этапа проведенного исследования. Статистическая верификация употребления маркеров уменьшения категоричности высказывания в речи студентов и преподавателей была осуществлена с использованием таких статистических методов, как -критерий Колмогорова-Смирнова и U-критерий Манна-Уитни. В статье представлены разработанные алгоритмы для проведения вычислений с помощью указанных критериев с использованием уже встроенных команд и различных специализированных библиотечных функций R, созданных сообществом пользователей для расширения функциональности указанного программного комплекса. Каждый скрипт, написанный на R для проведения статистических подсчетов, сопровождается подробным описанием и характеристикой полученных результатов вычислений. Среди перспектив дальнейших исследований по обозначенной проблематике необходимо обратить внимание на реализацию ряда мероприятий, направленных на повышение осведомленности будущих специалистов со статистической системой анализа данных и обучение их работы с R, что является важным для профессионального роста будущего ученого-филолога. |
|
Publisher |
Institute of Information Technologies and Learning Tools of NAES of Ukraine
|
|
Contributor |
—
— — |
|
Date |
2018-09-30
|
|
Type |
info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion Peer-reviewed Article — рецензируемая статья — рецензована стаття — |
|
Format |
application/pdf
|
|
Identifier |
https://journal.iitta.gov.ua/index.php/itlt/article/view/2196
|
|
Source |
Information Technologies and Learning Tools; Vol 66, No 4 (2018); 272-285
Информационные технологии и средства обучения; Vol 66, No 4 (2018); 272-285 Інформаційні технології і засоби навчання; Vol 66, No 4 (2018); 272-285 Інформаційні технології і засоби навчання; Vol 66, No 4 (2018); 272-285 2076-8184 |
|
Language |
ukr
|
|
Relation |
https://journal.iitta.gov.ua/index.php/itlt/article/view/2196/1375
|
|
Rights |
Copyright (c) 2018 Victoriia V. Zhukovska, Oleksandr O. Mosiiuk, Veronika V. Komarenko
http://creativecommons.org/licenses/by-nc-sa/4.0 |
|