Тематичне моделювання й аналіз емоцій у твіт-повідомленнях британських та американських політиків на тему війни в Україні

Автор(и)

  • Олена Карпіна Волинський національний університет імені Лесі Українки, Україна
  • Джастін Чен Мілтонська академія, США

DOI:

https://doi.org/10.29038/eejpl.2022.9.2.kar

Ключові слова:

лексична одиниця, неопрацьована частотність, відносна частотність, віртуальний дискурс, тематичне моделювання, аналіз емоцій, Твіттер

Анотація

Статтю присвячено дослідженню змістових та емотивних особливостей дописів чотирьох політиків, опублікованих в їхніх офіційних Твіттер акаунтах протягом трьох місяців російського вторгнення в Україну. Ми обрали двох британських політиків – прем’єр-міністра Великої Британії Бориса Джонсона та Іветт Купер, членкиню Палати громад від Лейбористської партії, тіньову міністерку внутрішніх справ Великої Британії – і двох американських політиків, – президента Джо Байдена та сенатора-республіканця Марко Рубіо. На першому етапі ми створили текстовий масив, що містить твіт-повідомлення чотирьох політиків, які було відібрано за тематикою війни в Україні. Для того, щоб вважатися схваленими, твіт-повідомлення повинні були містити такі слова, як Україна, росія, війна, путін, вторгнення, виявлені в одному контексті. На другому етапі ми визначили найчастотніші лексичні одиниці, що їх уживають політики для інформування світової спільноти про війну в Україні. Для цього ми скористалися програмою Voyant Tools, веб-додатком для текстового аналізу. Ці лексичні одиниці було розподілено на три групи за рівнем їхньої частотності: найчастотніші, другі за частотністю та треті за частотністю лексичні одиниці. Окрім того, ми виміряли розподіл найчастотніших лексичних одиниць у тримісячному часовому проміжку, щоб дослідити, як змінювалася їхня частотність протягом досліджуваного періоду. На третьому етапі ми проаналізували контекст ідентифікованих лексичних одиниць, які окреслюють тематику твіт-повідомлень у наборі даних. Для цього ми виявили колокації за допомогою бібліотеки NLTK. Під час останнього етапу дослідження ми виконали тематичне моделювання з використанням алгоритму вибірки Гіббса до багатоваріантного розподілу ймовірностей Діріхле та класифікацію емоцій за допомогою бібліотеки NRC Lexicon.

Завантажити

Дані для завантаження поки недоступні.

Біографії авторів

Посилання

Горошко Е. И., Полякова Т. Л. (2011) Лингвистические особенности англоязычного твиттера. Учені записки Таврійського національного університету імені Вернадського. Сер. Філологія. Соціальні комунікації, Т. 24(63). № 2(1), 53–58. URL: http://repository.kpi.kharkov.ua/handle/KhPI-Press/49133

Нерян С. О. (2018) Допис у соцмережі як мовленнєвий жанр інтернет- комунікації. Науковий вісник Херсонського державного університету, Сер. Лінгвістика, 33 (1), 66-70. URL: https://journals.indexcopernicus.com/api/file/viewByFileId/708692.pdf

Ніколаєва, Т. М. (2019). Лексико-семантичні аспекти мови соціальних мереж. Закарпатські філологічні студії, 9 (2), 96-101. URL: https://dspace.uzhnu.edu.ua/jspui/handle/lib/33170

Полякова Т. Л. (2021). Лексичні засоби в жанрі твітинг в англомовній політичній інтернет-комунікації. Закарпатські філологічні студії, 14 (1), 177-181. https://doi.org/10.32782/tps2663-4880/2020.14-1.32

Швелідзе Л. Д. (2021) Мовні засоби реалізації комунікативних стратегій у дискурсі соціальних мереж (на матеріалі української та англійської мов) (дис. … канд. філол. наук). Донецький національний університет імені Василя Стуса, Вінниця. URL: https://abstracts.donnu.edu.ua/article/view/9878

Bird, S. (2006). NLTK: the natural language toolkit. Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions (69-72). https://doi.org/10.3115/1225403.1225421

Crystal, D. (2011). A Microexample: Twitter. In Internet Linguistics: A Student Guide. (pp. 36-56). London and New York : Routledge. Taylor & Francis Group.

Mohammad, S. M., & Turney, P. D. (2013). NRC Emotion Lexicon. National Research Council, Canada. https://doi.org/10.4224/21270984

Weisser, C., Gerloff, C., Thielmann, A., Python, A., Reuter, A., Kneib, T., & Säfken, B. (2022). Pseudo-document simulation for comparing LDA, GSDMM and GPM topic models on short and sparse text using Twitter data. Computational Statistics, 1-28. http://dx.doi.org/10.1007/s00180-022-01246-z

Yin, J., & Wang, J. (2014). A dirichlet multinomial mixture model-based approach for short text clustering. Proceedings of the 20th ACM SIGKDD International Conference on Knowledge discovery and data mining, (233-242). https://doi.org/10.1145/2623330.2623715

References (translated and transliterated)

Bird, S. (2006). NLTK: the natural language toolkit. Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions (69-72). https://doi.org/10.3115/1225403.1225421

Crystal, D. (2011). A Microexample: Twitter. In Internet Linguistics: A Student Guide. (pp. 36-56). London and New York : Routledge. Taylor & Francis Group.

Goroshko E. I., Poliakova T. L. (2011). Lingvisticheskiie osobennosti angloiazychnogo tvittera. [Linguistic features of English-language Twitter]. Ucheni Zapysky Tavriiskoho Natsionalnoho Universytetu Imeni Vernadskoho. Filolohiia. Sotsialni Komunikatsii Series, 24(63), No 2–1, 53–58. Retrieved from http://repository.kpi.kharkov.ua/handle/KhPI-Press/49133

Mohammad, S. M., & Turney, P. D. (2013). NRC Emotion Lexicon. National Research Council, Canada. https://doi.org/10.4224/21270984

Nerian, S. O. (2018). Dopys u sotsmerezhi yak movlennievyi zhanr internet-komunikatsii. [A post in a social network as a speech genre of Internet communication]. Naukovyi Visnyk Khersonskoho Derzhavnoho Universytetu. Linhvistyka Series, 33 (1), 66-70. Retrieved from https://journals.indexcopernicus.com/api/file/viewByFileId/708692.pdf

Nikolaieva, T. M. (2019) Leksyko-semantychni aspekty movy sotsialnykh merezh [Lexico-semantic aspects of the social networks language]. Zakarpatski Filolohichni Studii, 9(2), 96-101. Retrieved from https://dspace.uzhnu.edu.ua/jspui/handle/lib/33170

Poliakova T. L. (2021). Leksychni zasoby v zhanri tvitynh v anhlomovnii politychnii internet-komunikatsii [Lexical means in the genre Tweeting in English political Internet communication]. Zakarpatski Filolohichni Studii, 14(1), 177-181. https://doi.org/10.32782/tps2663-4880/2020.14-1.32

Shvelidze, L. D. (2021) Movni zasoby realizatsii komunikatyvnykh stratehii u dyskursi sotsialnykh merezh (na materiali ukrainskoi ta anhliyskoi mov) [Linguistic Means of Implementation of Communicative Strategies in the Social Media Discourse (Based on the Ukrainian and English Languages)]. Unpublished doctoral dissertation. Extended abstract. Vasyl' Stus Donetsk National University, Vinnytsya. Retrieved from https://abstracts.donnu.edu.ua/article/view/9878

Weisser, C., Gerloff, C., Thielmann, A., Python, A., Reuter, A., Kneib, T., & Säfken, B. (2022). Pseudo-document simulation for comparing LDA, GSDMM and GPM topic models on short and sparse text using Twitter data. Computational Statistics, 1-28. http://dx.doi.org/10.1007/s00180-022-01246-z

Yin, J., & Wang, J. (2014). A dirichlet multinomial mixture model-based approach for short text clustering. Proceedings of the 20th ACM SIGKDD International Conference on Knowledge discovery and data mining, (233-242). https://doi.org/10.1145/2623330.2623715

Source

CJE gives recommendations for the use of words “orcs,” “ruscists,” and “putin” in the media. Retrieved from https://imi.org.ua/en/news/cje-gives-recommendations-for-the-use-of-words-orcs-ruscists-and-putin-in-the-media-i45817 (date of access: 7.12.2022)

Завантаження

Опубліковано

2022-12-26

Як цитувати

Карпіна, О., & Чен, Д. (2022). Тематичне моделювання й аналіз емоцій у твіт-повідомленнях британських та американських політиків на тему війни в Україні. Східноєвропейський журнал психолінгвістики , 9(2), 41-66. https://doi.org/10.29038/eejpl.2022.9.2.kar