Тематичне моделювання й аналіз емоцій у твіт-повідомленнях британських та американських політиків на тему війни в Україні
DOI:
https://doi.org/10.29038/eejpl.2022.9.2.karКлючові слова:
лексична одиниця, неопрацьована частотність, відносна частотність, віртуальний дискурс, тематичне моделювання, аналіз емоцій, ТвіттерАнотація
Статтю присвячено дослідженню змістових та емотивних особливостей дописів чотирьох політиків, опублікованих в їхніх офіційних Твіттер акаунтах протягом трьох місяців російського вторгнення в Україну. Ми обрали двох британських політиків – прем’єр-міністра Великої Британії Бориса Джонсона та Іветт Купер, членкиню Палати громад від Лейбористської партії, тіньову міністерку внутрішніх справ Великої Британії – і двох американських політиків, – президента Джо Байдена та сенатора-республіканця Марко Рубіо. На першому етапі ми створили текстовий масив, що містить твіт-повідомлення чотирьох політиків, які було відібрано за тематикою війни в Україні. Для того, щоб вважатися схваленими, твіт-повідомлення повинні були містити такі слова, як Україна, росія, війна, путін, вторгнення, виявлені в одному контексті. На другому етапі ми визначили найчастотніші лексичні одиниці, що їх уживають політики для інформування світової спільноти про війну в Україні. Для цього ми скористалися програмою Voyant Tools, веб-додатком для текстового аналізу. Ці лексичні одиниці було розподілено на три групи за рівнем їхньої частотності: найчастотніші, другі за частотністю та треті за частотністю лексичні одиниці. Окрім того, ми виміряли розподіл найчастотніших лексичних одиниць у тримісячному часовому проміжку, щоб дослідити, як змінювалася їхня частотність протягом досліджуваного періоду. На третьому етапі ми проаналізували контекст ідентифікованих лексичних одиниць, які окреслюють тематику твіт-повідомлень у наборі даних. Для цього ми виявили колокації за допомогою бібліотеки NLTK. Під час останнього етапу дослідження ми виконали тематичне моделювання з використанням алгоритму вибірки Гіббса до багатоваріантного розподілу ймовірностей Діріхле та класифікацію емоцій за допомогою бібліотеки NRC Lexicon.Завантажити
Посилання
Горошко Е. И., Полякова Т. Л. (2011) Лингвистические особенности англоязычного твиттера. Учені записки Таврійського національного університету імені Вернадського. Сер. Філологія. Соціальні комунікації, Т. 24(63). № 2(1), 53–58. URL: http://repository.kpi.kharkov.ua/handle/KhPI-Press/49133
Нерян С. О. (2018) Допис у соцмережі як мовленнєвий жанр інтернет- комунікації. Науковий вісник Херсонського державного університету, Сер. Лінгвістика, 33 (1), 66-70. URL: https://journals.indexcopernicus.com/api/file/viewByFileId/708692.pdf
Ніколаєва, Т. М. (2019). Лексико-семантичні аспекти мови соціальних мереж. Закарпатські філологічні студії, 9 (2), 96-101. URL: https://dspace.uzhnu.edu.ua/jspui/handle/lib/33170
Полякова Т. Л. (2021). Лексичні засоби в жанрі твітинг в англомовній політичній інтернет-комунікації. Закарпатські філологічні студії, 14 (1), 177-181. https://doi.org/10.32782/tps2663-4880/2020.14-1.32
Швелідзе Л. Д. (2021) Мовні засоби реалізації комунікативних стратегій у дискурсі соціальних мереж (на матеріалі української та англійської мов) (дис. … канд. філол. наук). Донецький національний університет імені Василя Стуса, Вінниця. URL: https://abstracts.donnu.edu.ua/article/view/9878
Bird, S. (2006). NLTK: the natural language toolkit. Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions (69-72). https://doi.org/10.3115/1225403.1225421
Crystal, D. (2011). A Microexample: Twitter. In Internet Linguistics: A Student Guide. (pp. 36-56). London and New York : Routledge. Taylor & Francis Group.
Mohammad, S. M., & Turney, P. D. (2013). NRC Emotion Lexicon. National Research Council, Canada. https://doi.org/10.4224/21270984
Weisser, C., Gerloff, C., Thielmann, A., Python, A., Reuter, A., Kneib, T., & Säfken, B. (2022). Pseudo-document simulation for comparing LDA, GSDMM and GPM topic models on short and sparse text using Twitter data. Computational Statistics, 1-28. http://dx.doi.org/10.1007/s00180-022-01246-z
Yin, J., & Wang, J. (2014). A dirichlet multinomial mixture model-based approach for short text clustering. Proceedings of the 20th ACM SIGKDD International Conference on Knowledge discovery and data mining, (233-242). https://doi.org/10.1145/2623330.2623715
References (translated and transliterated)
Bird, S. (2006). NLTK: the natural language toolkit. Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions (69-72). https://doi.org/10.3115/1225403.1225421
Crystal, D. (2011). A Microexample: Twitter. In Internet Linguistics: A Student Guide. (pp. 36-56). London and New York : Routledge. Taylor & Francis Group.
Goroshko E. I., Poliakova T. L. (2011). Lingvisticheskiie osobennosti angloiazychnogo tvittera. [Linguistic features of English-language Twitter]. Ucheni Zapysky Tavriiskoho Natsionalnoho Universytetu Imeni Vernadskoho. Filolohiia. Sotsialni Komunikatsii Series, 24(63), No 2–1, 53–58. Retrieved from http://repository.kpi.kharkov.ua/handle/KhPI-Press/49133
Mohammad, S. M., & Turney, P. D. (2013). NRC Emotion Lexicon. National Research Council, Canada. https://doi.org/10.4224/21270984
Nerian, S. O. (2018). Dopys u sotsmerezhi yak movlennievyi zhanr internet-komunikatsii. [A post in a social network as a speech genre of Internet communication]. Naukovyi Visnyk Khersonskoho Derzhavnoho Universytetu. Linhvistyka Series, 33 (1), 66-70. Retrieved from https://journals.indexcopernicus.com/api/file/viewByFileId/708692.pdf
Nikolaieva, T. M. (2019) Leksyko-semantychni aspekty movy sotsialnykh merezh [Lexico-semantic aspects of the social networks language]. Zakarpatski Filolohichni Studii, 9(2), 96-101. Retrieved from https://dspace.uzhnu.edu.ua/jspui/handle/lib/33170
Poliakova T. L. (2021). Leksychni zasoby v zhanri tvitynh v anhlomovnii politychnii internet-komunikatsii [Lexical means in the genre Tweeting in English political Internet communication]. Zakarpatski Filolohichni Studii, 14(1), 177-181. https://doi.org/10.32782/tps2663-4880/2020.14-1.32
Shvelidze, L. D. (2021) Movni zasoby realizatsii komunikatyvnykh stratehii u dyskursi sotsialnykh merezh (na materiali ukrainskoi ta anhliyskoi mov) [Linguistic Means of Implementation of Communicative Strategies in the Social Media Discourse (Based on the Ukrainian and English Languages)]. Unpublished doctoral dissertation. Extended abstract. Vasyl' Stus Donetsk National University, Vinnytsya. Retrieved from https://abstracts.donnu.edu.ua/article/view/9878
Weisser, C., Gerloff, C., Thielmann, A., Python, A., Reuter, A., Kneib, T., & Säfken, B. (2022). Pseudo-document simulation for comparing LDA, GSDMM and GPM topic models on short and sparse text using Twitter data. Computational Statistics, 1-28. http://dx.doi.org/10.1007/s00180-022-01246-z
Yin, J., & Wang, J. (2014). A dirichlet multinomial mixture model-based approach for short text clustering. Proceedings of the 20th ACM SIGKDD International Conference on Knowledge discovery and data mining, (233-242). https://doi.org/10.1145/2623330.2623715
Source
CJE gives recommendations for the use of words “orcs,” “ruscists,” and “putin” in the media. Retrieved from https://imi.org.ua/en/news/cje-gives-recommendations-for-the-use-of-words-orcs-ruscists-and-putin-in-the-media-i45817 (date of access: 7.12.2022)
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Авторське право (c) 2022 Olena Karpina, Justin Chen
Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.