Presidential elections in Peru: text mining of La República newspaper publishers

Authors

DOI:

https://doi.org/10.26441/RC22.1-2023-3025

Keywords:

Peru; Presidential elections; Text mining; Editorials; La República newspaper

Abstract

It analyzes the editorials of the Peruvian newspaper La República published from May 5 to June 6, 2021, dates in which the political campaigns for the second round of elections for the presidency of Peru took place. The aim is to discover relevant information to understand the use of the terminologies communicated through the written language in that newspaper. Using the text mining technique and machine learning algorithms for the analysis of unstructured data, a dendrogram and clusters were created to validate and estimate the groupings of the most frequent terms. In relation to each candidate, the regression analysis shows a differentiated association in the use of words. These words form a network that expresses the political conjuncture of the period under study and is reinforced by the construction of a cloud of words with the highest frequency of use. It is concluded that the media construct their own social representations on various local and national issues in a way that consciously or unconsciously evidences their preferences. These preferences are not foreign in the editorials of the newspaper La República. The importance of conducting this type of study lies in the potential of the theory of social representations to place the researcher in front of the position held by the subjects, who construct and communicate the antagonistic onslaughts of the national social reality.

Metrics

Metrics Loading ...

Author Biographies

Mariela Lucina Castro Cáceres, Independiente

Licenciada en Bibliotecología y Ciencias de la Información por la Universidad Nacional Mayor de San Marcos y Maestra en Educación con mención en Informática y Tecnología Educativa por la Universidad San Martín de Porres. Líneas de investigación: Análisis de la información, Organización de la información, Cienciometría. mlcastrocaceres@gmail.com, https://orcid.org/0000-0003-0949-0352

David Alejandro Chávez Salazar, Universidad de Lima

Bachiller en Bibliotecología y Ciencias de la Información, Bibliotecólogo del Área de Apoyo a la Investigación en la Biblioteca de la Universidad de Lima. Líneas de investigación: Análisis de la información, Organización de la información, Cienciometría. dchavez@ulima.edu.pe, https://orcid.org/0000-0002-7169-7672

Rubén Urbizagástegui Alvarado, Universidad de California en Riverside

Doctor en Ciencia de la Información por la Universidad Federal de Minas Gerais (Brasil). Maestro en Bibliotecología por la Universidad de Pittsburgh (EEUU), Bibliotecólogo en la Universidad de California en Riverside (EEUU). Sus principales líneas de investigación son: Análisis de la información, Sociología de la información y Cienciometría. ruben@ucr.edu, https://orcid.org/0000-0001-5014-801X

References

Al Khatib, K., Wachsmuth, H., Kiesel, J., Hagen, M., y Stein, B. (2016, December). A news editorial corpus for mining argumentation strategies. In Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers, 3433-3443. https://aclanthology.org/C16-1324/

Aranha, C. y Passos, E. (2006). A tecnologia de mineração de textos. Revista Eletrônica de Sistemas de Informação, 5(2), 1-8. https://doi.org/10.21529/RESI.2006.0502001 DOI: https://doi.org/10.21529/RESI.2006.0502001

Argumedo Solano, L. (2016). Análisis comparativo de la presentación del género de opinión en la página editorial de los diarios “La República” y “Diario Uno” en la campaña política a la presidencia de la República, 1 al 15 de abril, 2016 [Tesis de Licenciatura, Universidad César Vallejo, Lima, Perú]. https://hdl.handle.net/20.500.12692/2350

Benoit, K. y Obeng, A. (2021). Readtext Import and Handling for Plain and Formatted Text Files. R package (version 0.81) [Software]. https://CRAN.R-project.org/package=readtext

Bouchet-Valat, M. (2020). SnowballC: Snowball Stemmers Based on the C 'libstemmer' UTF-8 Library [Software]. https://cran.r-project.org/web/packages/SnowballC/index.html

Bykov, I. A. (2020). Studying political discourse of the President address in Russia with the text mining technique. Journal of Philosophy, Culture and Political Science, 3, 68-75. https://doi.org/10.26577/jpcp.2020.v73.i3.08 DOI: https://doi.org/10.26577/jpcp.2020.v73.i3.08

Cárdenas Neira, C., Cabalin, C. y Montero, L. (2017). Análisis crítico de editoriales y su influencia en la conformación de políticas sobre la calidad de la educación en Chile: Los casos de La Tercera y El Mercurio. Estudios pedagógicos (Valdivia), 43(1), 19-39. https://dx.doi.org/10.4067/S0718-07052017000100002 DOI: https://doi.org/10.4067/S0718-07052017000100002

Csardi, G. y Nepusz, T. (2006). The igraph software package for complex network research. InterJournal, Complex Systems, 1695(5), 1-9. https://www.researchgate.net/publication/221995787_The_Igraph_Software_Package_for_Complex_Network_Research

Cuevas, Y. (enero–junio, 2011). Representaciones sociales en la prensa: aportaciones teóricas y metodológicas. Sinéctica, 36, 1–19. http://www.scielo.org.mx/pdf/sine/n36/n36a3.pdf

Eberwein, T., Porlezza, C. y Splendor, S. (2015). Media as political actor. En G. Mazzoleni (Ed.), The International Encyclopedia of Political Communication, 703-711. Wiley-Blackwell.

Edo, C. (1994). La crisis de la prensa diaria: la línea editorial y la trayectoria de los periódicos de Madrid. Ariel.

Feinerer, I., Hornik, K. (2020). tm: Text Mining Package. R package (version 0.7-8) [Software]. https://CRAN.R-project.org/package=tm

Fellows, I. (2018). wordcloud: Word Clouds. R package (version 2.6) [Software]. https://CRAN.R-project.org/package=wordcloud

Friedman, J., Hastie, T. y Tibshirani, R. (2019). glasso: Graphical Lasso: Estimation of Gaussian Graphical Models. R package (version 1.11) [Software]. https://CRAN.R-project.org/package=glasso

Gaikwad, S. V., Chaugule, A. y Patil, P. (2013). Text Mining Methods and Techniques. International Journal of Computer Applications, 85(17), 42-45. https://doi.org/10.5120/14937-3507 DOI: https://doi.org/10.5120/14937-3507

Gentleman, R., Whalen, E., Huber, W. y Falcon, S. (2022). graph: A package to handle graph data structures. R package version 1.74.0.

Gil Pascual, J. A. (2021). Minería de texto con R: aplicaciones y técnicas estadísticas de apoyo. UNED - Universidad Nacional de Educación a Distancia.

Hennig, C. (2020). fpc: Flexible Procedures for Clustering. R package (version 2.2-9) [Software]. https://CRAN.R-project.org/package=fpc

Kaneko, T., Asano, T. y Miwa, H. (2021). Estimating Ideal Points of Newspapers from Editorial Texts. The International Journal of Press/Politics, 26(3), 719–742. https://doi.org/10.1177/1940161220935058 DOI: https://doi.org/10.1177/1940161220935058

Kumar, S., Kar, A. K., & Ilavarasan, P. V. (2021). Applications of text mining in services management: A systematic literature review. International Journal of Information Management Data Insights, 1(1). https://doi.org/10.1016/j.jjimei.2021.100008 DOI: https://doi.org/10.1016/j.jjimei.2021.100008

Lanzarini, L. C., Hasperué, W., Villa Monte, A., Jimbo Santana, P., Reyes Zambrano, G., Corvi, J. P., Fernandez Bariviera, A. y Olivas Varela, J. Á. (2019). Minería de datos, minería de textos y Big Data [Presentación de la conferencia]. XXI Workshop de Investigadores en Ciencias de la Computación, WICC 2019, Universidad Nacional de San Juan, Argentina. http://sedici.unlp.edu.ar/handle/10915/77022

Lang, D. y Chien, G. (2018). wordcloud2: Create Word Cloud by 'htmlwidget'. R package (version 0.2.1) [Software]. https://CRAN.R-project.org/package=wordcloud2

Linares Rodriguez, V., Paniagua Santamaria, P. y Abejón Mendoza, P. (2014). La matriz de la opinión en los periódicos: el artículo editorial. Sphera pública, 1(14), 142-173. https://sphera.ucam.edu/index.php/sphera-01/article/view/171

López Arroyo, A. (2016). El artículo editorial como texto argumentativo. Un estudio del género periodístico más razonador a la luz de la teoría de la argumentación [Tesis doctoral, Universidad Complutense de Madrid]. Repositorio Institucional de la UCM. https://eprints.ucm.es/id/eprint/41595/1/T38579.pdf

Maechler, M., Rousseeuw, P., Struyf, A., Hubert, M. y Hornik, K. (2022). cluster: Cluster Analysis Basics and Extensions. R package version 2.1.4 - For new features, see the 'Changelog' file (in the package source) [Software]. https://CRAN.R-project.org/package=cluster

Moreno Espinosa, P. (2003). Géneros para la persuasión en prensa: los editoriales del Diario El País. Ámbitos: Revista Internacional de Comunicación, 9 y 10, 225-238. http://hdl.handle.net/11441/67480 DOI: https://doi.org/10.12795/Ambitos.2003.i09-10.12

Moscovici, S. (1976). Social influence and social change. Academic Press.

Moscovici, S. (2001). Social representations: explorations in social psychology. New York University Press.

Moscovici, S. (2008). Psychoanalysis: its image and its public. Polity.

Murrell, P. (2022). grid Graphics. https://stat.ethz.ch/R-manual/R-devel/library/grid/doc/grid.pdf

Nava, M. y Marques, F. P. J. (2019). From “Leftist” To “President”: Journalism and Editorial Coverage of Brazil’s Lula in Five Elections. Journalism Practice, 13(10), 1200-1221. https://doi.org/10.1080/17512786.2019.1587640 DOI: https://doi.org/10.1080/17512786.2019.1587640

Neuwirth, E. (2014). RColorBrewer: ColorBrewer Palettes. R package version 1.1-2. https://CRAN.R-project.org/package=RColorBrewer

Núñez Ladevéze, L. y Vázquez Barrio, T. (2008). La información, la opinión y la editorial periodística. Textual & Visual Media, 1, 255-274. https://textualvisualmedia.com/index.php/txtvmedia/article/view/22

Núñez Ladevéze, L. (2007). El contexto social de la empresa periodística en una sociedad libre. Contexto: Revista de Comunicación de la Universidad de La laguna, 1, 31-48.

Pollak, S., Coesemans, R., Daelemans, W. y Lavrač, N. (2011). Detecting contrast patterns in newspaper articles by combining discourse analysis and text mining. Pragmatics, 21(4), 647-683. https://doi.org/10.1075/prag.21.4.07pol DOI: https://doi.org/10.1075/prag.21.4.07pol

Quispe Guillen, S. W. (2019). Tratamiento periodístico de la vacancia de Pedro Pablo Kuczynski en los diarios El Comercio y La República, marzo de 2018 [Tesis de Licenciatura, Universidad César Vallejo, Lima, Perú]. Repositorio Institucional UCV. https://repositorio.ucv.edu.pe/handle/20.500.12692/45379

Sinoara, R. A., Marcacini, R. M. y Rezende, S. O. (2021). Mineraçao de Textos e Semântica: desafios, abordagens e aplicaçoes. Revista de Sistemas de Informaçao da FSMA, (27), 41-53. Repositorio de la Universidad de São Paulo. https://repositorio.usp.br/item/003038161

Suárez Paredes, A. J. (2013). Análisis discursivo de la Central del diario Correo en las elecciones presidenciales 2011 [Tesis de Licenciatura, Pontificia Universidad Católica del Perú, Facultad de Ciencias y Artes de la Comunicación. Lima, Perú]. Repositorio Digital de Tesis y Trabajos de Investigación PUCP. http://tesis.pucp.edu.pe/repositorio/handle/123456789/7564

Tineo Valencia, D. A. (2020). Tratamiento Periodístico de la disolución del Congreso en las versiones digitales de Expreso y la República, Lima 2019 [Tesis de Licenciatura, Universidad César Vallejo. Lima, Perú]. Repositorio Institucional UCV. https://hdl.handle.net/20.500.12692/50440

Turing, A. M. (1950). Computing machinery and intelligence. Mind, New Series, 59(236), 433-460. https://doi.org/10.1093/mind/LIX.236.433 DOI: https://doi.org/10.1093/mind/LIX.236.433

Urbizagástegui-Alvarado, R. (2021). La bibliometría brasileña: minería de textos. Revista ACB: Biblioteconomia em Santa Catarina, 26(1), 1-18. https://revista.acbsc.org.br/racb/article/view/1768

Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. DOI: https://doi.org/10.1007/978-3-319-24277-4

Wijffels, J. (2022). textplot: Text Plots. R package version (0.2.1) [Software]. https://CRAN.R-project.org/package=textplot

Yuan, H. (2016). Measuring media bias in China. China Economic Review, 38, 49-59. https://doi.org/10.1016/j.chieco.2015.11.011 DOI: https://doi.org/10.1016/j.chieco.2015.11.011

Published

02/02/2023

How to Cite

Castro Cáceres, M. L., Chávez Salazar, D. A., & Urbizagástegui Alvarado, R. (2023). Presidential elections in Peru: text mining of La República newspaper publishers. Revista De Comunicación, 22(1), 71–87. https://doi.org/10.26441/RC22.1-2023-3025

Issue

Section

Papers