El coeficiente de correlación. Desde la independencia lineal de Pearson a la independencia general de variables aleatorias

Loading...
Thumbnail Image
Identifiers

Publication date

Advisors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics
Google Scholar
lacobus
Export

Research Projects

Organizational Units

Journal Issue

Abstract

Este trabajo constituye una revisión acerca de las medidas de dependencia más comunes usadas para describir las relaciones existentes entre variables aleatorias. En el primer capítulo se presentan algunos conceptos básicos relacionados con la teoría de la probabilidad que pueden resultar de utilidad para introducir el concepto de dependencia en los sucesivos capítulos. Ya en el segundo capítulo haremos un breve recorrido a través de las distintas nociones de dependencia y presentaremos un conjunto de propiedades deseables para las medidas globales de asociación que trataremos más adelante. En el tercer capítulo introduciremos la medida de dependencia más reconocida actualmente, el coeficiente de correlación de Pearson, explicando su marco histórico, propiedades y limitaciones. Dichas limitaciones nos llevarán a presentar los coeficientes de correlación basados en el estudio de los rangos de las variables, que proporcionarán una visión más amplia de la dependencia con respecto al de Pearson, como la ρ de Spearman o la τ de Kendall. En el cuarto capítulo estudiaremos un coeficiente naciente que surge nuevamente debido a las deficiencias de los anteriores: el coeficiente de correlación de distancias. Además, ampliaremos el estudio dando algunas nociones de dependencia desde la perspectiva de las funciones cópula, haciendo un recorrido previo por su definición y propiedades. Por último, en el capítulo final interpretaremos los conceptos anteriores en base a un conjunto de datos reales. Para obtener los resultados usaremos el lenguaje de programación R y apoyaremos nuestras conclusiones en gráficas para facilitar la comprensión del estudio.
This paper is a review of the most common dependence measures used to describe the relationships between random variables. In the first chapter we present some basic concepts related to probability theory that may be useful to introduce the concept of dependence in the following chapters. Already in the second chapter we will make a brief tour through the different notions of dependence and present a set of desirable properties for the global measures of association that we will discuss later. In the third chapter we will introduce the currently most recognized measure of dependence, Pearson’s correlation coefficient, explaining its historical framework, properties and limitations. These limitations will lead us to present correlation coefficients based on the study of the ranks of the variables, which will provide a wider view of dependence with respect to Pearson’s, such as Spearman’s ρ or Kendall’s τ . In the fourth chapter we will study a nascent coefficient that arises again due to the deficiencies of the previous ones: the distance correlation coefficient. In addition, we will extend the study by giving some notions of dependence from the perspective of copula functions, making a preliminary tour of their definition and properties. Finally, in the final chapter we will interpret the above concepts based on a real dataset. To obtain the results we will use the R programming language and support our conclusions with graphs to facilitate the understanding of the study.

Description

58 páxinas

Bibliographic citation

Relation

Has part

Has version

Is based on

Is part of

Is referenced by

Is version of

Requires

Sponsors

Rights

Attribution-NonCommercial-ShareAlike 4.0 International