什么是相关性?
相关性(Correlation)是统计学中的一个概念,用来衡量两个变量之间的关系强度和方向。其值的范围在 -1 到 1 之间,其中:
- 1 表示完全正相关:即一个变量增加,另一个变量也同比增加。
- -1 表示完全负相关:即一个变量增加,另一个变量则同比减少。
- 0 表示无相关:即两个变量之间没有线性关系。
相关性最常用的计算方法是皮尔逊相关系数(Pearson correlation coefficient)。例如,股票市场中,投资者常常关注不同股票间的相关性,以此来分散风险或寻找交易机会。
什么是协方差?
协方差(Covariance)是衡量两个变量共同变异程度的统计量。当两个变量的变动趋势一致时(即同时增加或同时减少),协方差为正;当它们的变动趋势相反时(一个增加,另一个减少),协方差为负;如果两个变量完全独立,理论上协方差为零。
协方差公式为:
[ \text{Cov}(X, Y) = E[(X - \mu_X)(Y - \mu_Y)] ]
其中 ( \mu_X ) 和 ( \mu_Y ) 分别是 X 和 Y 的均值,E 是期望值算子。
例子
考虑一个简单的例子,如果我们有两个变量,X 代表某城市的平均气温,Y 代表该城市的冰淇淋销量。根据经验,我们可以预见,在气温较高的日子里,冰淇淋的销量通常会增加,这意味着气温和冰淇淋销量之间存在正相关,其相关系数接近于 1。同时,气温和冰淇淋销量的协方差也将是一个正数,表明这两个变量有相同的变化趋势。