Correlation Coefficient

Correlation မှာ Coverience ကို ရှာဖွေပြီးသည့်အချိန်တွင် Data အချင်းချင်း မည်မျှ ခိုင်မာစွာချိတ်ဆက်သည်ကို ထပ်မံလေ့လာ ရန် ယင်းကိုအခြေခံ ကာ Coefficient ကို ထပ်မံတွက်ထုတ်နိုင်ပါသည်။ Correlation ကို r value ဟုလည်း ခေါ်ဝေါ်သုံးနှုန်းကြပါသည်။

R value အမျိုးမျိုးရှိနိုင်ပြီး Correlation ပုံစံလည်း အမျိုးမျိုးကွဲပြားခြားနားနိုင်ပါသည်။

Data x နှင့် y ၏ Correlation (r value) Cor(x,y) ကို တွက်လိုပါက Coverience /Cov(x,y)ကို တည် Standard Deviations နှစ်ခု (Sx,Sy) မြောက်လဒ်နှင့်စားပေးရပါမည်။

Coverience တန်ဖိုး Cov(x,y) ကို အခြေခံပြီး Correlation တန်ဖိုး Corr(x,y) ကို အောက်ပါဖော်မြူလာဖြင့်တွက်ထုတ်နိုင်ပါသည်။

Corr(X,Y) = Cov[X,Y] / ( StdDev(X) ∙ StdDev(Y) )



https://www.alpharithms.com/wp-content/uploads/1074/simplified-correlation-coefficient-formula-vs-expanded.jpg

မှတ်ချက် Standard deviation တွက်ပုံကို Statistic သင်ခန်းစာတွင် အသေးစိတ် လေ့လာရန်လိုအပ်ပြီး Formula မှာအောက်ပါအတိုင်းဖြစ်ပါသည်။

အပူချိန် (x)

ရောင်းအား (y)

(x-x_mean)

(y-y_mean)

(x-x_mean)* (y-y_mean)

(x-x_mean)^2

(y-y_mean)^2

38

150

38-39=-1

150-154=-4

4

1

16

37

140

37-39=-2

140-154=-14

28

4

196

39

155

39-39=0

155-154=1

0

0

0

41

160

41-39=2

160-154=6

12

4

36

40

165

40-39=1

165-154=11

11

1

121

X_Mean=39, y_Mean=154,

Total sum=∑(x-x_mean)* (y-y_mean)=55,

Total number =n=5

Cov(x,y)= Total sum/ n -1 = 55/4 = 13.75

∑ (x-x_mean)^2=10

∑ (y-y_mean)^2=369

x_std =√(10/4)

y_std = √(369/4)

Corr(x,y) = Cov(x,7)/(x_std*ystd) = 13.37/(1.58*9.6) = 0.9

တွက်ချက်မှုအရ r value (Correlation) သည် -1 နှင့် +1 ကြားရှိနေမည်ဖြစ်ပါသည်။

+1 နှင့် နီးစပ်ပါက အပေါင်းလက္ခဏာ ဆောင်သော ဆက်သွယ်မှု (Positive Relation) ဟုသတ်မှတ်ပြီး

-1 နှင့် နီးစပ်ပါက အနှုတ်လက္ခဏာ ဆောင်သော ဆက်သွယ်မှု (Negative Relation) ဟုသတ်မှတ်နိုင်ပါသည်။

0 နှင့်ညီနေပါက ဆက်သွယ်မှုချိတ်ဆက်မှု မရှိဟုသတ်မှတ်နိုင်ပါသည်။

R Value ကိုအခြေခံပြီး ရလာဒ်များကို ဂရပ်ဖြင့်ဖော်ပြသည့်အခါ r value 1 ဖြစ်ပါက ညာဘက်သို့ထောင်တက်သွားသည့်ပုံစံ ထင်ထင်ရှားရှားတွေ့နိုင်ပြီး r value 0.8, 0.4 ဖြစ်နေပါက ညာဘက်သို့ တက်နေသော်လည်း data point များ စုစည်းမှုမရှိဘဲ ပြန့်နေသည့်ကို တွေ့ရနိုင်ပါသည်။ -1 ဖြစ်ပါက ညာဘက်သို့ စိုက်ဆင်းသွားသည့် ပုံစံ ထင်ထင်ရှားရှား မြင်တွေ့နိုင်မည်ဖြစ်ပါသည်။ ထို့အတူ r value 0 ဖြစ်နေပါကလည်း အတက်အကျ ဖော်ပြခြင်းမရှိဘဲ အဘက်ဘက်သို့ပြန့်နေသည့် ပုံစံကို တွေ့ရမည်ဖြစ်ပါသည်။

Comments

Popular posts from this blog

Data Science နှင့် ပတ်သက်သည့် Terminology / အသုံးအနှုန်းများ

စောင့်ကြည့်လေ့လာသင့်သည့် အနာဂတ်နည်းပညာနယ်ပယ်များ

Artificial Intelligence (AI) Project များ တည်ဆောက် အကောင်အထည်ဖော်ရာတွင် ဒေတာလုံခြုံရေးနှင့် ကိုယ်ရေးကိုယ်တာ အချက်အလက်များ လုံခြုံရေး