Relationship Between Variables


Data set တစ်ခုတွင် Variable များပါဝင်ပြီး အဆိုပါ Variable များကြားတွင် Relationship ဟူသည့် ဆက်သွယ်မှု ရှိနိုင်ပါသည်။

ဥပမာ လုပ်ငန်းအတွေ့အကြုံ များလာပါက လစာ ပိုမိုများပြားလာခြင်း၊ အသက်အရွယ်ကြီး လာသည်နှင့်အမျှ ပင်ပန်းခံနိုင်မှုကျဆင်းလာခြင်း၊ ရာသီဥတုပူပြင်းလာသည်နှင့်အမျှ အအေးရောင်းချမှု မြင့်လာပြီး ကော်ဖီရောင်းချမှုကျဆင်းခြင်း စသည့်ဆက်နွယ်မှုများရှိနိုင်ပါသည်။

ထိုသို့ချိတ်ဆက်မှုများအနက် တိုက်ရိုက်အချိုးကျချိတ်ဆက်မှုများရှိနိုင်သလို ပြောင်းပြန်အချိုးနှင့် ချိတ်ဆက်မှုများလည်းရှိနိုင်ပါသည်။

Covariance & Correlation

Relationship အကြောင်းပြောရာတွင် Covariance & Correlation စကားလုံးနှစ်ခုလုံးသည် data set တစ်ခုရှိ Numerical variable နှစ်ခုကြား ချိတ်ဆက်မှုကို ဖော်ပြနိုင်သော အသုံးအနှုန်းများဖြစ်ကြသည်။

Relation type သုံးခုခွဲခြားနိုင်ပါသည်-

  • Possitively Correlated

  • Negatively Correlated

  • Not Correlated

Covariance

Covariance ဆိုသည်မှာလည်း Correlation ကဲ့သို့ Data နှစ်ခု၏ချိတ်ဆက်မှုကို ရှိမရှိကို ဖော်ပြခြင်းဖြစ်ပြီး ရှိပါက မည်သို့မည်ပုံချိတ်ဆက်သည်ကိုပါ ပူးတွဲဖော်ပြခြင်းဖြစ်သည်။ Covariance ကို ကြည့်ရှုခြင်းဖြင့် Data နှစ်ခု ၏ ချိတ်ဆက်မှု ကိုသိရှိနိုင်သည့်အပြင် မည်မျှနက်နက်နဲနဲ ချိတ်ဆက်မှုရှိသည်ကိုပါ ခန့်မှန်းနိုင်မည်ဖြစ်သည်။

Covariance & Correlation ကို Statistic သမားများရင်းနှီးပြီးသားဖြစ်နိုင်ပါသည်။ Statistic တွင် Data ၏ Variance တွက်ထုတ်နည်းများပါဝင်ပြီး Data နှစ်ခု ၏ Variance ချိတ်ဆက်မှုကို Covariance ဟု အလွယ်မှတ်နိုင်ပါသည်။ ထို့အပြင် Data နှစ်ခု ချိတ်ဆက်မှု မည်မျှထိ ခိုင်မာစွာချိတ်ဆက်သည် (Coefficient) ကို သိရှိရန် အတွက်လည်း Covariance ကို တွက်ထုတ်ဖို့လိုအပ်ပါသည်။

Covariance ကို အောက်ပါအတိုင်းတွက်ချက်နိုင်ပါသည်-

Covariance Formula

Notations in Covariance Formulas

xi = data value of x

yi = data value of y

x̄ = mean of x

ȳ = mean of y

N = number of data values.

အပူချိန် (x)နှင့် အအေးရောင်းအား(y) ချိတ်ဆက်မှု Covariance ကိုတွက်ချက်ပုံမှာ

အပူချိန်တစ်ခုခြင်း ရောင်းအားတစ်ခုခြင်း Variance (မူလတန်ဖိုး-ပျမ်းမျှတန်ဖိုး) ကို ရှာရပါမည်။ ပျမ်းမျှတန်ဖိုးကို mean ဟုလည်းခေါ်ပါသည်။

ထို့သို့ရှာဖွေပြီး အပူချိန်နှင့်အအေး ရောင်းအား မူလတန်ဖိုး-ပျမ်းမျှတန်ဖိုး ခြားနားချက်များကို တစ်ခုခြင်းအတွဲလိုက် မြှောက်ပေးရပါမည်။ မြှောက်လဒ်များကို အားလုံးပေါင်းပေးရပါမည်။

ပေါင်းပြီး Data အရေအတွက်စုစုပေါင်းကို (၁) နှုတ်ကာ စားပေးရပါမည်။

အပူချိန် (x)

ရောင်းအား(y)

(x-x_mean)

(y-y_mean)

(x-x_mean)* (y-y_mean)

38

150

38-39=-1

150-154=-4

4

37

140

37-39=-2

140-154=-14

28

39

155

39-39=0

155-154=1

0

41

160

41-39=2

160-154=6

12

40

165

40-39=1

165-154=11

11

X_Mean=39, y_Mean=154,

Total sum=∑(x-x_mean)* (y-y_mean)=55,

Total number =n=5

Cov(x,y)= Total sum/ n -1 = 55/4 = 13.75

Comments

Popular posts from this blog

Data Science နှင့် ပတ်သက်သည့် Terminology / အသုံးအနှုန်းများ

စောင့်ကြည့်လေ့လာသင့်သည့် အနာဂတ်နည်းပညာနယ်ပယ်များ

Artificial Intelligence (AI) Project များ တည်ဆောက် အကောင်အထည်ဖော်ရာတွင် ဒေတာလုံခြုံရေးနှင့် ကိုယ်ရေးကိုယ်တာ အချက်အလက်များ လုံခြုံရေး