Discrete Binning/Bucketing

Data တွေကို preprocessing လုပ်ရာမှာ Binning/Bucketing ဆိုတဲ့ method လည်း ကို သိရှိထားဖို့လိုပါတယ်။

ကျွန်တော်တို့ ကွန်ပျူတာတွေမှာ မလိုတဲ့ဟာတွေကို တစ်နေရာမှာစုထားဖို့ Recycle Bin ဆိုတဲ့ အမှိုက်ပုံးလိုဟာလေးတစ်ခုရှိပါတယ်။

Bin ဆိုတာ ပုံးလေးတစ်ခုလို့သတ်မှတ်လို့ရပါတယ်။ ဒီနေရာမှာတော့ မလိုတဲ့ဟာတွေကို စုထားဖို့မဟုတ်ပါဘူး။ အမျိုးအစားတူတဲ့data တွေကိုစုထားဖို့ အတွက်ပါ။

Bin နဲ့ bucket အခေါ်အဝေါ်ကွဲပေမယ့်အဓိပ္ပါယ်ကတော့အတူတူပါပဲ။

ကျွန်တော်တို့ရဲ့ data set မှာ ပါဝင်တဲ့ data တွေကို အမျိုးစားထပ်မံခွဲခြားပြီး တူရာတူရာကို စုထားဖို့ သုံးတဲ့နည်းပါ။ ဒါကို Binning/Bucketing လို့ခေါ်ပါတယ်။

ဥပမာ ကျွန်တော်တို့ data set မှာ အသက်အရွယ်အမျိုးမျိုးပါဝင်တဲ့ data တွေကို လူကြီး၊ လူငယ်၊ လူလတ် ဆိုပြီး သုံးပိုင်းခွဲထားပြီး ဖော်ပြတာမျိုးဆောင်ရွက်နိုင်ပါတယ်။

ဒီလိုဆောင်ရွက်ခြင်းအားဖြင့် data ကို ပိုမိုမြင်သာစေပြီး ဆုံးဖြတ်ချက်ချရာမှာ ပိုမိုလွယ်ကူ စေပါတယ်။ ဂရပ်တွေ ဘာတွေဆွဲတဲ့အခါမှာလည်း ပိုမိုလွယ်ကူစေမှာဖြစ်ပါတယ်။

Comments

Popular posts from this blog

Data Science နှင့် ပတ်သက်သည့် Terminology / အသုံးအနှုန်းများ

စောင့်ကြည့်လေ့လာသင့်သည့် အနာဂတ်နည်းပညာနယ်ပယ်များ

Artificial Intelligence (AI) Project များ တည်ဆောက် အကောင်အထည်ဖော်ရာတွင် ဒေတာလုံခြုံရေးနှင့် ကိုယ်ရေးကိုယ်တာ အချက်အလက်များ လုံခြုံရေး