Discrete Binning/Bucketing
Data တွေကို preprocessing လုပ်ရာမှာ Binning/Bucketing ဆိုတဲ့ method လည်း ကို သိရှိထားဖို့လိုပါတယ်။
ကျွန်တော်တို့ ကွန်ပျူတာတွေမှာ မလိုတဲ့ဟာတွေကို တစ်နေရာမှာစုထားဖို့ Recycle Bin ဆိုတဲ့ အမှိုက်ပုံးလိုဟာလေးတစ်ခုရှိပါတယ်။
Bin ဆိုတာ ပုံးလေးတစ်ခုလို့သတ်မှတ်လို့ရပါတယ်။ ဒီနေရာမှာတော့ မလိုတဲ့ဟာတွေကို စုထားဖို့မဟုတ်ပါဘူး။ အမျိုးအစားတူတဲ့data တွေကိုစုထားဖို့ အတွက်ပါ။
Bin နဲ့ bucket အခေါ်အဝေါ်ကွဲပေမယ့်အဓိပ္ပါယ်ကတော့အတူတူပါပဲ။
ကျွန်တော်တို့ရဲ့ data set မှာ ပါဝင်တဲ့ data တွေကို အမျိုးစားထပ်မံခွဲခြားပြီး တူရာတူရာကို စုထားဖို့ သုံးတဲ့နည်းပါ။ ဒါကို Binning/Bucketing လို့ခေါ်ပါတယ်။
ဥပမာ ကျွန်တော်တို့ data set မှာ အသက်အရွယ်အမျိုးမျိုးပါဝင်တဲ့ data တွေကို လူကြီး၊ လူငယ်၊ လူလတ် ဆိုပြီး သုံးပိုင်းခွဲထားပြီး ဖော်ပြတာမျိုးဆောင်ရွက်နိုင်ပါတယ်။
ဒီလိုဆောင်ရွက်ခြင်းအားဖြင့် data ကို ပိုမိုမြင်သာစေပြီး ဆုံးဖြတ်ချက်ချရာမှာ ပိုမိုလွယ်ကူ စေပါတယ်။ ဂရပ်တွေ ဘာတွေဆွဲတဲ့အခါမှာလည်း ပိုမိုလွယ်ကူစေမှာဖြစ်ပါတယ်။


Comments
Post a Comment