Data Science Tools
Data Analyst လုပ်ငန်းစဉ်များဆောင်ရွက်ဖို့ Tools အမျိုးမျိုးကို အသုံးပြုရပါတယ်။ ဒီTolls အားလုံးကို သုံးတက်ဖို့ မလိုနိုင်ပေမယ့် ဘယ်လို နေရာမှာ ဘယ် Tools ကို သုံးသင့်တယ်ဆိုတာနဲ့ Tool တစ်ခုချင်းစီရဲ့အားနည်းချက် အားသာချက်တွေကို သိထားသင့်ပါတယ်။ ကျွန်တော်တို့ Data Science လုပ်ဆောင်ရာမှာ သုံးတဲ့ Tool အတော်များများဟာ open source တွေဖြစ်ကြပြီး ငွေကြေး အကုန်အကျနည်းပါးစွာနဲ့ ရယူအသုံးပြုနိုင်ပါတယ်။
Open Source ဆိုတာ ဘာလဲ?
Open Source ဆိုတာ အခကြေးငွေပေးစရာမလိုဘဲ လွတ်လပ်စွာအသုံးပြုနိုင်ပါတယ်။ နောက်ပြီး သုံးစွဲသူအချင်းချင်းလဲ လွတ်လပ်စွာမျှဝေ သုံးစွဲနိုင်ပါတယ်။ လိုအပ်ရင် လိုအပ်သလို ပြင်ဆင် မွန်းမံပြီးလည်း အသုံးပြုနိုင်ပါတယ်။ ဒါပေမယ့် ဒီလိုပြင်ဆင်ထားတာကိုလည်း အခြားသူတွေကို ပြန်လည်သုံးစွဲခွင့်ပေးရပါတယ်။ (အကြမ်းပြောရရင် ပြင်ပြီး ပြန်ရောင်းစားလို့မရ) Open Source တွေမှာ ဒီလို အားသာချက်တွေရှိပေမယ့် သူဟာ လိုင်စင်မဲ့ လို့ပြောလို့တော့မရပါဘူး။ သူ့မှာလည်း လိုင်စင် အမျိုးမျိုးရှိပါသေးတယ်။ opensource လိုင်စင်အကြောင်း အသေးစိတ်ကို opensource.org ဝဘ်ဆိုက်မှာ အသေးစိတ်လေ့လာနိုင်ပါတယ်။
- Free to Use
- Free to Share
- Free to Contribute
- Different License
Jupyter Notebook
Jupyter Notebook ကို Data Science Project အတော်များများမှာ အသုံးပြုကြပါတယ်။ ပေါ့ပါးရှင်းလင်းပြီး အသုံးပြုရလွယ်ကူပါတယ်။ Jupyter ဟာ Web browser ပေါ်မှာတင် အသုံးပြုနိုင်တဲ့ Software ဖြစ်ပြီး Jupyter.org မှာ download ရယူနိုင်ပါတယ်။
Zeppelin Note book
Zeppelin Notebook ဟာ Jupyter Notebook နဲ့ အတော်ဆင်တူပါတယ်။ အားသာချက်က Bigdata တွေကို ကိုင်တွယ်ဖို့ apache Spark ဆိုတဲ့ platform ကို ထည့်သွင်းပေးထားတာဖြစ်ပါတယ်။ သူကိုလည်း Web Browser ပေါ်မှာအသုံးပြုနိုင်ပါတယ်။ user data input လုပ်ဖို့ form control တွေလည်း ထည့်သွင်းထားတဲ့အတွက် အသုံးပြုရတာ ပိုမိုလွယ်ကူစေပါတယ်။ Pythom လို Interpreters အတော်များများ ပါဝင်တဲ့အတွက် script language အတော်များများကိုအသုံးပြုလို့ရပါတယ်။ project တွေကို တစ်ယောက်တည်း မဟုတ်ဘဲ Group အလိုက်ဆောင်ရွက်ဖို့ အတွက် ပါဆောင်ရွက် ပေးထားပါတယ်။ apache 2 လိုင်စင်ကိုအခြေခံထားတဲ့ 100% Opensource ဖြစ်ပြီး zeppelin.apache.org ဝဘ်ဆိုက်မှာ ဒေါင်းလုပ် ရယူနိုင်ပါတယ်။
R Studio
Rstudio ဟာ R programming language အတွက်အထူးထုတ်လုပ်ထားတာဖြစ်ပါတယ်။ R ဟာ Pythom လိုပဲ လူသုံးအလွန်များလာတဲ့ language တစ်ခုဖြစ်ပါတယ်။ web browser ရော stay alone desktop application အနေနဲ့ရောအသုံးပြုနိုင်ပါတယ်။ zeppelin လို apache spark platform ပါဝင်ပြီးသားဖြစ်လို့ big data တွေကို ကိုင်တွယ်နိုင်သလို ပရိုဂရမ်မာတွေအတွက် ပြည့်စုံတဲ့ IDE integrated development environment တစ်ခုဖြစ်ပါတယ်။ ဆိုးတာက R programmer အတွက်ပဲ support လုပ်ပြီး အခြား language တွေကို support မလုပ်တာပါပဲ။ လေ့လာလိုသူတွေအနေနဲ့ rstudio.com မှာ ဒေါင်းလုပ်ရယူ လေ့လာနိုင်ပါတယ်။
IBM Watsom Studio
IBM Watsom Studio ဟာ IBM cloud ပေါ်မှာရေးသားထားတဲ့ Plattform as a service (paas) အမျိုးအစားဖြစ်ပြီး user account create လုပ်ပြီးအသုံးပြုရမှာဖြစ်ပါတယ်။ အချို့ feature တွေကိုတော့ အခကြေးငွေပေးပြီး သုံးရမှာဖြစ်ပါတယ်။ python ရော R ရော ကြိုက်တာနဲ့အသုံးပြုနိုင်အောင် ဆောင်ရွက်ပေးထားပြီး programmer တွေအချင်းချင်း code တွေကို မျှဝေ အသုံးပြုနိုင်ပါတယ်။ IBM cloud မှာ အသင့်ရှိနေတဲ့ API တွေကိုလည်း အသင့်ယူသုံးလို့ရတဲ့အပြင် Watsom Studio ဟာ large Enterprise တွေအတွက် အထူးသင့်လျော်ပါတယ်။
နိဂုံးအနေနဲ့ Data science tool တွေဟာ အများထင်သလို ငွေကုန်ကြေးကျများစွာနဲ့လေ့လာစရာ မလိုဘဲ အလွယ်တကူလေ့လာလို့ရတယ်ဆိုတာပဲဖြစ်ပါတယ်။ နောက်ပြီး ကျွန်တော်တို့က tool အားလုံးကို တပြိုင်နက်ထဲသုံးစရာမလိုဘဲ ဘယ် tool ကို ဘယ်မှာ သုံးသင့်တယ်ဆိုတာကိုသာ သိထားပြီး လိုအပ်သလို အသုံးပြုသွားဖို့သာဖြစ်ပါတယ်။ သာမာန်အသုံးပြုမဲ့ AI project တစ်ခုကို စျေးကြီးပေးပြီး IBM cloud နဲ့သုံးစရာမလိုသလို ကြီးမားတဲ့ လုပ်ငန်းမျိုးတွေအတွက် Jupiter note book လောက်နဲ့ လုံလောက်မှာမဟုတ်ဘူးဆိုတာ ချိန်ဆနိုင်ဖို့လိုပါတယ်။ ထို့အပြင် အခြား Data science tool တွေများစွာရှိနေပါသေးတယ်။ အသေးစိတ်ကိုတော့ အောက်ပါ လင့်မှာဆက်လေ့လာနိုင်ပါတယ်-




Comments
Post a Comment