Bits
Binary digIT ကို အတိုကောက် bit လို့ သုံးပါတယ်။ အစစာလုံး B နဲ့ နောက်ဆုံးအဆုံးသတ် it ကို တွဲလိုက်တာပါ။ ဒီတော့ bit ဆိုတာ binary digit လို့ မှတ်ထားရမှာဖြစ်ပါတယ်။ digit တွေမှာတော့ အားလုံးသိကြတဲ့အတိုင်း 0 နဲ့ 1 ဆိုပြီးတော့ ကိန်း ၂ လုံးပါဝင်ပါတယ်။ အဲထဲက တစ်လုံးသည် 1 bit ပေါ့။ အဲသည် 0 နဲ့ 1 ကိုပဲ လိုအပ်သလို ပေါင်းစပ်ဖန်တီးလိုက်တဲ့အခါ ဒီနေ့ ကျွန်တော်တို့သုံးနေကြတဲ့ ကွန်ပျူတာတွေ ဖုန်းတွေမှာ အလုပ်လုပ်ဆောင်နိင်ကြတဲ့ application တွေ ဖြစ်လာကြပါတော့တယ်။ ဆိုလိုတာက ကျွန်တော်တို့တွေ အသုံးပြုနေကြတဲ့ ကွန်ပျူတာတွေ၊ ဖုန်းတွေရဲ့ အံ့သြဖွယ်ရာလုပ်ဆောင်ချက်တွေကို နောက်ကွယ်ကနေ 0 နဲ့ 1 တွေက ကြိုးကိုင်ခြယ်လှယ်ထားကြတာ ဖြစ်တယ်ဆိုတာပါပဲ။
Characters
0 နဲ့ 1 တွေသာ ပါဝင်တဲ့ low-level form bit တွေနဲ့ အလုပ်လုပ်ရတာက လူသားတွေအတွက် ပျင်းစရာကောင်းပါတယ်။ လူသားတွေက ကိန်းဆိုရင်လည်း 0–9 ၊ letter ဆိုရင်လည်း A–Z နဲ့ စာလုံးအသေးဆို a–z တွေပေါ့၊ ဒါ့ပြင် special symbol တွေဖြစ်တဲ့ $@%&*()–+":;,?/ စသည်ဖြင့် ဒီလိုစကားလုံးတွေနဲ့ လုပ်ဆောင်ရတာကို ပိုအဆင်ပြေကြပါတယ်။ အဲသည် ကိန်းတွေ၊ စာလုံးတွေနဲ့ အထူးသင်္ကေတတွေကို အားလုံးပေါင်းပြီး characters လို့ ခေါ်ကြပါတယ်။ ဒီတေ့ လူတွေ အသုံးပြုနေကြတဲ့ စကားလုံးတွေက အများကြီး ဖြစ်ပြီးတော့ ကွန်ပျူတာက နားလည်လုပ်ဆောင်နိုင်တာက 0 နဲ့ 1 ပဲ ရှိတာကြောင့်မို့လို့ ကွန်ပျူတာအတွက် အဆင်ပြေစေဖို့ 0 နဲ့ 1 တွေ အတွဲလိုက်ကြီး ပါဝင်နေတဲ့ ပုံစံကို ဖန်တီးအသုံးပြုကြရပါတယ်။ C Programming language မှာတော့ ASCII (American Standard Code for Information Interchange) character set ကို default အနေနဲ့ အသုံးပြုပါတယ်။ သို့သော် C မှာ Unicode® characters တွေကိုလည်း 8bits, 16bits, 24bits or 32bits တွေကိုလည်း support ပေးထားပါတယ်။
Unicode မှာကတော့ ကမ္ဘာပေါ်မှာရှိတဲ့ ဘာသာစကားအများကြီးရဲ့ character တွေ ပါဝင်နေပါတယ်။ ASCII subset of Unicode ကို ဒီ link မှာ ကြည့်နိုင်ပါတယ် Language အားလုံးရဲ့ unicode chart ကိုတော့ ဒီ link မှာ ကြည့်နိုင်ပါတယ်။.
Fields
Character တွေကို bit တွေနဲ့ ဖွဲ့စည်းထားပါတယ်။ အဲသည် character တွေအများကြီး စုဖွဲ့လာတဲ့အခါ field ဖြစ်လာပါတယ်။ ဒါကြောင့်မို့ field ဆိုတာ character (bytes) တွေကို စုစည်းထားတဲ့ group လို့ ဆိုနိုင်ပါတယ်။ Field နဲ့ပတ်သက်ရင် လူတစ်ယောက်ရဲ့ နာမည်ကို ဖော်ပြတယ်ဆိုပါစို့၊ field ထဲမှာ စာလုံးအကြီးအသေး (Uppercases & lowercases letters) တွေ ပါဝင်နေနိုင်သလို၊ လူတစ်ယောက်ရဲ့ အသက်ကို ဖော်ပြမယ်ဆိုရင် ကိန်းဂဏန်းတွေ ပါဝင်နေမှာဖြစ်ပါတယ်။ ဒါကြောင့်မို့ field ထဲမှာ Character အစုံ ပါနေနိင်လို့ ဆိုရပါမယ်။
Records
မြန်မာလိုပြောရင်တော့ မှတ်တမ်းပေါ့။ ဒီတော့ record တွေထဲမှာ field တွေ အများကြီး ပါဝင်နေနိုင်ပါတယ်။ ဥပမာ payroll system တစ်ခု ဆိုကြပါစို့။ အလုပ်သမားတစ်ယောက်အတွက် လစာတွက်ချက်မှုမှာ ဒီလိုမျိုးအချက်အလက်တွေ ပါနေနိုင်ပါတယ်။
- အလုပ်သမား ID (ကိန်းတွေပေါ့)
- အမည် (characters တွေ အများကြီးပါမယ်)
- လိပ်စာ (characters တွေ အများကြီးပါမယ်)
- တစ်နာရီလုပ်ခ (ဒသမကိန်းတွေ ပါဝင်နေနိုင်တဲ့ ကိန်းတွေ)
- စုစုပေါင်းအလုပ်လုပ်ချိန် (ဒသမကိန်းတွေ ပါဝင်နေနိုင်တဲ့ ကိန်းတွေ)
- စုစုပေါင်းလုပ်ခလစာ (ဒသမကိန်းတွေ ပါဝင်နေနိုင်တဲ့ ကိန်းတွေ)
ဒီဥပမာကိုကြည့်ရင် record တစ်ခုမှာ သက်ဆိုင်ရာ field တွေ စုဖွဲ့ပါဝင်နေတာကို တွေ့ရမှာဖြစ်ပါတယ်။ ဒါက အလုပ်သမားတစ်ယောက်စာအတွက် နမူနာသာ ဖြစ်ပါတယ်။ ကုမ္ပဏီတစ်ခုမှာ အလုပ်သမား အများကြီး ရှိနေမှာပါ။ လုပ်ခလစာ တူတဲ့သူတွေလည်း ရှိသလို မတူတဲ့သူတွေလည်း ရှိနေမှာပါပဲ။
Files
Record တွေထဲမှာ သက်ဆိုင်ရာ field တွေ အများကြီး စုဖွဲ့ပါဝင်နေပါတယ်။ ထို့အတူ file တွေထဲမှာလည်း သက်ဆိုင်ရာ record တွေ အများကြီး ပါဝင်နေပါတယ်။ အချို့ Operating system တွေသည် file တွေကို bytes တွေများစွာပါဝင်နေတဲ့ sequence of bytes တွေအဖြစ်သာ ရှုမြင်လေ့ရှိပါတယ်။ ဒါကို File processing တွေအကြောင်း လေ့လာတဲ့အခါ မြင်သာပါလိမ့်မယ်။ Organization တစ်ခုမှာ ဖိုင်တွေ အများကြီး ရှိနေမှာဖြစ်ပြီး၊ ဖိုင်တွေထဲမှာလည်း ဘီလျံ သို့မဟုတ် ထရီလျံနဲ့ချီတဲ့ character တွေ ပါနေနိုင်ပါတယ်။ ဒီအကြောင်းကို big data အပိုင်းမှာ ဆက်ပြီး ဖတ်နိုင်မှာပါ။
Databases
လွယ်ကူစွာ ကိုင်တွယ်လုပ်ဆောင်နိုင်စွမ်းရှိစေဖို့အတွက် ဒေတာတွေကို စုစည်းထားရှိတာကို database လို့ ခေါ်ပြီးတော့ relational database တွေသည် လူကြိုက်အများဆုံးဖြစ်နေပါတယ်။ ဘာကြောင့်လဲဆိုတော့ ဒေတာတွေကို ရိုးရှင်းလွယ်ကူတဲ့ ဇယားကွက်တွေထဲမှာ သိမ်းဆည်းထားလို့ ဖြစ်ပါတယ်။ Excel file ထဲက ဇယားကွက်တွေကို နမူနာ မြင်ယောင်ကြည့်နိုင်ပါတယ်။ Table တစ်ခုမှာ record တွေအများကြီး ပါနေနိုင်ပါတယ်။ record တစ်ခုစီထဲမှာလည်း သက်ဆိုင်ရာ field တွေ ပါဝင်နေနိုင်ပါတယ်။ ဥပမာပြောရရင် Student table တစ်ခု ဆိုကြပါစို့။ အဲသည်မှာ ကျောင်းသားတွေအတွက် နာမည်၊ မေဂျာ၊ နှစ်၊ ID နဲ့ grade စတာတွေ ပါဝင်နိုင်ပါတယ်။ ကျောင်းသားတစ်ဦးစီအတွက် ဒေတာသည် record တစ်ခုစီ ဖြစ်ပြီးတော့ record ထဲမှာ ပါဝင်နေတဲ့ အချက်အလက်တစ်ကန့်စီသည် field တွေဖြစ်ကြပါတယ်။ ဒီထဲကနေမှ ကိုယ်သိချင်တဲ့အချက်အလက်တွေကို ကျောင်းသားအများကြီးထဲကနေ တစ်ယောက်စီကြည့်ပြီးလိုက်ရှာနေစရာမလိုဘဲ စစ်ထုတ်ရယူနိုင်အောင် စီစဥ်ထားရှိတာကို database လို့ ဆိုနိုင်ပါတယ်။
Big Data
1bit မှာ 8 bytes ပါဝင်ပါတယ်။ သိထားသင့်တဲ့ unit တွေရဲ့ ဆက်သွယ်ချက်ကို ဒီလိုလေ့လာကြည့်နိုင်ပါတယ်။
| Unit | Bytes | Which is approximately |
|---|---|---|
| 1 kilobyte (KB) | 1024 bytes | 103 bytes (1024 bytes exactly) |
| 1 megabyte (MB) | 1024 kilobytes | 106 (1,000,000) bytes |
| 1 gigabyte (GB) | 1024 megabytes | 109 (1,000,000,000) bytes |
| 1 terabyte (TB) | 1024 gigabytes | 1012 (1,000,000,000,000) bytes |
| 1 petabyte (PB) | 1024 terabytes | 1015 (1,000,000,000,000,000) bytes |
| 1 exabyte (EB) | 1024 petabytes | 1018 (1,000,000,000,000,000,000) bytes |
| 1 zettabyte (ZB) | 1024 exabytes | 1021 (1,000,000,000,000,000,000,000) bytes |
နည်းပညာအသုံးပြုကိရိယာတွေ နဲ့ ဆက်သွယ်ရေးတိုးတက်လာမှုတွေကြောင့် တစ်ကမ္ဘာလုံးကနေ နေ့စဥ် ထုတ်နေတဲ့ ဒေတာပမာဏက မျှော်မှန်းမထားမိလောက်အောင် များလွန်းပါတယ်။ ဒီနယ်ပယ်ကျယ်လာတာနဲ့အမျှ software developer တွေရဲ့ အခွင့်အလန်းတွေကလည်း ပိုတိုးလို့လာနေပါတယ်။ IT ပိုင်းဆိုင်ရာ လုပ်ငန်းခွင်တွေမှာလည်း သန်းပေါင်းများစွာသော အလုပ်အကိုင်တွေ ရှိနေပြီဖြစ်ပြီး နှစ်စဥ်တိုးလို့လာနေပါတယ်။
ဒီတော့ data အသုံးပြုမှုတွေက ကြီးသထက်ကြီးလာပြီး big data တွေ ပိုပိုများလာပါတယ်။ Big data အတွက် မြင်သာတဲ့ ဥပမာပေးရရင် Facebook နဲ့ Twitter ကို ပြရမှာပါပဲ။ နေ့စဥ်လိုလို tweet ပေါင်း သန်း ၈၀၀ လောက်ရှိတယ်လို့ သိရပြီး တစ်ကမ္ဘာလုံးက Facebook မှာ တင်တဲ့ post ပေါင်းက အဲထက်ပိုများတယ် လို့သိရပါတယ်။ စာလုံးရေ ကန့်သတ်ချက် ပိုနည်းတဲ့ tweet နဲ့ပဲ ပြောရအောင်။ Twitter (X) မှာ tweet တစ်ခုကို character 280 လောက်ပဲ ကန့်သတ်ပေးထားပါတယ်။ ASCII character တစ်လုံးကို 1 byte ရှိပါတယ်။ ဒီတော့ tweet တစ်ခုကို 280bytes လောက်ရှိမယ်ပေါ့။ ပုံတွေ ဗီဒီယိုတွေနဲ့ဆို ဆိုဒ်က ပိုပြီးမှာပါ။ ပျမ်းမျှဆိုရင် post တစ်ခုကို 10000bytes ဆိုပါစို့။ tweet ပေါင်း သန်း ၈၀၀ အတွက်ဆိုရင် 8TB လောက်နီးနီးသော data တွေကို နေ့စဥ် တင်နေရမှာဖြစ်ပါတယ်။ ဒါဟာ big data ပါပဲ။
ဒီနေ့အတွက်တော့ ဒီလောက်ပါပဲ။ အချိန်ရတဲ့အခါ ဆက်ပြီး ရေးပါဦးမယ်

0 Comments