Recent in Technology

Data Hierarchy For Newbies

Bits

Binary digIT ကို အတိုကောက် bit လို့ သုံးပါတယ်။ အစစာလုံး B နဲ့ နောက်ဆုံးအဆုံးသတ် it ကို တွဲလိုက်တာပါ။ ဒီတော့ bit ဆိုတာ binary digit လို့ မှတ်ထားရမှာဖြစ်ပါတယ်။ digit တွေမှာတော့ အားလုံးသိကြတဲ့အတိုင်း 0 နဲ့ 1 ဆိုပြီးတော့ ကိန်း ၂ လုံးပါဝင်ပါတယ်။ အဲထဲက တစ်လုံးသည် 1 bit ပေါ့။ အဲသည် 0 နဲ့ 1 ကိုပဲ လိုအပ်သလို ပေါင်းစပ်ဖန်တီးလိုက်တဲ့အခါ ဒီနေ့ ကျွန်တော်တို့သုံးနေကြတဲ့ ကွန်ပျူတာတွေ ဖုန်းတွေမှာ အလုပ်လုပ်ဆောင်နိင်ကြတဲ့ application တွေ ဖြစ်လာကြပါတော့တယ်။ ဆိုလိုတာက ကျွန်တော်တို့တွေ အသုံးပြုနေကြတဲ့ ကွန်ပျူတာတွေ၊ ဖုန်းတွေရဲ့ အံ့သြဖွယ်ရာလုပ်ဆောင်ချက်တွေကို နောက်ကွယ်ကနေ 0 နဲ့ 1 တွေက ကြိုးကိုင်ခြယ်လှယ်ထားကြတာ ဖြစ်တယ်ဆိုတာပါပဲ။

Characters

0 နဲ့ 1 တွေသာ ပါဝင်တဲ့ low-level form bit တွေနဲ့ အလုပ်လုပ်ရတာက လူသားတွေအတွက် ပျင်းစရာကောင်းပါတယ်။ လူသားတွေက ကိန်းဆိုရင်လည်း 0–9 ၊ letter ဆိုရင်လည်း A–Z နဲ့ စာလုံးအသေးဆို a–z တွေပေါ့၊ ဒါ့ပြင် special symbol တွေဖြစ်တဲ့ $@%&*()–+":;,?/ စသည်ဖြင့် ဒီလိုစကားလုံးတွေနဲ့ လုပ်ဆောင်ရတာကို ပိုအဆင်ပြေကြပါတယ်။ အဲသည် ကိန်းတွေ၊ စာလုံးတွေနဲ့ အထူးသင်္ကေတတွေကို အားလုံးပေါင်းပြီး characters လို့ ခေါ်ကြပါတယ်။ ဒီတေ့ လူတွေ အသုံးပြုနေကြတဲ့ စကားလုံးတွေက အများကြီး ဖြစ်ပြီးတော့ ကွန်ပျူတာက နားလည်လုပ်ဆောင်နိုင်တာက 0 နဲ့ 1 ပဲ ရှိတာကြောင့်မို့လို့ ကွန်ပျူတာအတွက် အဆင်ပြေစေဖို့ 0 နဲ့ 1 တွေ အတွဲလိုက်ကြီး ပါဝင်နေတဲ့ ပုံစံကို ဖန်တီးအသုံးပြုကြရပါတယ်။ C Programming language မှာတော့ ASCII (American Standard Code for Information Interchange) character set ကို default အနေနဲ့ အသုံးပြုပါတယ်။ သို့သော် C မှာ Unicode® characters တွေကိုလည်း 8bits, 16bits, 24bits or 32bits တွေကိုလည်း support ပေးထားပါတယ်။

Unicode မှာကတော့ ကမ္ဘာပေါ်မှာရှိတဲ့ ဘာသာစကားအများကြီးရဲ့ character တွေ ပါဝင်နေပါတယ်။ ASCII subset of Unicode ကို ဒီ link မှာ ကြည့်နိုင်ပါတယ် Language အားလုံးရဲ့ unicode chart ကိုတော့ ဒီ link မှာ ကြည့်နိုင်ပါတယ်။.

Fields

Character တွေကို bit တွေနဲ့ ဖွဲ့စည်းထားပါတယ်။ အဲသည် character တွေအများကြီး စုဖွဲ့လာတဲ့အခါ field ဖြစ်လာပါတယ်။ ဒါကြောင့်မို့ field ဆိုတာ character (bytes) တွေကို စုစည်းထားတဲ့ group လို့ ဆိုနိုင်ပါတယ်။ Field နဲ့ပတ်သက်ရင် လူတစ်ယောက်ရဲ့ နာမည်ကို ဖော်ပြတယ်ဆိုပါစို့၊ field ထဲမှာ စာလုံးအကြီးအသေး (Uppercases & lowercases letters) တွေ ပါဝင်နေနိုင်သလို၊ လူတစ်ယောက်ရဲ့ အသက်ကို ဖော်ပြမယ်ဆိုရင် ကိန်းဂဏန်းတွေ ပါဝင်နေမှာဖြစ်ပါတယ်။ ဒါကြောင့်မို့ field ထဲမှာ Character အစုံ ပါနေနိင်လို့ ဆိုရပါမယ်။

Records

မြန်မာလိုပြောရင်တော့ မှတ်တမ်းပေါ့။ ဒီတော့ record တွေထဲမှာ field တွေ အများကြီး ပါဝင်နေနိုင်ပါတယ်။ ဥပမာ payroll system တစ်ခု ဆိုကြပါစို့။ အလုပ်သမားတစ်ယောက်အတွက် လစာတွက်ချက်မှုမှာ ဒီလိုမျိုးအချက်အလက်တွေ ပါနေနိုင်ပါတယ်။

  • အလုပ်သမား ID (ကိန်းတွေပေါ့)
  • အမည် (characters တွေ အများကြီးပါမယ်)
  • လိပ်စာ (characters တွေ အများကြီးပါမယ်)
  • တစ်နာရီလုပ်ခ (ဒသမကိန်းတွေ ပါဝင်နေနိုင်တဲ့ ကိန်းတွေ)
  • စုစုပေါင်းအလုပ်လုပ်ချိန် (ဒသမကိန်းတွေ ပါဝင်နေနိုင်တဲ့ ကိန်းတွေ)
  • စုစုပေါင်းလုပ်ခလစာ (ဒသမကိန်းတွေ ပါဝင်နေနိုင်တဲ့ ကိန်းတွေ)

ဒီဥပမာကိုကြည့်ရင် record တစ်ခုမှာ သက်ဆိုင်ရာ field တွေ စုဖွဲ့ပါဝင်နေတာကို တွေ့ရမှာဖြစ်ပါတယ်။ ဒါက အလုပ်သမားတစ်ယောက်စာအတွက် နမူနာသာ ဖြစ်ပါတယ်။ ကုမ္ပဏီတစ်ခုမှာ အလုပ်သမား အများကြီး ရှိနေမှာပါ။ လုပ်ခလစာ တူတဲ့သူတွေလည်း ရှိသလို မတူတဲ့သူတွေလည်း ရှိနေမှာပါပဲ။

Files

Record တွေထဲမှာ သက်ဆိုင်ရာ field တွေ အများကြီး စုဖွဲ့ပါဝင်နေပါတယ်။ ထို့အတူ file တွေထဲမှာလည်း သက်ဆိုင်ရာ record တွေ အများကြီး ပါဝင်နေပါတယ်။ အချို့ Operating system တွေသည် file တွေကို bytes တွေများစွာပါဝင်နေတဲ့ sequence of bytes တွေအဖြစ်သာ ရှုမြင်လေ့ရှိပါတယ်။ ဒါကို File processing တွေအကြောင်း လေ့လာတဲ့အခါ မြင်သာပါလိမ့်မယ်။ Organization တစ်ခုမှာ ဖိုင်တွေ အများကြီး ရှိနေမှာဖြစ်ပြီး၊ ဖိုင်တွေထဲမှာလည်း ဘီလျံ သို့မဟုတ် ထရီလျံနဲ့ချီတဲ့ character တွေ ပါနေနိုင်ပါတယ်။ ဒီအကြောင်းကို big data အပိုင်းမှာ ဆက်ပြီး ဖတ်နိုင်မှာပါ။

Databases

လွယ်ကူစွာ ကိုင်တွယ်လုပ်ဆောင်နိုင်စွမ်းရှိစေဖို့အတွက် ဒေတာတွေကို စုစည်းထားရှိတာကို database လို့ ခေါ်ပြီးတော့ relational database တွေသည် လူကြိုက်အများဆုံးဖြစ်နေပါတယ်။ ဘာကြောင့်လဲဆိုတော့ ဒေတာတွေကို ရိုးရှင်းလွယ်ကူတဲ့ ဇယားကွက်တွေထဲမှာ သိမ်းဆည်းထားလို့ ဖြစ်ပါတယ်။ Excel file ထဲက ဇယားကွက်တွေကို နမူနာ မြင်ယောင်ကြည့်နိုင်ပါတယ်။ Table တစ်ခုမှာ record တွေအများကြီး ပါနေနိုင်ပါတယ်။ record တစ်ခုစီထဲမှာလည်း သက်ဆိုင်ရာ field တွေ ပါဝင်နေနိုင်ပါတယ်။ ဥပမာပြောရရင် Student table တစ်ခု ဆိုကြပါစို့။ အဲသည်မှာ ကျောင်းသားတွေအတွက် နာမည်၊ မေဂျာ၊ နှစ်၊ ID နဲ့ grade စတာတွေ ပါဝင်နိုင်ပါတယ်။ ကျောင်းသားတစ်ဦးစီအတွက် ဒေတာသည် record တစ်ခုစီ ဖြစ်ပြီးတော့ record ထဲမှာ ပါဝင်နေတဲ့ အချက်အလက်တစ်ကန့်စီသည် field တွေဖြစ်ကြပါတယ်။ ဒီထဲကနေမှ ကိုယ်သိချင်တဲ့အချက်အလက်တွေကို ကျောင်းသားအများကြီးထဲကနေ တစ်ယောက်စီကြည့်ပြီးလိုက်ရှာနေစရာမလိုဘဲ စစ်ထုတ်ရယူနိုင်အောင် စီစဥ်ထားရှိတာကို database လို့ ဆိုနိုင်ပါတယ်။

Big Data

1bit မှာ 8 bytes ပါဝင်ပါတယ်။ သိထားသင့်တဲ့ unit တွေရဲ့ ဆက်သွယ်ချက်ကို ဒီလိုလေ့လာကြည့်နိုင်ပါတယ်။

Unit Bytes Which is approximately
1 kilobyte (KB) 1024 bytes 103 bytes (1024 bytes exactly)
1 megabyte (MB) 1024 kilobytes 106 (1,000,000) bytes
1 gigabyte (GB) 1024 megabytes 109 (1,000,000,000) bytes
1 terabyte (TB) 1024 gigabytes 1012 (1,000,000,000,000) bytes
1 petabyte (PB) 1024 terabytes 1015 (1,000,000,000,000,000) bytes
1 exabyte (EB) 1024 petabytes 1018 (1,000,000,000,000,000,000) bytes
1 zettabyte (ZB) 1024 exabytes 1021 (1,000,000,000,000,000,000,000) bytes

နည်းပညာအသုံးပြုကိရိယာတွေ နဲ့ ဆက်သွယ်ရေးတိုးတက်လာမှုတွေကြောင့် တစ်ကမ္ဘာလုံးကနေ နေ့စဥ် ထုတ်နေတဲ့ ဒေတာပမာဏက မျှော်မှန်းမထားမိလောက်အောင် များလွန်းပါတယ်။ ဒီနယ်ပယ်ကျယ်လာတာနဲ့အမျှ software developer တွေရဲ့ အခွင့်အလန်းတွေကလည်း ပိုတိုးလို့လာနေပါတယ်။ IT ပိုင်းဆိုင်ရာ လုပ်ငန်းခွင်တွေမှာလည်း သန်းပေါင်းများစွာသော အလုပ်အကိုင်တွေ ရှိနေပြီဖြစ်ပြီး နှစ်စဥ်တိုးလို့လာနေပါတယ်။

ဒီတော့ data အသုံးပြုမှုတွေက ကြီးသထက်ကြီးလာပြီး big data တွေ ပိုပိုများလာပါတယ်။ Big data အတွက် မြင်သာတဲ့ ဥပမာပေးရရင် Facebook နဲ့ Twitter ကို ပြရမှာပါပဲ။ နေ့စဥ်လိုလို tweet ပေါင်း သန်း ၈၀၀ လောက်ရှိတယ်လို့ သိရပြီး တစ်ကမ္ဘာလုံးက Facebook မှာ တင်တဲ့ post ပေါင်းက အဲထက်ပိုများတယ် လို့သိရပါတယ်။ စာလုံးရေ ကန့်သတ်ချက် ပိုနည်းတဲ့ tweet နဲ့ပဲ ပြောရအောင်။ Twitter (X) မှာ tweet တစ်ခုကို character 280 လောက်ပဲ ကန့်သတ်ပေးထားပါတယ်။ ASCII character တစ်လုံးကို 1 byte ရှိပါတယ်။ ဒီတော့ tweet တစ်ခုကို 280bytes လောက်ရှိမယ်ပေါ့။ ပုံတွေ ဗီဒီယိုတွေနဲ့ဆို ဆိုဒ်က ပိုပြီးမှာပါ။ ပျမ်းမျှဆိုရင် post တစ်ခုကို 10000bytes ဆိုပါစို့။ tweet ပေါင်း သန်း ၈၀၀ အတွက်ဆိုရင် 8TB လောက်နီးနီးသော data တွေကို နေ့စဥ် တင်နေရမှာဖြစ်ပါတယ်။ ဒါဟာ big data ပါပဲ။

ဒီနေ့အတွက်တော့ ဒီလောက်ပါပဲ။ အချိန်ရတဲ့အခါ ဆက်ပြီး ရေးပါဦးမယ်

Post a Comment

0 Comments

People