Recent in Technology

Data Hierarchy For Newbies

Bits

Binary digIT α€€ို ထတိုα€€ောα€€် bit α€œို့ α€žုံးပါα€α€š်။ ထစစာα€œုံး B α€”ဲ့ α€”ောα€€်ဆုံးထဆုံးα€žα€် it α€€ို တွဲα€œိုα€€်တာပါ။ α€’ီတော့ bit ဆိုတာ binary digit α€œို့ α€™ှတ်ထားα€›α€™ှာα€–ြα€…်ပါα€α€š်။ digit တွေα€™ှာတော့ ထားα€œုံးα€žိα€€ြတဲ့ထတိုင်း 0 α€”ဲ့ 1 ဆိုပြီးတော့ α€€ိα€”်း ၂ α€œုံးပါဝင်ပါα€α€š်။ ထဲထဲα€€ တစ်α€œုံးα€žα€Š် 1 bit ပေါ့။ ထဲα€žα€Š် 0 α€”ဲ့ 1 α€€ိုပဲ α€œိုထပ်α€žα€œို ပေါင်းစပ်α€–α€”်တီးα€œိုα€€်တဲ့ထခါ α€’ီα€”ေ့ α€€ျွα€”်တော်တို့α€žုံးα€”ေα€€ြတဲ့ α€€ွα€”်ပျူတာတွေ α€–ုα€”်းတွေα€™ှာ α€‘α€œုပ်α€œုပ်ဆောင်α€”ိင်α€€ြတဲ့ application တွေ α€–ြα€…်α€œာα€€ြပါတော့α€α€š်။ ဆိုα€œိုတာα€€ α€€ျွα€”်တော်တို့တွေ α€‘α€žုံးပြုα€”ေα€€ြတဲ့ α€€ွα€”်ပျူတာတွေ၊ α€–ုα€”်းတွေα€›ဲ့ ထံ့α€žြα€–ွα€š်α€›ာα€œုပ်ဆောင်ချα€€်တွေα€€ို α€”ောα€€်α€€ွα€š်α€€α€”ေ 0 α€”ဲ့ 1 တွေα€€ α€€ြိုးα€€ိုင်ခြα€š်α€œှα€š်ထားα€€ြတာ α€–ြα€…်α€α€š်ဆိုတာပါပဲ။

Characters

0 α€”ဲ့ 1 တွေα€žာ ပါဝင်တဲ့ low-level form bit တွေα€”ဲ့ α€‘α€œုပ်α€œုပ်ရတာα€€ α€œူα€žားတွေထတွα€€် ပျင်းα€…α€›ာα€€ောင်းပါα€α€š်။ α€œူα€žားတွေα€€ α€€ိα€”်းဆိုရင်α€œα€Š်း 0–9 ၊ letter ဆိုရင်α€œα€Š်း A–Z α€”ဲ့ α€…ာα€œုံးα€‘α€žေးဆို a–z တွေပေါ့၊ α€’ါ့ပြင် special symbol တွေα€–ြα€…်တဲ့ $@%&*()–+":;,?/ α€…α€žα€Š်α€–ြင့် α€’ီα€œိုα€…α€€ားα€œုံးတွေα€”ဲ့ α€œုပ်ဆောင်ရတာα€€ို ပိုထဆင်ပြေα€€ြပါα€α€š်။ ထဲα€žα€Š် α€€ိα€”်းတွေ၊ α€…ာα€œုံးတွေα€”ဲ့ ထထူးα€žα€„်္α€€ေတတွေα€€ို ထားα€œုံးပေါင်းပြီး characters α€œို့ ခေါ်α€€ြပါα€α€š်။ α€’ီတေ့ α€œူတွေ α€‘α€žုံးပြုα€”ေα€€ြတဲ့ α€…α€€ားα€œုံးတွေα€€ ထများα€€ြီး α€–ြα€…်ပြီးတော့ α€€ွα€”်ပျူတာα€€ α€”ားα€œα€Š်α€œုပ်ဆောင်α€”ိုင်တာα€€ 0 α€”ဲ့ 1 ပဲ α€›ှိတာα€€ြောင့်α€™ို့α€œို့ α€€ွα€”်ပျူတာထတွα€€် ထဆင်ပြေα€…ေα€–ို့ 0 α€”ဲ့ 1 တွေ ထတွဲα€œိုα€€်α€€ြီး ပါဝင်α€”ေတဲ့ ပုံα€…ံα€€ို α€–α€”်တီးα€‘α€žုံးပြုα€€ြရပါα€α€š်။ C Programming language α€™ှာတော့ ASCII (American Standard Code for Information Interchange) character set α€€ို default ထနေα€”ဲ့ α€‘α€žုံးပြုပါα€α€š်။ α€žို့α€žော် C α€™ှာ Unicode® characters တွေα€€ိုα€œα€Š်း 8bits, 16bits, 24bits or 32bits တွေα€€ိုα€œα€Š်း support ပေးထားပါα€α€š်။

Unicode α€™ှာကတော့ α€€α€™္α€˜ာပေါ်α€™ှာα€›ှိတဲ့ α€˜ာα€žာα€…α€€ားထများα€€ြီးα€›ဲ့ character တွေ ပါဝင်α€”ေပါα€α€š်။ ASCII subset of Unicode α€€ို α€’ီ link α€™ှာ α€€ြα€Š့်α€”ိုင်ပါα€α€š် Language ထားα€œုံးα€›ဲ့ unicode chart α€€ိုတော့ α€’ီ link α€™ှာ α€€ြα€Š့်α€”ိုင်ပါα€α€š်။.

Fields

Character တွေα€€ို bit တွေα€”ဲ့ α€–ွဲ့α€…α€Š်းထားပါα€α€š်။ ထဲα€žα€Š် character တွေထများα€€ြီး α€…ုα€–ွဲ့α€œာတဲ့ထခါ field α€–ြα€…်α€œာပါα€α€š်။ α€’ါα€€ြောင့်α€™ို့ field ဆိုတာ character (bytes) တွေα€€ို α€…ုα€…α€Š်းထားတဲ့ group α€œို့ ဆိုα€”ိုင်ပါα€α€š်။ Field α€”ဲ့ပတ်α€žα€€်ရင် α€œူတစ်α€šောα€€်α€›ဲ့ α€”ာα€™α€Š်α€€ို α€–ော်ပြα€α€š်ဆိုပါα€…ို့၊ field ထဲα€™ှာ α€…ာα€œုံးထကြီးα€‘α€žေး (Uppercases & lowercases letters) တွေ ပါဝင်α€”ေα€”ိုင်α€žα€œို၊ α€œူတစ်α€šောα€€်α€›ဲ့ α€‘α€žα€€်α€€ို α€–ော်ပြα€™α€š်ဆိုရင် α€€ိα€”်းဂဏန်းတွေ ပါဝင်α€”ေα€™ှာα€–ြα€…်ပါα€α€š်။ α€’ါα€€ြောင့်α€™ို့ field ထဲα€™ှာ Character ထစုံ ပါα€”ေα€”ိင်α€œို့ ဆိုရပါα€™α€š်။

Records

α€™ြα€”်α€™ာα€œိုပြောရင်တော့ α€™ှတ်တမ်းပေါ့။ α€’ီတော့ record တွေထဲα€™ှာ field တွေ ထများα€€ြီး ပါဝင်α€”ေα€”ိုင်ပါα€α€š်။ α€₯ပမာ payroll system တစ်ခု ဆိုα€€ြပါα€…ို့။ α€‘α€œုပ်α€žα€™ားတစ်α€šောα€€်ထတွα€€် α€œα€…ာတွα€€်ချα€€်α€™ှုα€™ှာ α€’ီα€œိုα€™ျိုးထချα€€်α€‘α€œα€€်တွေ ပါα€”ေα€”ိုင်ပါα€α€š်။

  • α€‘α€œုပ်α€žα€™ား ID (α€€ိα€”်းတွေပေါ့)
  • α€‘α€™α€Š် (characters တွေ ထများα€€ြီးပါα€™α€š်)
  • α€œိပ်α€…ာ (characters တွေ ထများα€€ြီးပါα€™α€š်)
  • တစ်α€”ာα€›ီα€œုပ်ခ (α€’α€žα€™α€€ိα€”်းတွေ ပါဝင်α€”ေα€”ိုင်တဲ့ α€€ိα€”်းတွေ)
  • α€…ုα€…ုပေါင်းα€‘α€œုပ်α€œုပ်ချိα€”် (α€’α€žα€™α€€ိα€”်းတွေ ပါဝင်α€”ေα€”ိုင်တဲ့ α€€ိα€”်းတွေ)
  • α€…ုα€…ုပေါင်းα€œုပ်α€α€œα€…ာ (α€’α€žα€™α€€ိα€”်းတွေ ပါဝင်α€”ေα€”ိုင်တဲ့ α€€ိα€”်းတွေ)

α€’ီα€₯ပမာα€€ိုα€€ြα€Š့်ရင် record တစ်ခုα€™ှာ α€žα€€်ဆိုင်α€›ာ field တွေ α€…ုα€–ွဲ့ပါဝင်α€”ေတာα€€ို တွေ့α€›α€™ှာα€–ြα€…်ပါα€α€š်။ α€’ါα€€ α€‘α€œုပ်α€žα€™ားတစ်α€šောα€€်α€…ာထတွα€€် α€”α€™ူα€”ာα€žာ α€–ြα€…်ပါα€α€š်။ α€€ုα€™္ပဏီတစ်ခုα€™ှာ α€‘α€œုပ်α€žα€™ား ထများα€€ြီး α€›ှိα€”ေα€™ှာပါ။ α€œုပ်α€α€œα€…ာ တူတဲ့α€žူတွေα€œα€Š်း α€›ှိα€žα€œို မတူတဲ့α€žူတွေα€œα€Š်း α€›ှိα€”ေα€™ှာပါပဲ။

Files

Record တွေထဲα€™ှာ α€žα€€်ဆိုင်α€›ာ field တွေ ထများα€€ြီး α€…ုα€–ွဲ့ပါဝင်α€”ေပါα€α€š်။ ထို့ထတူ file တွေထဲα€™ှာα€œα€Š်း α€žα€€်ဆိုင်α€›ာ record တွေ ထများα€€ြီး ပါဝင်α€”ေပါα€α€š်။ ထချို့ Operating system တွေα€žα€Š် file တွေα€€ို bytes တွေα€™ျားα€…ွာပါဝင်α€”ေတဲ့ sequence of bytes တွေထဖြα€…်α€žာ α€›ှုα€™ြင်α€œေ့α€›ှိပါα€α€š်။ α€’ါα€€ို File processing တွေထကြောင်း α€œေ့α€œာတဲ့ထခါ α€™ြင်α€žာပါα€œိα€™့်α€™α€š်။ Organization တစ်ခုα€™ှာ α€–ိုင်တွေ ထများα€€ြီး α€›ှိα€”ေα€™ှာα€–ြα€…်ပြီး၊ α€–ိုင်တွေထဲα€™ှာα€œα€Š်း α€˜ီα€œျံ α€žို့α€™α€Ÿုတ် ထရီα€œျံα€”ဲ့ချီတဲ့ character တွေ ပါα€”ေα€”ိုင်ပါα€α€š်။ α€’ီထကြောင်းα€€ို big data ထပိုင်းα€™ှာ ဆက်ပြီး ဖတ်α€”ိုင်α€™ှာပါ။

Databases

α€œွα€š်α€€ူα€…ွာ α€€ိုင်တွα€š်α€œုပ်ဆောင်α€”ိုင်α€…ွα€™်းα€›ှိα€…ေα€–ို့ထတွα€€် α€’ေတာတွေα€€ို α€…ုα€…α€Š်းထားα€›ှိတာα€€ို database α€œို့ ခေါ်ပြီးတော့ relational database တွေα€žα€Š် α€œူα€€ြိုα€€်ထများဆုံးα€–ြα€…်α€”ေပါα€α€š်။ α€˜ာα€€ြောင့်α€œဲဆိုတော့ α€’ေတာတွေα€€ို α€›ိုးα€›ှင်းα€œွα€š်α€€ူတဲ့ α€‡α€šားα€€ွα€€်တွေထဲα€™ှာ α€žိα€™်းα€†α€Š်းထားα€œို့ α€–ြα€…်ပါα€α€š်။ Excel file ထဲα€€ α€‡α€šားα€€ွα€€်တွေα€€ို α€”α€™ူα€”ာ α€™ြင်α€šောင်α€€ြα€Š့်α€”ိုင်ပါα€α€š်။ Table တစ်ခုα€™ှာ record တွေထများα€€ြီး ပါα€”ေα€”ိုင်ပါα€α€š်။ record တစ်ခုα€…ီထဲα€™ှာα€œα€Š်း α€žα€€်ဆိုင်α€›ာ field တွေ ပါဝင်α€”ေα€”ိုင်ပါα€α€š်။ α€₯ပမာပြောရရင် Student table တစ်ခု ဆိုα€€ြပါα€…ို့။ ထဲα€žα€Š်α€™ှာ α€€ျောင်းα€žားတွေထတွα€€် α€”ာα€™α€Š်၊ α€™ေဂျာ၊ α€”ှα€…်၊ ID α€”ဲ့ grade စတာတွေ ပါဝင်α€”ိုင်ပါα€α€š်။ α€€ျောင်းα€žားတစ်α€₯ီးα€…ီထတွα€€် α€’ေတာα€žα€Š် record တစ်ခုα€…ီ α€–ြα€…်ပြီးတော့ record ထဲα€™ှာ ပါဝင်α€”ေတဲ့ ထချα€€်α€‘α€œα€€်တစ်α€€α€”့်α€…ီα€žα€Š် field တွေα€–ြα€…်α€€ြပါα€α€š်။ α€’ီထဲα€€α€”ေα€™ှ α€€ိုα€š်α€žိချင်တဲ့ထချα€€်α€‘α€œα€€်တွေα€€ို α€€ျောင်းα€žားထများα€€ြီးထဲα€€α€”ေ တစ်α€šောα€€်α€…ီα€€ြα€Š့်ပြီးα€œိုα€€်α€›ှာα€”ေα€…α€›ာα€™α€œိုα€˜ဲ α€…α€…်ထုတ်α€›α€šူα€”ိုင်ထောင် α€…ီα€…α€₯်ထားα€›ှိတာα€€ို database α€œို့ ဆိုα€”ိုင်ပါα€α€š်။

Big Data

1bit α€™ှာ 8 bytes ပါဝင်ပါα€α€š်။ α€žိထားα€žα€„့်တဲ့ unit တွေα€›ဲ့ ဆက်α€žွα€š်ချα€€်α€€ို α€’ီα€œိုα€œေ့α€œာα€€ြα€Š့်α€”ိုင်ပါα€α€š်။

Unit Bytes Which is approximately
1 kilobyte (KB) 1024 bytes 103 bytes (1024 bytes exactly)
1 megabyte (MB) 1024 kilobytes 106 (1,000,000) bytes
1 gigabyte (GB) 1024 megabytes 109 (1,000,000,000) bytes
1 terabyte (TB) 1024 gigabytes 1012 (1,000,000,000,000) bytes
1 petabyte (PB) 1024 terabytes 1015 (1,000,000,000,000,000) bytes
1 exabyte (EB) 1024 petabytes 1018 (1,000,000,000,000,000,000) bytes
1 zettabyte (ZB) 1024 exabytes 1021 (1,000,000,000,000,000,000,000) bytes

α€”α€Š်းα€•α€Šာα€‘α€žုံးပြုα€€ိα€›ိα€šာတွေ α€”ဲ့ ဆက်α€žွα€š်α€›ေးတိုးတက်α€œာα€™ှုတွေα€€ြောင့် တစ်α€€α€™္α€˜ာα€œုံးα€€α€”ေ α€”ေ့α€…α€₯် ထုတ်α€”ေတဲ့ α€’ေတာပမာဏက α€™ျှော်α€™ှα€”်းမထားα€™ိα€œောα€€်ထောင် α€™ျားα€œွα€”်းပါα€α€š်။ α€’ီα€”α€š်α€•α€š်α€€ျα€š်α€œာတာα€”ဲ့ထမျှ software developer တွေα€›ဲ့ ထခွင့်α€‘α€œα€”်းတွေα€€α€œα€Š်း ပိုတိုးα€œို့α€œာα€”ေပါα€α€š်။ IT ပိုင်းဆိုင်α€›ာ α€œုပ်ငန်းခွင်တွေα€™ှာα€œα€Š်း α€žα€”်းပေါင်းα€™ျားα€…ွာα€žော α€‘α€œုပ်ထကိုင်တွေ α€›ှိα€”ေပြီα€–ြα€…်ပြီး α€”ှα€…်α€…α€₯်တိုးα€œို့α€œာα€”ေပါα€α€š်။

α€’ီတော့ data α€‘α€žုံးပြုα€™ှုတွေα€€ α€€ြီးα€žα€‘α€€်α€€ြီးα€œာပြီး big data တွေ ပိုပိုα€™ျားα€œာပါα€α€š်။ Big data ထတွα€€် α€™ြင်α€žာတဲ့ α€₯ပမာပေးရရင် Facebook α€”ဲ့ Twitter α€€ို ပြα€›α€™ှာပါပဲ။ α€”ေ့α€…α€₯်α€œိုα€œို tweet ပေါင်း α€žα€”်း αˆα€α€ α€œောα€€်α€›ှိα€α€š်α€œို့ α€žိရပြီး တစ်α€€α€™္α€˜ာα€œုံးα€€ Facebook α€™ှာ တင်တဲ့ post ပေါင်းα€€ ထဲထက်ပိုα€™ျားα€α€š် α€œို့α€žိရပါα€α€š်။ α€…ာα€œုံးα€›ေ α€€α€”့်α€žα€်ချα€€် ပိုα€”α€Š်းတဲ့ tweet α€”ဲ့ပဲ ပြောရထောင်။ Twitter (X) α€™ှာ tweet တစ်ခုα€€ို character 280 α€œောα€€်ပဲ α€€α€”့်α€žα€်ပေးထားပါα€α€š်။ ASCII character တစ်α€œုံးα€€ို 1 byte α€›ှိပါα€α€š်။ α€’ီတော့ tweet တစ်ခုα€€ို 280bytes α€œောα€€်α€›ှိα€™α€š်ပေါ့။ ပုံတွေ α€—ီα€’ီα€šိုတွေα€”ဲ့ဆို ဆိုα€’်α€€ ပိုပြီးα€™ှာပါ။ ပျα€™်းα€™ျှဆိုရင် post တစ်ခုα€€ို 10000bytes ဆိုပါα€…ို့။ tweet ပေါင်း α€žα€”်း αˆα€α€ ထတွα€€်ဆိုရင် 8TB α€œောα€€်α€”ီးα€”ီးα€žော data တွေα€€ို α€”ေ့α€…α€₯် တင်α€”ေα€›α€™ှာα€–ြα€…်ပါα€α€š်။ α€’ါα€Ÿာ big data ပါပဲ။

α€’ီα€”ေ့ထတွα€€်တော့ α€’ီα€œောα€€်ပါပဲ။ ထချိα€”်ရတဲ့ထခါ ဆက်ပြီး α€›ေးပါα€₯ီးα€™α€š်

Post a Comment

0 Comments

People