Өмнөх үг
Бид бүхэн Хоёртын тооллын систем “Тооцоолуур”-т гэх нийтлэл дээр өгөгдөл тооцоолуурт хадгалагдах зарчмын талаар болон багцлах талаар дурдсан. Хэрвээ уншаагүй бол эхлээд уншихыг зөвлөе. Хэдий нь уншсан бол сэдэвтээ орцгооё.

Өгөгдөл
Тооцоолуурт хадгалагдаж буй 01010011 01100101 01100011 01110010 01100101 01110100 . . . гэх мэт урт үргэлжилсэн тоонуудыг хүн ойлгохоор болгох хэрэгтэй. Бид өмнө нь багцлан 10т болгох талаар үзсэн. Харин тэмдэгт буюу таны уншиж буй үсгүүдийг 2-тын тооллоор компьютерт илэрхийлэхдээ 8 битээр багцалдаг.
Ингэхэд бит гэдгээ мэднэ тэ?
Бидний энэ бичээд буй 0101 нь бүгд битийн хэлбэр юм. Бит нь 0, 1 гэсэн хоёр утгыг авах боломжтой буюу өмнөх нийтлэлийн маань 1 ламп маань юм. Тэгэхээр 0101 гэдэг маань 4 бит байх нь.
Univision дан интернэт үйлчилгээний дата буюу ашиглах боломжтой өгөгдөл нь дунджаар 300 GB байдаг. Энэ арын GB гэдэг нь юу гэсэн үг билээ дээ? Gega нь олон улсын нэгжийн систем-н тоо 10^9 харин Byte гэдэг нь 8 ширхэг битийг хэлнэ.
01010011 01100101 01100011 01110010 01100101 01110100 Энэхүү тоонууд нь 6 byte-н өгөгдөл. Харин 300 GB = 300 тэрбум byte эсвэл 2.4 их наяд bit гэсэн үг. Нэг byte буюу 8 битээр илэрхийлэгдэх тэмдэгт болгон өөр өөрийн кодтой.

ASCII
ASCII (American Standard Code for Information Interchange) буюу Америкийн мэдээлэл солилцооны стандарт код нь компьютер болон бусад электрон төхөөрөмжүүдэд текст өгөгдлийг дүрслэхэд ашиглагддаг тэмдэгт кодчиллын стандарт юм.
ASCII-ийн бүтэц
ASCII код нь 7 битээр (128 тэмдэгт) анх тодорхойлогдсон бөгөөд дараах гурван үндсэн хэсэгтэй:
- Удирдлагын тэмдэгтүүд (0-31):
- Гар дээр харагддаггүй, өгөгдөл дамжуулах, хэвлэх командуудыг агуулсан.
- Жишээ нь:
\n
(шинэ мөр),\t
(таб зай),\r
(мөр буулгах).
- Үндсэн тэмдэгтүүд (32-126):
- Тоонууд (
0-9
), том (A-Z
), жижиг (a-z
) үсгүүд, тэмдэгтүүд (@, #, $, %
гэх мэт).
- Тоонууд (
- Өргөтгөсөн ASCII (128-255):
- Үндсэн 7 битийн ASCII-г 8 бит болгон өргөтгөж, олон улсын тэмдэгтүүдийг оруулсан.
ASCII кодын жишээ
Тэмдэгт | ASCII (Decimal) | ASCII (Hex) | ASCII (Binary) |
---|---|---|---|
A | 65 | 41 | 01000001 |
a | 97 | 61 | 01100001 |
0 | 48 | 30 | 00110000 |
Space | 32 | 20 | 00100000 |
@ | 64 | 40 | 01000000 |
ASCII хэрэглээ
- Компьютерын текст боловсруулах систем
- Програмчлалын хэлнүүд дэх тэмдэгт хадгалах
- Мэдээлэл дамжуулах протоколууд
- Файл систем дэх нэр, кодчилол
Бидний жишээн дээрээ ашиглаад байгаа 6 байт (01010011 01100101 01100011 01110010 01100101 01110100) өгөгдөл маань ASCII код ашиглан хөрвүүлж үзвэл Secret гэсэн үг үүснэ. Харин “Hi Untaach” гэдэг 10 байтын өгөгдөл. Үүнд зай нь бас орж байгаа.

Юникод ба ASCII
ASCII нь зөвхөн Англи хэлний тэмдэгтүүдийг дэмждэг тул олон улсын тэмдэгтүүдийг багтаахын тулд Юникод (Unicode) стандарт үүссэн. Ази ханз, Монгол бичиг гэх мэт өвөрмөц тэмдэгтүүдийг Unicode ашиглан компьютерт дүрсэлдэг. Мөн өөр нэг чухал зүйлд ашигладаг. Үүнийг дараагийн нийтлэл дээр тайлбарлах болно. Баярлалаа <3