
Компьютер хэрхэн зургийг харж, биднийг таньдаг вэ?

О.Дэлгэрмаа
Багш


О.Дэлгэрмаа
Багш
Бид өдөр тутамдаа ухаалаг утсаа зүгээр л царайгаараа нээж (Face ID), зураг дээрх найзыгаа сошиал медиа дээр шууд "tag" хийж, эсвэл өөрийнхөө зургийг AI ашиглан хүүхэлдэйн киноны баатар болгон хувиргадаг. Энэ бүхэн бидэнд маш энгийн, бараг л ид шид шиг санагддаг байх.
Гэвч та бодож үзсэн үү? Компьютерт мах цуснаас бүтсэн "нүд" байхгүй, биологийн тархи байхгүй атал хэрхэн зургийг харж, түүн дээр юу байгааг, бүр хэн байгааг таньж чаддаг вэ?
Компьютерын хараа (Computer Vision) болон хиймэл оюуны цаад логикоор хамтдаа аялж, дижитал ертөнцийн "нүд" хэрхэн ажилладгийг сонирхоцгооё.
Хүнд муурын зураг харуулахад бид шууд л "хөөрхөн амьтан байна" гэж хардаг. Харин компьютерт яг ижил зургийг харуулахад тэрээр ямар ч үслэг амьтан, хөөрхөн чих хардаггүй. Түүний хувьд энэ нь ердөө л 0-оос 255-ын хоорондох тоонуудаас бүтсэн аварга том Матриц (Тоон хүснэгт) юм.

Зураг бүр маш жижигхэн цэгүүд буюу Пиксел (Pixel)-ээс бүтдэг.
0 гэсэн тоо нь тас харанхуй буюу Хар өнгө-ийг илэрхийлнэ.
255 гэсэн тоо нь хамгийн тод буюу Цагаан өнгө-ийг илэрхийлнэ.
Хэрэв зураг өнгөтэй бол компьютер ар араасаа давхарласан 3 өөр өнгөний хүснэгтийг уншдаг. Үүнийг бид RGB (Red, Green, Blue) суваг гэж нэрлэдэг. Улаан, ногоон, цэнхэр өнгийн тоонуудыг хооронд нь янз бүрийн тунгаар хольсоор компьютер сая сая өнгийг бүтээж, уншиж сурдаг байна.
Компьютер тоон хүснэгтээ харчихлаа. Одоо тэр зураг дээр муур байна уу, нохой байна уу гэдгийг яаж ялгах вэ? Зургийн пиксел бүрийг нэг бүрчлэн шинжилбэл маш их хугацаа орно. Тиймээс компьютер зургийг уншихдаа "чухал хэсгүүдийг" нь тодотгож авдаг. Үүний тулд Matrix Convolution (Матрицын хувиргалт) буюу тусгай шүүлтүүрүүдийг ашигладаг.
Үүнийг ойлгохын тулд дараах энгийн дарааллыг харна уу:
Алхам 1. Ирмэгүүдийг илрүүлэх (Edge Detection):
Компьютер зургийн дээрээс тусгай 3x3 хэмжээтэй математикийн шүүлтүүрийг гүйлгэдэг. Энэ шүүлтүүр нь өнгө огцом өөрчлөгдөж буй хэсгүүдийг (жишээ нь, цагаан фон дээрх хар үсний шугам) олж, зургийн зөвхөн "хэлбэр, шугамуудыг" тодруулж үлдээдэг.
Алхам 2. Хэмжээг багасгах (Pooling):
Шүүж авсан зургаа компьютер улам жижигхэн болгодог. Жишээ нь, зургийн 4x4 пиксел хэсгээс зөвхөн хамгийн тод, хамгийн чухал ганц пикселийг нь сонгож авах замаар зургийн үндсэн мэдээллийг гээлгүйгээр хэмжээг нь хэд дахин жижигсгэдэг.

Алхам 3. Контурыг нэгтгэх (Feature Mapping):
Ингэж жижигссэн шугам, ирмэгүүдийг нэгтгэснээр компьютер "Аан, энэ хоёр гурвалжин бол чих юм байна, энэ дугуй бол нүд юм байна" гэдэг анхны бүтцийн зураглалаа гаргаж авна.
Зургийн хэлбэр дүрсийг ялгаж сурсан компьютер одоо хүний царайг хэрхэн таньдаг вэ? Үүний цаана Гүн сургалт (Deep Learning) болон Нейрон сүлжээ (Neural Networks) ажиллаж байдаг. Хиймэл оюунд хүний царайг таниулахын тулд хамгийн анх сая сая хүний зургийг уншуулж "сургадаг". Сургуулилт хийсэн AI хүний нүүр царайг харахдаа дараах математик хэмжигдэхүүнүүдийг тооцоолж гаргадаг:

Хоёр нүдний хоорондох зай
Хамарнаас уруул хүртэлх өндөр
Эрүүний хэлбэр, хацарны ясны өнцөг
AI эдгээр хэмжээсүүдийг гаргаад, хүний нүүрийг зүгээр нэг зураг биш, өвөрмөц "Тоон код" (Face Embedding) болгон хувиргадаг. Таны утасны Face ID таны нүүрийг харахдаа таны зургийг хадгалж авдаггүй, харин таны нүүрнээс үүссэн тэрхүү дахин давтагдашгүй тоон кодыг өөртөө хадгалдаг. Дараа нь таныг утсаа харах бүрт шинээр кодыг тооцоолж, хуучин кодтой таарч байвал "Энэ бол Цэцгээ байна, утсыг нээ!" гэсэн тушаал өгдөг байна.
Өнөөдөр энэ технологи зөвхөн утас нээх, зураг янзлахаас халиад дэлхийг өөрчилж байна:
Өөрийгөө жолооддог машинууд (Tesla гэх мэт): Машинд суурилуулсан камерууд секундэд хэдэн зуун кадраар зам, явган зорчигч, тэмдэг тэмдэглэгээг дээрх логикоор уншиж, хэзээ зогсох, хэзээ эргэхээ шийддэг.
Анагаах ухаан: Эмч нарын анзаараагүй рентген болон MRT зургийн маш жижиг өөрчлөлт, хавдрын эсүүдийг AI тоон матрицын шинжилгээгээр хэдхэн секундэд илрүүлж байна.
Компьютер зургийг "харна" гэдэг нь үнэндээ сая сая өнгөт цэгүүдийг математикийн аргаар шүүж, тэдгээрээс логик зүй тогтол, тоон код хайж буй хэрэг юм. Математик болон кодинг хоёр нэгдэхээрээ компьютерт "нүд" хайрлаж, бидний амьдралыг хэрхэн хөнгөвчилж чадаж байгаагийн хамгийн тод жишээ бол Компьютерын хараа юм.