Гүн сургалтыг гүнээс нь сурцгаая №2 (Let’s dive deep into deep learning )
Өмнөх үг Эрхэм уншигч танд энэ өдрийн мэндийг хүргэе. Энэхүү нийтлэл нь өмнөх Гүн сургалтыг гүнээс нь сурцгаая №1 нийтлэлийн үргэлжлэл учир өмнөхийг нь уншаагүй бол заавал уншаад эргэж ирээрэй. Өмнөх нийтлэлээр Бид өмнөх нийтлэлээр “нийтлэл унших эсэх” ийг шийддэг доорх загварыг ойлгоод дууссан.Энэхүү персептрон загвар нь 3н оролттой. Түүнээс хамааран нийтлэл унших эсэхийг шийддэг […]
Гүн сургалтыг гүнээс нь сурцгаая №1 (Let’s dive deep into deep learning.)
Өмнөх үг Эрхэм уншигч танд энэ өдрийн мэндийг хүргэе. Энэхүү нийтлэлээрээ би бүхий л хиймэл оюуны том том амжилтуудын эхлэлийг тавьсан гүн сургалтыг эхнээс нь энгийн байдлаар тайлбарлах гэж оролдох болно.Тиймээс энэхүү нийтлэлээрээ персептрон гэх хамгийн анхны мэдрэлийн сүлжээний загварыг тайлбарлана. Уг нийтлэлийг бичсэнээр өөрөө ч бас их зүйл судалж ойлгоно гэж найдаж байна. Eр […]
Label Encoding vs One-Hot Encoding: Машинд мэдээлэл ойлгуулах хоёр арга
Машин сургалтын алгоритмууд өгөгдлийг зөвхөн тоогоор ойлгодог. Гэвч бидний амьдрал дахь мэдээлэл ихэнхдээ текст, нэр, категори хэлбэртэй байдаг. Эдгээрийг машин ойлгодог тоон мэдээлэл болгож хувиргах шаардлагатай бөгөөд үүнийг хийх хамгийн түгээмэл хоёр арга нь Label Encoding болон One-Hot Encoding юм. Label Encoding гэж юу вэ? Label Encoding гэдэг нь өгөгдлийн категори тус бүрд нэг тоо […]
Хүн ойлгоно, машин ойлгохгүй… Харин Feature Extraction тусална!
Та зураг харлаа гэж бодъё. Тэр зураг дээр нохой байна уу, муур байна уу гэдгийг хүн амархан ялгаж чадна. Гэтэл машин, компьютер үүнийг ойлгохын тулд “зураг дотор байгаа мэдээллийг” утгатай өгөгдөл болгон хувиргах хэрэгтэй болдог. Энэ процессыг Feature Extraction гэж нэрлэдэг. Энгийнээр хэлбэл, feature extraction гэдэг нь “компьютерт мэдээллийг ойлгож болохуйц хэлбэрт оруулах” ухаалаг алхам […]
Transformer ( Олны анхаарал татсан анхаарлын механизм )
Сүүлийн хэдэн жилийн турш гүнзгий сургалтын салбарт Transformer архитектур нь маш их анхаарал татсан, хүчирхэг загвар болон хөгжсөн. Ялангуяа хэлний загварууд дээр гайхалтай үр дүн үзүүлж, Google-ийн “Attention is All You Need” (2017) paper-аас хойш AI-ийн түүхэнд эргэлт гаргасан. Энэхүү нийтлэлээр Transformer архитектур, блок болон attention-ий талаар өгүүлнэ. 1. Transformer архитектур Трансформерыг ялгаруулж чадсан нэг […]