

Та YouTube-ийг нээгээд “Юу үзэх вэ?” гэж бодож амжаагүй байтал яг таны хайж байсан контент, эсвэл бүр таны сонирхлыг татах "туулайн нүх" (rabbit hole) гарч ирдэг үү? Энэ бол зүгээр нэг энгийн IF/ELSE нөхцөлт код биш, дэлхийн хамгийн супер масс-дата дээр ажилладаг Зөвлөмжийн Систем (Recommendation Engine) юм.
YouTube-ийн алгоритм таны үзсэн түүх, товшилт (clicks), хугацаа зэрэг терабайт, петабайтаар хэмжигдэх түүхий өгөгдлийг (raw data) боловсруулж, секунд тутамд танд зориулсан Real-time таамаглалыг дэвшүүлж байдаг. Тэгвэл энэ "монстр" яг яаж ажилладаг вэ?

Google-ийн инженерүүдийн гаргасан алдартай судалгааны бүтээлүүдийг үзвэл, YouTube-ийн зөвлөмжийн систем нь үндсэн хоёр том нейрон сүлжээний (Neural Network) үе шатаас бүрддэг.
YouTube дээр минут тутамд 500 гаруй цагийн бичлэг шинээр ордог. Энэхүү асар их сангаас алгоритм таны Үзсэн түүх (Watch History) болон Хайлтын контекст (Search Tokens)-ийг ашиглан сая сая бичлэгүүдийг шүүж, танд тохирох магадлалтай хэдэн зуун "нэр дэвшигч" бичлэгүүдийг (Candidates) гаргаж ирдэг.
Энд Collaborative Filtering буюу "Тантай ижил сонирхолтой хэрэглэгчид өөр юу үзсэн бэ?" гэдэг матриц болон хэрэглэгчийн зан төлөвийн вектор (User Embeddings) өгөгдлийг ашигладаг.
Шүүж үлдсэн хэдэн зуун видеог шууд таны нүүр хуудсанд харуулж болохгүй. Энд хоёр дахь нейрон сүлжээ ажиллаж, видео бүрд "Оноо" (Score) өгдөг. Энэ шатанд зөвхөн сэдэв биш, маш нарийн фичэрүүдийг (features) тооцно:
Бичлэг хэзээ тавигдсан бэ? (Freshness)
Таны төхөөрөмж, байршил, цагийн бүс юу вэ?
Таны өмнөх идэвх хэр байсан бэ?
Хамгийн өндөр оноо авсан видеонууд таны нүүр хуудасны эхэнд жагсдаг.
YouTube "таамагладаггүй", харин таны үлдээсэн дижитал мөрүүдийг (Signals) математик аргаар боловсруулдаг. Түүний хамгийн чухал гэж үздэг үзүүлэлтүүд:
Watch Time vs. Audience Retention: Та бичлэгийг товшсон уу гэдэг чухал биш (Clickbait-ээс сэргийлж). Харин хэдэн хувийг нь үзсэн бэ гэдэг нь гол үзүүлэлт. Хэрэв та "Роботын тухай" 15 минутын бичлэгийг 12 минут үзвэл, алгоритм таныг High-engagement Technology Enthusiast гэж тэмдэглэнэ.
Implicit Feedback (Шууд бус хариу үйлдэл): Хэрэглэгчийн Лайк/Дизлайк, Сэтгэгдэл зэрэг нь тодорхой (Explicit) дохио мэт боловч, алгоритм таны "Скролл хийгээд алгассан видео", "Дөнгөж эхлүүлээд хаасан бичлэг", "Нэг үзсэн бичлэгээ дахин үзсэн үйлдэл (Retention)" зэрэг далд дохионуудыг илүүд үздэг.
Semantic Search & Co-visitation: Таны хайсан үгсийн утга зүйн холбоо хамаарал болон бусад хүмүүс тухайн бичлэгийн дараа ямар бичлэг рүү шилжсэнийг (Co-visitation) граф датабэйс хэлбэрээр тооцдог.
Технологийн хувьд YouTube-ийн инженерүүдийн шийддэг хамгийн сонирхолтой асуудал бол Exploration (Хайгуул хийх) болон Exploitation (Ашиглах)-ийн тэнцвэр юм.
YouTube-ийн санал болгох систем бол хүн төрөлхтний бүтээсэн хамгийн нарийн төвөгтэй Distributed Real-time системүүдийн нэг юм. Тэр таны дараагийн үйлдлийг математик магадлалын онолоор аль хэдийн тооцоолчихсон суудаг.
Хэрэв та өөрийн нүүр хуудсыг "цэвэрлэхийг" эсвэл алгоритмоо шинээр форматлахыг хүсвэл өөрийн Watch History-оосоо зарим дата-цэгүүдийг (Data points) устгах эсвэл Incognito горим ашиглан алгоритмын түүхий өгөгдөл цуглуулах урсгалыг хаах боломжтой.