fbpx

Хэрвээ танд жижиг цар хүрээний өгөгдөл байгаад түүнийгээ ашиглан модель хөгжүүлмээр байгаа бол энэхүү нийтлэлийг маань дуустал уншаарай.

Fine-Tuning гэж юу вэ?

Fine-tuning нь машин сургалт, гүн сургалтын салбарт өргөн хэрэглэгддэг бөгөөд энэ нь моделийн гүйцэтгэлийг сайжруулах чухал арга юм. Fine-tuning гэдэг нь өмнө нь аль хэдийн сургагдсан моделийг ашиглан өөрийн өгөгдлийг нэмэн дахин өөрчилж сургахыг хэлнэ. Энэхүү процессыг ойлгохын тулд эхлээд transfer learning гэх ухагдахууныг ойлгох шаардлагатай. Transfer Learning  гэдэг нь ямар нэгэн тодорхой даалгавар гүйцэтгэхээр зориулагдсан модель өөр төстэй даалгаврыг гүйцэтгэхээр зорилгоо солих процесс юм. Fine-tuning нь шинэ өгөгдөлд дасан зохицох зорилготой transfer learning-ийн нэгэн төрөл юм.

Fine-tuning vs training

Training нь моделийг эхнээс нь сургаж, бүх параметрүүдийг шинэ өгөгдөл дээр сургах процессыг хэлэх ба энэ нь их хэмжээний өгөгдөл, цаг хугацаа, тооцооллын нөөц шаарддаг ба  цоо шинэ загвар боловсруулах, шинэ асуудлыг шийдвэрлэх зорилготой байдаг. Fine-tuning нь голчлон бэлэн гүн сургалтын загварууд дээр хийгддэг бөгөөд тодорхой салбар эсвэл хэрэглээнд тааруулахад ашиглагддаг.

Fine-tuning хэрхэн ажилладаг вэ?

Fine-tuning сургагдсан моделийн жингүүдийг эхлэх цэг болгон авч түүн дээрээ жижиг хэмжээний өгөгдөл дээр тулгуурлан сургалт хийдэг. Энэхүү арга нь  ихэвчлэн хяналттай сургалтад хамаарагддаг ч бусад төрлүүдийг ч мөн хамрах боломжтой.

Fine-tuning алхамууд:

  1. Өмнө нь сургасан загварыг ачаалах:
    • Том хэмжээний ерөнхий өгөгдлөөр сургасан загварыг ашиглана. Жишээ нь, дүрсний хувьд ImageNet, текстийн хувьд BERT зэрэг байж болно.
  2. Загварын тохиргоо хийх :
    • Загварын сүүлийн давхаргыг шинэ даалгаварт тохируулан өөрчлөх буюу шинэ ангиллын дагуу тохируулах боломжтой.
  3. Анхны давхаргуудыг царцаах:
    • Загварын доод давхаргууд ерөнхий шинж чанаруудыг хадгалдаг тул тэдгээрийг царцааж, зөвхөн дээд давхаргуудыг шинэ өгөгдлөөр сургах боломжтой.
  4. Шинэ өгөгдлөөр сургалт хийх:
    • Бага хэмжээний шинэ өгөгдлөөр сургалт хийн, загварыг тухайн даалгаварт тохируулна.
  5. Үнэлгээ хийх, оновчлох:
    • Загварыг баталгаажуулах өгөгдлөөр шалгаж, гүйцэтгэлийг сайжруулахын тулд тохиргоог оновчлон өөрчилнө.

Fine-Tuning-ийн давуу талууд

  • Хурдан суралцах: Модел эхнээс нь сургах шаардлагагүй тул цаг хугацаа ихээр хэмнэнэ.
  • Өндөр чанартай үр дүн: Загварын өмнөх мэдлэгийг ашиглан илүү нарийвчлалтай үр дүн гаргана.
  • Токен хэмнэлт: Богино асуултаар тодорхой үр дүн гаргах боломжтой.
  • Бага нөөц: Суурь загвартай харьцуулахад бага хүчин чадалаар зорилтот үр дүнд хүрэх боломтой.

Fine-Tuning-ийн жишээ

GitHub Copilot

ХОУ суурилсан код нөхөж бичих, санал болгох зориулалттай бөгөөд OpenAI компаны Codex моделыг ашигладаг бөгөөд энэхүү моделыг GPT-3 моделыг програмчлалын өгөгдөл дээр fine-tuning хийсэн.

Duolingo Max

Алдарт Duolingo хэл сурах аппликейшн нь Duolingo Max гэх төлбөрт үйлчилгээндээ GPT-4-ийг fine-Tune ашиглан хэл сургалтын чиглэлээр нарийвчлан сургасан байдаг. Энэхүү үйлчилгээ нь хэрэглэгчдийн алдааг тайлбарлах болон янз бүрийн хэл дээр ярилцлага хийх AI үйлчилгээ үзүүлж байна.

Дүгнэлт

Инженерүүдийн дунд алдартай ” Don’t reinvent the wheel” гэх хэллэг байдаг шүү дээ. Яг үүнтэй адилаар өнөөдрийн зах зээлд бэлэн байгаа хэлний болон бусад чиглэлийн моделиудыг ашиглах нь хамгийн оновчтой бөгөөд үр ашигтай гэж бодож байна. Fine Tuning арга аль хэдийн эрчээ авч олон байгууллагууд энэхүү аргыг ашиглан өөрийн бизнесийн үнэ цэнэ, үр бүтээмжийг нэмэгдүүлж байгааг олж харлаа.

Fine-Tuning талаар доорх бичлэгээс илүү ихийг олж мэдээрэй.

Эх сурвалжууд 

https://www.ibm.com/think/topics/fine-tuning

https://platform.openai.com/docs/guides/fine-tuning

https://docs.aws.amazon.com/sagemaker/latest/dg/jumpstart-fine-tune.html

нийтлэл бичсэн : М.Өлзийхишиг

Leave a Reply