Өгөгдлийн өргөтгөл гэж юу вэ?
Өгөгдөл өргөтгөх нь одоо байгаа өгөгдлийг ашиглан өгөгдлийн багцын өөрчлөгдсөн хуулбарыг үүсгэх замаар сургалтын багцыг зохиомлоор өргөтгөх арга юм. Үүнд өгөгдлийн багцад бага зэргийн өөрчлөлт хийх эсвэл шинэ өгөгдлийн цэгүүдийг бий болгохын тулд гүн сургалтын аргыг ашиглана.
Өргөтгөсөн болон синтетик өгөгдөл
Өргөтгөсөн өгөгдлүүд нь анхны өгөгдлөөс бага зэрэг өөрчлөлт орсон. Зургийг томруулах тохиолдолд сургалтын багцын хэмжээ, олон янз байдлыг нэмэгдүүлэхийн тулд бид геометрийн болон өнгөт орон зайн хувиргалтыг (flipping, resizing, cropping, brightness, contrast) хийдэг.
Синтетик өгөгдөл нь анхны мэдээллийн багцыг ашиглахгүйгээр зохиомлоор үүсгэгддэг. Энэ нь ихэвчлэн синтетик өгөгдөл үүсгэхийн тулд DNN (Гүн мэдрэлийн сүлжээ) болон GAN (Generative Adversarial Networks) ашигладаг.
Тэмдэглэл: Томруулах арга нь зөвхөн зургаар хязгаарлагдахгүй. Та аудио, видео, текст болон бусад төрлийн өгөгдлийг өргөтгөх боломжтой.
Өгөгдлийг өргөтгөх аргыг ямар үед ашиглах вэ?
- Загваруудыг суралцахаас урьдчилан сэргийлэхийн тулд.
- Анхны сургалтын багц хэтэрхий бага үед.
- Загварын нарийвчлалыг сайжруулах.
- Түүхий мэдээллийн багцыг шошголох, цэвэрлэх үйл ажиллагааны зардлыг бууруулах зорилгоор.
Өгөгдлийг өргөтгөлийн хязгаарлалт
- Анхны өгөгдлийн багц дахь хазайлт нь өргөтгөсөн өгөгдөлд хэвээр байна.
- Өгөгдлийг өргөтгөх чанарын баталгаа нь үнэтэй байдаг.
- Дэвшилтэт хэрэглээ бүхий системийг бий болгохын тулд судалгаа, хөгжүүлэлт шаардлагатай. Жишээлбэл, GAN ашиглан өндөр нарийвчлалтай зураг үүсгэх нь хэцүү байж болно.
- Өгөгдлийг өргөтгөх үр дүнтэй аргыг олох нь хэцүү байж болно.
Өгөгдлийг өргөтгөх арга техник
- Noise injection: Загварын гүйцэтгэлийг сайжруулахын тулд аудио мэдээллийн багцад гауссын эсвэл санамсаргүй дуу чимээг нэмнэ.
- Shifting: Аудиог санамсаргүй секундээр зүүн (хурдан урагшлуулах) эсвэл баруун тийш шилжүүлэх.
- Хурдыг өөрчлөх: Цаг хугацааны цувааг тогтмол хурдаар сунгана.
- Дууны аяыг өөрчлөх: Дууны аяыг санамсаргүйгээр өөрчлөх.
Текст өгөгдлийг өргөтгөх
- Үг, өгүүлбэр холих: Үг, өгүүлбэрийн байрлалыг санамсаргүйгээр өөрчлөх.
- Үг солих: Үгсийг ижил утгатай үгээр солих.
- Синтакс-модны манипуляци: Ижил үг ашиглан өгүүлбэрийг өөрчил.
- Санамсаргүй үг оруулах: Үгийг санамсаргүй байдлаар оруулна.
- Санамсаргүй үг устгах: Үгийг санамсаргүй байдлаар устгана.
Зургийг өргөтгөх
- Геометрийн хувиргалт: Зургийг санамсаргүйгээр эргүүлэх, тайрах, сунгах, томруулах. Нэг зураг дээр олон хувиргалт хийхдээ болгоомжтой байх хэрэгтэй, учир нь энэ нь загварын гүйцэтгэлийг бууруулдаг.
- Өнгөний орон зайн хувиргалт: RGB өнгөний суваг, тодосгогч, тод байдлыг санамсаргүйгээр өөрчлөх.
- Kernel filter: Зургийн тод байдал эсвэл бүдэгрэлтийг санамсаргүйгээр өөрчлөх.
- Санамсаргүй устгах: Анхны зургийн зарим хэсгийг устгах.
- Зураг холих: Олон зургийг холих.
Дэвшилтэт техник
- Генератив өрсөлдөгчийн сүлжээ (GANs): Шинэ өгөгдлийн цэг эсвэл зураг үүсгэхэд ашигладаг. Синтетик өгөгдөл үүсгэхийн тулд одоо байгаа өгөгдлийг шаарддаггүй.
- Мэдрэлийн хэв маягийн дамжуулалт: Pургийг задлах, контекст, хэв маягийг салгахад сургагдсан хэд хэдэн эвдрэлийн давхаргууд.
Өгөгдлийн өргөтгөлийн хэрэглээ
Чанартай өгөгдөл олж авахад бэрхшээлтэй байгаа бүх машин сургалтын хэрэглээнд өгөгдөл өргөтгөхболомжтой. Цаашилбал, энэ нь судалгааны бүх салбарт загварын бат бөх байдал, гүйцэтгэлийг сайжруулахад тусална.
Өөрөө жолооддог машинууд
Өөрийгөө жолооддог автомашины талаарх мэдээлэл хязгаарлагдмал байгаа бөгөөд компаниуд бататгах сургалтыг ашиглан синтетик өгөгдөл үүсгэхийн тулд загварчилсан орчинг ашиглаж байна. Энэ нь өгөгдлийн аюулгүй байдлын асуудалтай байгаа машин сургалтын програмуудыг сургах, туршихад тань туслах болно.
Зураг: David Silver
Эх хэлний боловсруулалт
Текст өгөгдлийн өсөлтийг ерөнхийдөө хязгаарлагдмал чанарын өгөгдөлтэй нөхцөлд ашигладаг бөгөөд гүйцэтгэлийн хэмжүүрийг сайжруулах нь нэн тэргүүнд тавигддаг. Та синонимыг нэмэгдүүлэх, үг оруулах, тэмдэгт солих, санамсаргүй оруулах, устгах зэргийг ашиглаж болно. Эдгээр аргууд нь нөөц багатай хэлнүүдэд бас үнэ цэнэтэй юм.
Зураг: Paper with Code
Судлаачид алдааг таних өндөр хувилбарууд, дарааллаас дараалалд өгөгдөл үүсгэх, текстийн ангилалд хэлний загварт зориулж текст өргөтгөх аргыг ашигладаг.
Автомат яриа таних
Дууны ангилал болон яриа танихад өгөгдлийг өргөтгөх нь гайхамшгийг бүтээдэг. Энэ нь бага нөөцтэй хэл дээр ч загварын гүйцэтгэлийг сайжруулдаг.
Зураг: Edward Ma
Дуу чимээг санамсаргүй шахах, шилжүүлэх, дууны түвшинг өөрчлөх нь ярианаас текст рүү хамгийн сүүлийн үеийн загвар гаргахад тусална. Та мөн GAN-г ашиглан тухайн програмын хувьд бодит дуу авиа гаргах боломжтой.
Дүгнэлт
Ихэнх тохиолдолд өгөгдлийг өргөтгөх нь загварын нарийвчлалыг сайжруулдаг. Энэ нь загварын хэт тохируулгыг багасгаж, үл үзэгдэх өгөгдлийн багцын нарийвчлалыг нэмэгдүүлдэг.
Өгөгдлийг өргөтгөхийн гол сул тал нь өгөгдлийн хазайлтаас үүдэлтэй. Хэрэв анхны өгөгдөл нь хазайлттай байвал өргөтгөсөн өгөгдөл нь мөн хэвийсэн утгатай байх бөгөөд энэ нь оновчгүй дүнд хүргэх болно.