
ASR(Automatic Speech Recognition) vs Voice recognition

Н.Чигцалмаа
Багш


Н.Чигцалмаа
Багш
ASR(Automatic Speech Recognition)
ASR(Automatic Speech Recognition) буюу яриа таних технологи нь хүний хэлсэн үгийг таньж, түүнийг бичвэр (text) эсвэл заавар (command) болгон хөрвүүлэх технологи юм. Өөрөөр хэлбэл, энэ систем нь хэрэглэгч юу хэлж байгаад гол анхаарлаа хандуулдаг. Яриа таних систем нь хэлний бүтэц, үгсийн сан, өгүүлбэрийн загвар зэрэг хэл шинжлэлийн өгөгдөлд тулгуурлан ярианы агуулгыг таньж боловсруулдаг.
Энэхүү технологийн жишээнд ухаалаг гар утасны дуу хоолойгоор шивэх систем, виртуал туслахууд (жишээлбэл: Siri, Google Assistant), мөн автомат дуудлагын төвийн (IVR) системүүд орно. Эдгээр систем нь хэрэглэгчийн хэлсэн үгийг таньж, текст болгон хувиргах эсвэл тодорхой үйлдэл гүйцэтгэх боломжийг олгодог.

Voice recognition
Voice Recognition буюу дуу хоолой таних технологи нь хүний дуу хоолойн онцлог шинжүүд (жишээлбэл: дууны өнгө, давтамж, яригчийн аялга гэх мэт)-ийг ашиглан тухайн хүнийг таних технологи юм. Энэ технологи нь хэн ярьж байгааг тодорхойлоход чиглэдэг. Өөрөөр хэлбэл, voice recognition систем нь дууны биометрийн онцлог шинжүүдийг шинжилж, тухайн яригчийг тодорхойлох зорилготой ажилладаг.
Энэхүү технологийн хэрэглээний жишээнд дуу хоолойгоор төхөөрөмжийн түгжээг тайлах, банкны үйлчилгээнд дуу хоолойгоор баталгаажуулалт хийх, мөн ухаалаг төхөөрөмжүүд хэрэглэгчийг таних функцууд багтдаг.

Дүгнэлт
Speech recognition технологи нь хүний хэлж буй үгийг ойлгоход чиглэдэг бол voice recognition технологи нь яригчийг дуу хоолойн онцлог шинжээр нь танихад чиглэдэг. Иймээс эдгээр технологиудыг зөв хослуулснаар хүн ба төхөөрөмж (компьютер)-ийн харилцааг илүү хялбар, үр ашигтай болгох боломж бүрддэг.