Introduction
1. Seq2Seq
2. Encoder
3. Decoder
4.Reference
Seq2Seq
Encoder-Decoder загвар нь дараалалаас дарааллыг урьдчилан таамаглах асуудалд давтагдах мэдрэлийн сүлжээг ашиглах арга юм.
Хэргэлээ:
•Чатботууд
•Машины орчуулга
•Текстийн хураангуй
•Зургийн тайлбар
![](https://tee.education/wp-content/uploads/2023/11/image-1024x737.png)
Энэ нь encoder, завсрын вектор, decoder гэсэн 3 хэсгээс бүрдэнэ.
•Encoder
•Завсрын вектор
•Декодер
![](https://tee.education/wp-content/uploads/2023/11/image-1-1024x679.png)
![](https://tee.education/wp-content/uploads/2023/11/image-2-1024x273.png)
Encoder
Загварын encoder хэсгийг ойлгох нь.
•Encoder нь LSTM/GRU элемэнттэй.
•Encoder нь оролтын дарааллын мэдээллийг hidden state вектор болгоно.
•Encoder зөвхөн hidden state ашиглана.
![](https://tee.education/wp-content/uploads/2023/11/image-3-1024x441.png)
Internal state
h0, c0 – нь LSTM/GRU – тэй давхаргын тоотой ижил .
Эцсийн hi,ci нь оролтын бүх дарааллын гол зангилаа агуулж байна.
Жишээ нь:
X0 = ‘India ’
X1 = ‘India is’
X2 = ‘India is beautiful’
![](https://tee.education/wp-content/uploads/2023/11/image-4-1024x450.png)
Decoder
Декодер – ын оролтын эхэнд START, төгсгөлд END нэмнэ.
(h0, c0) нь START – тай хамт Decoder дахвхаргад орсноор үгээ тааж эхэлнэ. Ямар үг вэ гэдгийг (ht, ct) зааж өгнө:
![](https://tee.education/wp-content/uploads/2023/11/image-5-1024x572.png)
•Эхлээд бид START_-г оруулснаар декодер дараагийн үгийг үүсгэж END-г урьдчилан таамаглаж сургадаг.
•Энд бид Teacher Forcing арга техникийг ашигладаг.
•Decoder(ht, ct) – үүд хэрэггүй.
![](https://tee.education/wp-content/uploads/2023/11/image-6-1024x668.png)
![](https://tee.education/wp-content/uploads/2023/11/image-7-1024x451.png)
![](https://tee.education/wp-content/uploads/2023/11/image-8-1024x451.png)
![](https://tee.education/wp-content/uploads/2023/11/image-9-1024x454.png)