Week 6

$$\gdef \sam #1 {\mathrm{softargmax}(#1)}$$ $$\gdef \vect #1 {\boldsymbol{#1}} $$ $$\gdef \matr #1 {\boldsymbol{#1}} $$ $$\gdef \E {\mathbb{E}} $$ $$\gdef \V {\mathbb{V}} $$ $$\gdef \R {\mathbb{R}} $$ $$\gdef \N {\mathbb{N}} $$ $$\gdef \relu #1 {\texttt{ReLU}(#1)} $$ $$\gdef \D {\,\mathrm{d}} $$ $$\gdef \deriv #1 #2 {\frac{\D #1}{\D #2}}$$ $$\gdef \pd #1 #2 {\frac{\partial #1}{\partial #2}}$$ $$\gdef \set #1 {\left\lbrace #1 \right\rbrace} $$ % My colours $$\gdef \aqua #1 {\textcolor{8dd3c7}{#1}} $$ $$\gdef \yellow #1 {\textcolor{ffffb3}{#1}} $$ $$\gdef \lavender #1 {\textcolor{bebada}{#1}} $$ $$\gdef \red #1 {\textcolor{fb8072}{#1}} $$ $$\gdef \blue #1 {\textcolor{80b1d3}{#1}} $$ $$\gdef \orange #1 {\textcolor{fdb462}{#1}} $$ $$\gdef \green #1 {\textcolor{b3de69}{#1}} $$ $$\gdef \pink #1 {\textcolor{fccde5}{#1}} $$ $$\gdef \vgrey #1 {\textcolor{d9d9d9}{#1}} $$ $$\gdef \violet #1 {\textcolor{bc80bd}{#1}} $$ $$\gdef \unka #1 {\textcolor{ccebc5}{#1}} $$ $$\gdef \unkb #1 {\textcolor{ffed6f}{#1}} $$ % Vectors $$\gdef \vx {\pink{\vect{x }}} $$ $$\gdef \vy {\blue{\vect{y }}} $$ $$\gdef \vb {\vect{b}} $$ $$\gdef \vz {\orange{\vect{z }}} $$ $$\gdef \vtheta {\vect{\theta }} $$ $$\gdef \vh {\green{\vect{h }}} $$ $$\gdef \vq {\aqua{\vect{q }}} $$ $$\gdef \vk {\yellow{\vect{k }}} $$ $$\gdef \vv {\green{\vect{v }}} $$ $$\gdef \vytilde {\violet{\tilde{\vect{y}}}} $$ $$\gdef \vyhat {\red{\hat{\vect{y}}}} $$ $$\gdef \vycheck {\blue{\check{\vect{y}}}} $$ $$\gdef \vzcheck {\blue{\check{\vect{z}}}} $$ $$\gdef \vztilde {\green{\tilde{\vect{z}}}} $$ $$\gdef \vmu {\green{\vect{\mu}}} $$ $$\gdef \vu {\orange{\vect{u}}} $$ % Matrices $$\gdef \mW {\matr{W}} $$ $$\gdef \mA {\matr{A}} $$ $$\gdef \mX {\pink{\matr{X}}} $$ $$\gdef \mY {\blue{\matr{Y}}} $$ $$\gdef \mQ {\aqua{\matr{Q }}} $$ $$\gdef \mK {\yellow{\matr{K }}} $$ $$\gdef \mV {\lavender{\matr{V }}} $$ $$\gdef \mH {\green{\matr{H }}} $$ % Coloured math $$\gdef \cx {\pink{x}} $$ $$\gdef \ctheta {\orange{\theta}} $$ $$\gdef \cz {\orange{z}} $$ $$\gdef \Enc {\lavender{\text{Enc}}} $$ $$\gdef \Dec {\aqua{\text{Dec}}}$$

Ders Bölümü A

Evrişimli sinir ağlarının (Convolutional Neural Network, CNN) üç uygulamasını inceledik. Sayı tanıma ve beş haneli posta kodlarını tanıma uygulamasıyla başladık. Nesne saptamada, yüz tanımada çok ölçekli mimarinin nasıl kullanılacağı hakkında konuştuk. Son olarak, evrişimli ağların anlamsal bölütlemede nasıl kullanıldığını robotik görü sistemleri ve şehir ortamında nesne bölütlemesinden somut örneklerle gördük.

Ders Bölümü B

Yinelemeli sinir ağlarını (Recurrent Neural Network, RNN), onların problemlerini ve bu sorunları çözmede sıklıkla kullanılan yöntemleri inceledik. Sonrasında RNN modellerinin sorunlarını çözmek için kullanılan, Dikkat, GRU (Gated Recurrent Unit, Kapılı Yinelemeli Birim), LSTM (Long Short-Term Memory, Uzun Ömürlü Kısa-Dönem Belleği) ve Diziden Diziye (Sequence-to-Sequence, seq2seq) gibi çeşitli yöntemleri inceledik.

Uygulama

Düz RNN ve LSTM modellerinin mimarilerini tartıştık ve ikisinin performanslarını karşılaştırdık. LSTM RNN’in avantajlarını miras alırken, uzun süre boyunca bilgiyi saklayabilmek için bir ‘bellek hücresi’ kullanarak zayıflıklarını iyileştirir. LSTM modelleri RNN modellerine göre önemli ölçüde daha iyi performans gösterir.



İrem Demirtaş