Deep Learning dalam baru-baru ini membuat kemajuan menggunakan terobosan baru dalam hal pengenalan ucapan dan pengenalan gambar ataupun video. Dengan munculnya era data besar atau yang sering disebut dengan big data, convolutional neural network memiliki lapisan yang tersembunyi dan arsitektur yang lebih kompleks, serta memiliki kemampuan pembelajaran fitur dan representasi yang lebih canggih. Sejak algoritma pembelajaran mendalam. Deep Learning diusulkan, convolutional neural network sudah mencapai kinerja yang sangat baik dalam banyak tugas mengenai pengenalan skala besar dalam visi komputer. Algoritma tersebut mewakili Deep neural network, yaitu jaringan neural dengan banyak lapisan tersembunyi. Convolutional neural network merupakan algoritma pembelajaran Deep learning yang dapat melatih kumpulan data besar dengan jutaan parameter dan mengambil bentuk gambar 2D untuk masukannya, dan menggabungkannya dengan filter untuk menghasilkan keluaran yang diinginkan
Di dalam bidang deep learning, Convolutional neural network atau yang sering disingkat dengan CNN merupakan bagian dari deep neural network, yaitu jenis jaringan saraf tiruan yang umumnya digunakan dalam pengenalan dan pemrosesan gambar. Algoritma ini dirancang khusus untuk pemrosesan data pixel dan citra visual. Algoritma Convolutional Neural Network yang memiliki neural yang didesain untuk bekerja selayaknya lobus frontal, khususnya area visual cortex pada otak manusia dan hewan. visual cortex merupakan area yang bertanggung jawab untuk memproses dalam bentuk rangsangan visual. Dalam hal ini yang membuat CNN cukup efektif untuk digunakan dalam pemrosesan gambar dibandingkan dengan algoritma neural network yang sejenis. Kata convolutional dalam CNN merupakan sebuah operasi matematika pada dua buah fungsi yang kemudian menghasilkan fungsi ketiga. Fungsi tersebut menggabungkan 2 buah himpunan informasi dan menunjukan bagaimana bentuk satu fungsi dimodifikasi oleh fungsi lainnya. Pada CNN ini menggunakan convolutional sebagai pengganti perkalian matriks umum. Operasi ini digunakan setidaknya pada satu lapisannya. Neural Network pada umumnya dapat mengubah input dengan meletakkannya melalui rangkaian hidden layer. Di setiap layer terdiri dari sekumpulan neuron, dimana pada setiap later terhubung secara penuh secara penuh dengan semua neuron di setiap layer sebelumnya. Dan yang terakhir, lapisan yang sudah terhubung sepenuhnya digunakan untuk mewakili prediksi. Tidak seperti neural network pada biasanya, lapisan pada algoritma CNN memiliki neuron yang diatur dalam 3 dimensi : width, height, dan depth. Pada dimensi depth mengacu pada dimensi ketiga dari fungsi aktivasi, bukan kedalaman neural network ataupun jumlah total layer dalam jaringan. Neuron-neuron di dalam satu layer terhubung ke semua neuron di layer berikutnya, tetapi hanya ke sebagian kecil saja. Dan terakhir, hasil akhir akan direduksi menjadi satu vektor skor probabilitas, yang diatur sepanjang dimensi depth.
Dalam convolutional neural network, konvolusi merupakan operasi linear yang melibatkan penggandaan sekumpulan bobot dengan menggunakan masukan, seperti jaringan saraf tradisional. Dengan asumsi bahwa teknik tersebut dirancang untuk memasukan dua dimensi, perkalian dilakukan antara larik data masukan dan larik bobot dua dimensi. Filter lebih kecil dari data masukan, dan jenis perkalian yang diterapkan antara filter dan patch dari data masukan, dan terhadap jenis perkalian yang diterapkan antara filter dan patch warna masukan dari ukuran filter merupakan perkalian titik. Produk titik merupakan perkalian input dan patch berukuran filter dan elemen diantara filter, lalu jumlahnya pun selalu berupa nilai.
Sebelum menerapkan jaringan syaraf tradisional ke suatu gambar, perlu dilakukan pemrosesan awal dan melalui serangkaian lapisan yang muncul di awal jaringan saraf untuk mengurangi menjadi masukan yang lebih kecil. Lapisan yang paling penting dalam lapisan ini adalah lapisan konvolusional. Sama seperti namanya, lapisan konvolusional ini terdiri dari blok bangunan dasar yang disebut dengan konvolusi.
Output dari dua dimensi tunggal dari kernel tersebut peta fungsi ataupun peta aktivasi. Setelah menerapkan setiap lapisan konvolusional, fungsi aktivasi diterapkan ke dalam keluaran tiga dimensi. Pada umumnya, fungsi dari aktivasi yang diterapkan disebut ULT atau Rectified Linear Unit Layer. Untuk Saat ini, itu merupakan fungsi yang banyak digunakan yang dirancang untuk mensimulasikan kemampuan neuron biologis untuk diaktifkan maupun tidak.
Convolutional network mampu menyertakan lapisan koneksi lokal maupun global untuk menyederhanakan perhitungan dasar. Pada lapisan komposit mengurangi dimensi data dengan menggabungkan keluaran dari gabungan neuron dalam satu lapisan menjadi satu neuron pada lapisan berikutnya. Selain itu, terdapat jenis lapisan lain yang disebut dengan max pooling (down sampling layer). Lapisan konvolusional tidak mengurangi ukuran gambar secara signifikan. Sebaliknya, lapisan konvolusional memastikan bahwa setiap pixel mencerminkan tetangganya. Dapat mengurangi skala melalui konsolidasi tanpa kehilangan informasi yang penting. Metode yang umum untuk melakukan ini melibatkan penggabungan maximal, dengan kata lain, dalam menggunakan nilai maximum sekelompok neuron pada lapisan sebelumnya. Padahal, pooling layer maximal memiliki ukuran dan lebar. Berbeda dengan lapisan konvolusional, lapisan ini ditetapkan pada irisan kedalam gambar dua dimensi, sehingga gambar yang dihasilkan memiliki kedalaman yang sama tetapi lebar dan tinggi lebih kecil.
Jaringan neural yang terhubung sepenuhnya terdiri dengan serangkaian lapisan yang terhubung sepenuhnya. Pada setiap ukuran keluaran bergantung dengan masing-masing ukuran masukan.
Padding merupakan istilah yang terkait dengan convolutional neural network dikarenakan mengacu kepada sejumlah pixel yang ditambahkan ke gambar saat kernel CNN memprosesnya. Misalnya, jika pada padding di CNN disetel ke nol, maka nilai pada setiap pixel yang ditambahkan adalah nol. Tetapi jika padding nol disetel ke 1, maka pixel yang ditambahkan ke gambar dengan nilai pixel nol akan dibatasi. Padding bekerja dengan memperluas area tempat Deep neural network untuk memproses gambar. Kernel merupakan filter jaringan saraf yang dapat dipindahkan ke dalam gambar. Memindai pixel dan mengubah data menjadi format yang lebih kecil atau pun terkadang lebih besar. Untuk membantu kernel dapat memproses citra, sebuah bantalan akan ditambahkan ke dalam bingkai citra untuk memberikan lebih banyak ruang bagi kernel untuk menutupi citra. Menambahkan padding pada citra yang akan diproses oleh CNN dapat melakukan analisis dengan lebih akurat.
Kesempatan lowongan magang terbaru di tahun 2025
Baca Selengkapnya..