KLASIFIKASI AUDIO UCAPAN EMOSIONAL MENGGUNAKAN MODEL LSTM

Penulis

  • Raynaldy Arief Universitas Hasanuddin
  • Nur Aviva Iriawan Universitas Hasanuddin
  • Armin Lawi Universitas Hasanuddin

Abstrak

Emosi adalah elemen penting dalam sintesis ucapan ekspresif manusia. Emosi ada bermacam macam, seperti sedih, marah, bahagia, dan bentuk emosi lainnya. Tujuan dari penelitian ini adalah membantu tenaga psikologi dengan menyajikan rekomendasi klasifikasi otomatis untuk ucapan emosional seseorang berdasarkan suara. Oleh karena itu, pada penelitian kali ini menggunakan dataset Toronto Emotional Speech (TESS) dengan jumlah data 2.800 serta jumlah kelas emosional sebanyak 7 dengan masing masing kelas memiliki banyak data sebanyak 400, akan dilakukan klasifikasi ucapan emosional seseorang. Makalah ini menggunakan metode Long Short-Term Memory (LSTM) dengan pembagian data latihan 70% dan data pengujian 30% dari total jumlah data. Dengan jumlah epoch 100 dan batch size 64 menghasilkan tingkat akurasi train 98,47% dan akurasi test 97,02% (best-fitting) serta ROC 99,9%. Kata kunci — Deep Learning, Klassifikasi, Long Short-Term Memory (LSTM), Toronto Emotional Speech Set (TESS), Ucapan Emosional.

Unduhan

Diterbitkan

2021-08-13

Cara Mengutip

Arief, R. ., Iriawan, N. A. ., & Lawi, A. . (2021). KLASIFIKASI AUDIO UCAPAN EMOSIONAL MENGGUNAKAN MODEL LSTM. Proceeding KONIK (Konferensi Nasional Ilmu Komputer), 5(1), 524–529. Diambil dari https://prosiding.konik.id/index.php/konik/article/view/114

Artikel paling banyak dibaca berdasarkan penulis yang sama