NORMALISASI TEKS PADA CHATBOT SISTEM INFORMASI AKADEMIK MENGGUNAKAN ALGORITME DAMERAU– LEVENSHTEIN DISTANCE DAN PREFIX TREE (STUDI KASUS: UNIVERSITAS TEKNOKRAT INDONESIA) Text Normalization In Academic Information System Chatbot Using Damerau–Levenshtein Distance Algorithm And Prefix Tree (Case Study: Teknokrat University of Indonesia)

Yahya, Muhammad Thomas Fadhila (2019) NORMALISASI TEKS PADA CHATBOT SISTEM INFORMASI AKADEMIK MENGGUNAKAN ALGORITME DAMERAU– LEVENSHTEIN DISTANCE DAN PREFIX TREE (STUDI KASUS: UNIVERSITAS TEKNOKRAT INDONESIA) Text Normalization In Academic Information System Chatbot Using Damerau–Levenshtein Distance Algorithm And Prefix Tree (Case Study: Teknokrat University of Indonesia). Other thesis, Universitas Teknokrat Indonesia.

[img] Text
5. ABSTRAK.pdf

Download (141kB)
[img] Text
10. BAB I.pdf

Download (93kB)
[img] Text
15. DAFTAR PUSTAKA.pdf

Download (143kB)

Abstract

Penelitian ini dilakukan atas dasar permasalahan pada chatbot yang sulit memahami dan merespons pesan dengan tepat karena terdapat kesalahan pengetikan, tata bahasa dan penggunaan bahasa yang buruk dalam pesan pengguna. Oleh karena itu dibutuhkan sistem normalisasi teks yang dapat mengubah bentuk pesan pengguna ke dalam bentuk baku. Dengan sistem ini diharapkan dapat mengatasi permasalahan chatbot saat memahami dan merespons pesan. Sistem ini terdiri tujuh tahapan normalisasi yaitu normalisasi garis baru, normalisasi huruf kecil, normalisasi karakter berulang, normalisasi spasi, tokenisasi, normalisasi kata dasar, dan pengecekan ejaan. Pada tahap pengecekan ejaan, menggunakan algoritme Damerau–Levenshtein Distance untuk menghitung jarak string dan fungsi Perhitungan Kedekatan Huruf. Prefix Tree digunakan untuk mengubah data korpus ke dalam bentuk node. Berdasarkan hasil penelitian dan implementasi, diketahui bahwa menggunakan algoritme Damerau–Levenshtein Distance dan fungsi Perhitungan Kedekatan Huruf menghasilkan nilai mean average precision sebesar 0,86. Dan menggunakan Prefix Tree menghasilkan waktu proses sebesar 0.004 detik untuk kata dengan panjang mulai dari 3 karakter, bertambah 0.002 detik untuk setiap karakter. Untuk kata dengan panjang mulai dari 11 karakter, peningkatan waktu proses berubah menjadi 0.003 detik untuk setiap karakter.

Item Type: Thesis (Other)
Uncontrolled Keywords: Chatbot, Normalisasi, Damerau–Levenshtein Distance, Prefix Tree
Subjects: TEKNIK KOMPUTER (S1) > Algoritma dan Pemrograman
Divisions: Fakultas Teknik dan Ilmu Komputer > S1 Informatika
Depositing User: Asep Haikal Kurniawan S.IP., M.A
Date Deposited: 22 Apr 2020 08:38
Last Modified: 29 Apr 2020 02:54
URI: http://repository.teknokrat.ac.id/id/eprint/2212

Actions (login required)

View Item View Item