TI

Natural Language Processing, Pengertian dan Tekniknya

√ Edu Passed Pass education quality & scientific checked by advisor, read our quality control guidelance for more info

Seiring dengan majunya perkembangan teknologi, berbagai industri di seluruh dunia mengandalkan kecerdasan buatan atau sering disebut Artificial Intelligence (AI).

Teknologi berupa kecerdasan buatan ini bisa membantu organisasi atau perusahaan mengoptimalkan dan mengefisiensi proses bisnisnya.

Dampak positif dari adanya teknologi ini adalah memberikan keuntungan bagi berbagai macam industri.

Dalam lingkup perkembangan teknologi berupa Artificial Intelligence atau AI ada sebuah disiplin ilmu yang dinamakan Natural Language Processing atau NLP. Apa itu Natural Language Processing? Simak penjelasannya dibawah ini.

Apa Itu Natural Language Processing

Natural Language Processing atau disingkat NLP adalah turunan dari lingkup Artificial Intelligence yang menjelaskan interaksi antara manusia dan mesin menggunakan bahasa natural atau alami.

Bahasa natural yang dimaksudkan adalah bahasa yang mendeskripsikan aktivitas atau kata-kata yang sehari-hari dipakai oleh manusia.

Misalnya bisa dicontohkan dengan saat ada seseorang yang menelpon untuk menjelaskan lokasi sebuah pohon tumbang yang tersambar petir, maka seseorang akan menjelaskan lokasinya dengan bahasa yang gampang untuk dimengerti.

Jawaban yang muncul adalah misalnya “Pohon yang tumbang tersambar petir itu dekat dengan rumah sakit dan berada di seberang lampu merah”

Lokasi yang dijelaskan merupakan bahasa yang mudah dipahami oleh lawan bicara.

Sama dengan Natural Language Processing (NLP) yang menggunakan data yang sifatnya terstruktur yaitu data teks.

Seperti layaknya data teks pada umumnya NLP juga memiliki ukuran dan isi yang sangat random dan beragam sehingga sangat berbeda jika dibandingkan dengan data tabular biasa.

Berdasarkan apa yang didefinisikan oleh seorang ahli teknologi, NLP merupakan teknologi yang berhubungan dengan interaksi antara komputer dan manusia.

Natural Language Processing bisa digunakan untuk mengukur sentimen, memproses, kemudian menentukan bagian mana dari bahasa manusia yang memiliki arti penting.

Pendekatan Natural Language Processing

Natural Language Processing atau NLP memiliki beberapa pendekatan yang digunakan agar komputer bisa mengerti bahasa manusia, berikut adalah beberapa pendekatan NLP.

  • Pendekatan simbolik

Pendekatan simbolik adalah sebuah pendekatan Natural Language Processing yang didasarkan pada aturan-aturan yang dikembangkan oleh manusia.

Pada dasarnya pendekatan simbolik ini bisa dilihat ketika sistem menerima aturan bicara dalam bahasa tertentu, kemudian akan menghasilkan output setelah sebelumnya direkam oleh pakar bahasa untuk diikuti.

  • Pendekatan statistik

Pendekatan statistik adalah pendekatan Natural Language Processing yang didasarkan pada contoh-contoh algoritma linguistik yang dipahami secara berulang-ulang.

Sistem akan mengenali bahasa tersebut melalui analisis yang sistematis dan matematis.

Sesudah menghasilkan indentifikasi tren yang di proses dalam sampel teks yang besar, sistem dalam komputer akan mencari bahasanya kemudian dipakai sebagai analisa input bahasa yang digunakan.

  • Pendekatan koneksi

Pendekatan koneksi adalah pendekatan Natural Language Processing yang menggabungkan pendekatan simbolik dan statistik.

Pendekatan ini diawali dengan penggunaan aturan bahasa secara umum, kemudian meyesuaikannya dengan aplikasi khusus dari hasil pendekatan statistik.

Teknik Natural Language Processing

Ada beberapa teknik Natural Language Processing (NLP), berikut adalah penjelasannya.

  • Stemming

Stemming adalah proses pemangkasan akhiran atau awalan kata yang dibentuk kedalam suku kata utuhnya dengan tujuan menghilangkan imbuhan.

Contoh dari stemming adalah awalan kata “bi” pada kata “Bicycle” atau imbuhan “er” pada kata “lighter”.

  • Lemmatization

Lemmatization adalah proses pemangkasan berbagai bentuk kata yang diubah ke dalam satu bentuk kata yang bisa mempermudah analisis.

Contohnya pada beberapa kata berikut ini, “sing’ dan “sang” adalah kesatuan bentuk dari “sing”, sehingga lemma dari dua kata tersebut adalah “sing”.

  • Tokeization

Tokenization adalah proses pembagian sebagian besar teks berkelanjutan menjadi turunan unit-unit yang berbeda.

Misalnya pada kalimat “Membaca buku lama”, maka setiap katanya akan di pisah menjadi satu unit masing-masing.

Kalimat diatas akan dibagi ke dalam “membaca”, “buku”, “lama”. Unit-unit tersebut kemudian dinamakan token.

  • Parsing

Parsing adalah proses menganalisa teks menjadi komponen-komponen sintaksis logis, teknik ini biasa digunakan untuk menguji keselarannya dengan tata bahasa.

Contoh dari teknik parsing adalah pemecahan kalimat untuk menerangkan setiap unsur pembentuk dari kata-kata yang sudah ada.

Misalnya pada kata “madu”, maka elemennya bisa dipecah kedalam empat elemen yang berbeda, yaitu “M”, “A”, “D”, “U”.

Bagaimana Sistem NLP Menginterpretasikan Bahasa?

Natural Language Processing menginterpretasikan bahasa dalam enam level, berikut adalah penjelasannya.

  • Morphological level

Morfem merupakan sebuah unit terkecil dari sebuah kata. Level ini berhubungan dengan morfem dalam perannya sebagai bagian dari unsur penyusun kata.

  • Lexical level

Pada level lexical, sistem komputer akan fokus pada bagaimana unsut-unsusr kata (morfem) bergabung dan membuat kata-kata. Setelah itu, sistem komputer akan mengidentifikasi perbedaannya untuk menemukan makna dari setiap kata.

  • Syntactic level

Level syntactic fokus pada teks di level sebuah kalimat. Tahap ini berkaitan dengan sebuah gagasan bahwa dalam kebanyakan bahasa, arti kalimat bisa bergantung pada runutan kata dan tata bahasa yang dipakai.

  • Semantic level

Pada level semantic, sistem komputer akan fokus pada bagaimana konteks kata dalam kalimat bisa membantu menentukan makna kata pada tingkat individu.

  • Discourse level

Level discourse fokus pada bagaimana kalimat berhubungan satu sama lain dalam satu teks. Sistem akan memproses dan mengidentifikasi urutan dan aturan kalimat yang bisa mempengaruhi mana sebuah kalimat.

  • Pragmatic level

Level pragmatic fokus pada arti kata atau kalimat pada kesadaran situasional dan pengetahuan dunia. Secara singkat, sistem akan mengidentifikasi arti kata yang paling mendekati dan paling masuk akal dari teks yang diolah.

Contoh Natural Language Processing

Sebagai contoh, penggunaan Natural Language Processing (NLP) digunakan dalam beberapa aplikasi berikut ini.

  • Aplikasi penerjemah bahasa, contohnya Google Translate
  • Aplikasi pengolahan kata, seperti Grammarly dan Microsoft Word
  • Aplikasi Interactive Voice Response (IVR)
  • Aplikasi Personal Assistant, misalnya Siri, Cortana, OK Google.
  • Aplikasi Ojek Online, seperti Grab dan Gojek.
  • Aplikasi Email, seperti Gmail, Ymail, dan Hotmail.

Penjelasan di atas adalah pembahasan Natural Language Processing, mulai dari pengertian, pendekatan, teknik, cara kerja, sampai contoh Natural Language Processing. Semoga informasi ini bisa bermanfaat bagi pembaca.