APA ITU NLP?
Natural Language Processing/NLP adalah suatu aplikasi (program) dalam bidang AI yang dapat mengartikan suatu bahasa baik bahasa tulisan maupun bahasa lisan atau memproses masukan yang berupa bahasa menjadi suatu informasi atau pengetahuan.
PENDEKATAN NATURAL LANGUAGE PROCESSING
- Pendekatan simbolik
- Pendekatan statistik
- Pendekatan koneksi
TEKNIK YANG DIGUNAKAN DALAM NLP
TAHAPAN PROSES NLP
- Syntax
Syntax mengacu pada susunan kata-kata dalam sebuah kalimat sehingga tampak masuk akal secara tata bahasa. NLP menggunakan analisis syntax untuk menerapkan aturan tata bahasa pada kumpulan kata yang ditemukannya.
Ada beberapa teknik syntax yang bisa digunakan.
- Lemmatization, melakukan pengurangan berbagai bentuk kata yang berubah menjadi satu bentuk untuk memudahkan analisis.
- Segmentasi morfologis, melibatkan pembagian kata menjadi unit-unit individu atau morfem.
- Segmentasi kata, membagi sebagian besar teks berkelanjutan menjadi unit-unit berbeda.
- Penandaan part-of-speech, dengan mengidentifikasi bagian dari ucapan untuk setiap kata.
- Parsing, dengan melakukan analisis tata bahasa untuk kalimat yang disediakan.
- Pemutusan kalimat, dengan menempatkan batas kalimat pada sepotong teks besar.
- Stemming, memotong kata-kata yang diubah ke bentuk akarnya.
- Semantics
Semantics mengacu pada makna yang disampaikan oleh sebuah teks. Ini merupakan aspek yang paling sulit dianalisis dalam natural language processing dan belum sepenuhnya dipelajari.
Analisis ini melibatkan penerapan algoritma komputer untuk memahami arti dan interpretasi kata-kata dan bagaimana kalimat disusun.Berikut beberapa teknik semantics yang umum digunakan dalam NLP.
- Named entity recognition (NER), melibatkan penentuan bagian-bagian teks yang dapat diidentifikasi dan dikategorikan ke dalam grup tertentu. Contohnya nama orang dan nama tempat.
- Disambiguasi arti kata, melibatkan pemberian makna pada kata berdasarkan konteksnya.
- Natural language generation, melibatkan penggunaan database untuk mendapatkan maksud semantik dari teks dan mengubahnya menjadi bahasa manusia.
MASALAH DALAM NLP
Beberapa masalah yang dihadapi dalam pemrosesan bahasa
alami antara lain adalah :
- Suatu kalimat sering kali tidak lengkap, artinya tidak memberi informasi yang jelas atau lengkap
- Satu kalimat dapat memiliki lebih dari satu pengertian dalam konteks yang berbeda
- Tidak ada program pemroses bahasa alami yang cukup lengkap karena bahasa selalu berkembang, kosa kata selalu bertambah.
- Bisa terdapat lebih dari satu cara (lebih dari satu kalimat) untuk mengungkapkan hal(maksud) yang sama.
Masalah pemrosesan bahasa alami dibagi menjadi dua
bagian besar, yaitu :
- Pemrosesan Naskah Tertulis,menggunkan pengetahuan tentang leksikal, sintax, dan semantik
- Pemrosesan Bahasa Lisan,menggunakan semua pengetahuan dari pemrosesan naskah tertulis ditambah pengetahuan tentang phonology.
TAHAPAN PROSES NLP
Untuk memproses bahasa alami diperlukan 5 langkah
sebagai berikut :
1. Analisis Morpology
Pada tahap ini dilakukan analisa untuk setiap kata dan
komponen yang dimiliki tiap kata termasuk token non
kata seperti spasi, tanda baca, tanda pemisah.
2. Analisis Sintax
Pada tahap ini sederetan kata disusun kedalam struktur
yang memperlihatkan bagaimana hubungan satu kata
dengan kata lainnya. Deretan kata akan ditolak bila
tidak memenuhi aturan penyusunan kata yang ada
3. Analisis semantik
Pada tahap ini struktur deretan kata yang sudah
terbentuk akan diberi arti. Dengan kata lain pemetaan
dibuat antara struktur sintax dengan object yang
berhubungan.
4. Penyatuan Arah (konteks)
Pada tahap ini arti dari suatu kalimat disesuaikan
dengan kalimat-kalimat lain, karena arti dari suatu
kalimat biasanya berhubungan dengan kalimat
sebelumnya dan kalimat sesudahnya.
5. Analisis Pragmatis
Struktur yang terbentuk menghasilkan interpretasi
ulang dari apa yang sudah dikatakan atau ditulis
sebelumnya dengan arti yang sebenarnya.
Tidak ada komentar:
Posting Komentar