Skip to content
Narrow screen resolution Wide screen resolution Auto adjust screen size Increase font size Decrease font size Default font size blue color orange color green color Sign In

Matematika IPB

 
Data Tesis
 
Judul : ANALISIS TEKS BERBAHASA INDONESIA MENGGUNAKAN TEORI KNOWLEDGE GRAPH
Jenis :
Penulis : Rusiyamti, S.Pd
NRP : G551060071
Tanggal Lulus : 08 May 2010
Tanggal Seminar :
Tanggal Sidang :
Pembimbing : Prof. Dr. Ir. Sri Nurdiati, M.Sc.
Drs. Prapto Tri Supriyo, M.Kom.
Dr. Sugi Guritman
Ringkasan : Teori Knowledge Graph (KG) adalah suatu pendekatan baru yang dapat digunakan untuk memahami natural language (bahasa alami). Bahasa alami adalah bahasa yang paling populer digunakan untuk menyampaikan atau menerima informasi. Penelitian tentang teori KG dalam jangka panjang bertujuan untuk merancang suatu metode yang dapat digunakan untuk membaca sembarang dokumen berbahasa Indonesia sehingga dihasilkan informasi dalam bentuk teks graf. Teks graf tersebut merupakan intisari dari dokumen yang dipelajari. Penelitian ini merupakan tahap awal untuk mencapai tujuan tersebut. Selama ini struktur teori KG disusun dalam bahasa Inggris. Pada penelitian ini penulis menggunakan teori KG untuk menganalisis dokumen berbahasa Indonesia. Dokumen berbahasa Indonesia yang dimaksud dalam penelitian ini adalah dokumen yang bertema tsunami yang diambil dari beberapa sumber. Penelitian ini bertujuan menentukan chunk indicators yang dapat digunakan sebagai kriteria pada bagian mana sebuah kalimat harus dipotong ketika kalimat tersebut dianalisis. Manfaat penelitian ini adalah memberikan salah satu alternatif dalam menganalisis teks berbahasa Indonesia. Dalam teori KG, setiap kata akan berhubungan dengan sebuah word graph, dan menyatakan arti dari kata. Gabungan beberapa word graph akan membentuk sentence graph, dan gabungan beberapa sentence graph akan membentuk sebuah text graph. Pada prinsipnya, teori KG terdiri dari konsep dan relasi. Konsep merupakan komponen terpenting dalam pemikiran manusia. Konsep dapat dibedakan menjadi tiga jenis, yaitu token, type dan name. Token dinyatakan dengan simbol ” ”. Token merupakan konsep yang dipahami seseorang menurut cara pandang masing-masing sehingga bersifat subjektif. Type adalah konsep yang berupa informasi umum dan bersifat objektif. Name adalah sesuatu yang bersifat individual. Dalam teori KG, relasi digunakan untuk menghubungkan konsep yang satu dengan konsep lainnya. Banyak relasi yang digunakan dalam teori KG sangat terbatas yaitu 9 relasi biner (binary relationships) dan 4 relasi dalam frame (frame relationships). Sembilan relasi biner tersebut antara lain: CAU, EQU, SUB, ALI, DIS, ORD, PAR, SKO, dan ontologi F. Empat relasi dalam frame yang dimaksud adalah FPAR, NEGPAR, POSPAR, dan NECPAR. Relasi CAU digunakan untuk menghubungkan subjek dengan kata kerja atau kata kerja dengan objek. Relasi EQU untuk menghubungkan name dengan token. Relasi SUB digunakan untuk menyatakan bahwa sesuatu merupakan bagian dari sesuatu yang lain. Relasi ALI digunakan untuk menghubungkan sebuah type dengan token. Relasi DIS digunakan untuk menyatakan sesuatu yang berbeda. Relasi ORD digunakan untuk menyatakan sesuatu yang berurutan. Relasi PAR digunakan untuk menyatakan sesuatu memiliki sifat sesuatu yang lain. Relasi SKO digunakan untuk menyatakan informasi bergantung. Ontologi F digunakan untuk menunjukkan letak fokus dari suatu graf. Relasi FPAR untuk menghubungkan sebuah konsep dengan struktur di dalamnya (inner structure). Relasi NEGPAR digunakan untuk menyatakan negasi dari sesuatu, relasi POSPAR menyatakan v kemungkinan dari sesuatu, sedangkan relasi NECPAR untuk menyatakan suatu kebutuhan. Adapun tahapan-tahapan yang dilakukan dalam penelitian ini: Studi literatur dokumen berbahasa Indonesia. Pada tahap ini penulis mengumpulkan dokumen yang berkaitan dengan tsunami yang diambil dari beberapa sumber. Penulis memilih beberapa kalimat untuk dianalisis, yaitu kalimat yang dipandang dapat memberikan gambaran tentang kejadian tsunami serta merupakan intisari dari dokumen yang dipelajari. Tahap selanjutnya menentukan chunk indicators dokumen berbahasa Indonesia. Chunk indicator adalah kriteria yang digunakan untuk menentukan pada bagian mana sebuah kalimat harus dipotong ketika kalimat tersebut dianalisis. Dalam teori KG yang strukturnya bahasa Inggris ada 6 chunk indicators, pada tahap ini penulis mengidentifikasi apakah chunk indicators dalam bahasa Inggris tersebut sesuai apabila diterapkan pada dokumen yang berbahasa Indonesia atau mungkin perlu dilakukan beberapa perubahan disesuaikan dengan struktur bahasa Indonesia. Tahap selanjutnya, masing-masing kalimat hasil studi literatur dokumen berbahasa Indonesia yang bertema tsunami dan telah dipilih untuk dianalisis tersebut dipotong-potong menurut kriteria atau chunk indicators yang telah ditentukan pada tahap kedua. Langkah selanjutnya setiap potongan kalimat dibuat word graph atau chunk graph-nya. Chunk graph terdiri dari sebuah word graph, bisa juga terdiri dari gabungan beberapa word graph. Word graph dari setiap chunk dapat dilihat dalam kamus word graph, kemudian word graph atau chunk graph dari setiap potongan kalimat tersebut digabungkan menjadi sebuah sentence graph. Dari hasil studi literatur dokumen berbahasa Indonesia, penulis memilih sepuluh kalimat untuk dianalisis. Adapun alasan pemilihan sepuluh kalimat tersebut dikarenakan kalimat-kalimat itu memberikan informasi penting tentang tsunami. Dalam penelitian ini kalimat-kalimat tersebut diperoleh secara manual. Untuk selanjutnya diharapkan kalimat seperti itu nantinya dapat diperoleh secara otomatis dengan bantuan komputer. Dengan kata lain, begitu dimasukkan dokumen berbahasa Indonesia sebagai input ke dalam komputer, maka komputer akan menghasilkan output berupa text graph yang menjadi intisari dari dokumen yang dipelajari. Dalam penelitian ini diberikan kamus word graph dari beberapa jenis kata seperti: kata benda, kata kerja, kata depan, serta kata sifat yang terdapat pada dokumen berbahasa Indonesia yang bertema tsunami. Hasil penelitian ini berupa chunk indicators yang digunakan sebagai kriteria pada bagian mana sebuah kalimat harus dipotong. Chunk indicators yang digunakan untuk menganalisis teks berbahasa Indonesia dengan teori knowledge graph antara lain: Indikator 1: Koma atau titik, Indikator 2: Kata penunjuk dan kata penghubung, Indikator 3: Kata kerja bantu, Indikator 4: Kata depan (preposisi), Indikator 5: Lompatan (jump), dan Indikator 6: Kata-kata dalam logika (logic word). Selain itu hasil penelitian ini berupa sentence graph dari masing-masing kalimat. Struktur dari sentence graph tersebut menunjukkan arti (aspek semantik) dari kalimat yang dianalisis. Kata kunci : knowledge graph, word graph, sentence graph, chunk graph, chunk indicators.

Random Quotes

Orang kaya tidak tahu siapa teman sejatinya.

anonim