Slide Presentation Final Project (S1)
-
Upload
aditia-rakhmat -
Category
Data & Analytics
-
view
115 -
download
6
description
Transcript of Slide Presentation Final Project (S1)
Analisis Sentimen Terhadap Acara
Televisi Berdasarkan Opini Publik
JURUSAN TEKNIK INFORMATIKAFAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS KOMPUTER INDONESIABANDUNG
2014
Aditia Rakhmat Sentiaji - 10110139
Penguji 2 :Adam Mukharil Bachtiar S.Kom.,M.T.
Penguji 1 :Dian Dharmayanti S.T.,M.Kom.
Penguji 3 :Rani Susanto S.Kom.,M.Kom.
Σ Stasiun Televisi = Σ Program Televisi
Σ Program Televisi ≠ Σ Kualitas
“seringkali ditampilkan acara yang melanggar norma kesopanan melecehkan orang, menggunakan bahasa kasar dan menggunakan anak dalam setingan film
yang tidak pantas.”Nina Mutmainah Armando – Anggota
Komisioner KPI
Membuat referensi acara televisi
Membuat alat evaluasi bagi stasiun televisi
ANALISIS SENTIMEN
Sumber Data
Pengguna twitter di Indonesia sebanyak ± 20 juta
GAMBARAN SISTEM
Basis data
Preprocessing
TrainingFitur
Preprocessing
Testing
1
2 3
5
6
7
89
4
CRAWLING TWEET
Memanfaatkan API Twitter
Menggunakan library twitter4J
PREPROCESSING
Case Folding
Convert Emoticon
Cleansing
Convert Negation
Tokenizing
Stopping
Stemming
Convert Emoticon
» Before : Perasaan kemaren nntn yks live ga seru deh:( paling atas sih
» After : Perasaan kemaren nntn yks live ga seru deh kecewa paling atas sih
:-) :) :o) :] :3 :c) :> =] 8)
=) :} :^) :っ )
[:=8][-oc^ っ ]?[\\)>\\]3\\}pP]+ Senang
:-D :D 8-D 8D x-D xD X-D XD =-D =D =-3 =3 B^D
[:8xX=B][-^]?[D3\\)]+ Ketawa
:-|| :@ >:( [:>][-:]?[\\|\\(@]+ Benci
:$ >:[ :-( :( :-c :c :-< : っ C :< :-[ :[ :{ ;( :'-( :'(D:< D: D8 D; D= DX v.v D-':
[>:][-: っ \\.]?[\\[\\(c<\\{C$\\|]+ Kecewa
<3 ;-) ;) *-) *) ;-] ;] ;D ;^) :-, [<:;][^-]?[3*\\)D\\],] Suka
Cleansing
» Before : RT @PratamaDhidien: Kampanye Negatif ala TV One http://t.co/uMvPpwQJyG via @kompasiana\ndasarr tv oon
» After : RT Kampanye Negatif ala TV One via tv oon
Mention @\\S*
Check in \\(@\\s.*\\)
URL \\S+\\.com*(\\.)*(id)*\\/\\S+|\\S+\\.\\w\\w\\/\\S+
Aposthrope \\W+
Case Folding
»Merubah semua karakter menjadi lower case»Contoh : »Before : RT Kampanye Negatif ala TV One via tv oon»After : rt kampanye negatif ala tv one via tv oon
Convert Negation
» Merubah kata yang diawali kata negasi » Kata negasi : “kurang”, “tidak”, “enggak”, “ga”, “nggak”,
“tak”, dan “gak”» Contoh» Before : jadi ga seru ahh di YkS sekarang ada hipnotis...» After : jadi ga_seru ahh di yks sekarang ada hipnotis...
Tokenizing
»Memecah dokumen (tweet) menjadi perkata(token) berdasarkan spasi yang memisahkan.
»Contoh»Before : jadi ga seru ahh di yks sekarang ada hipnotis»After :
jadi ga seruahh di ykssekarang ada hipnotis
Stopping
»Menghapus kata yang termasuk ke dalam stoplist»Contoh»Before : jadi ga seru ahh di yks sekarang ada
hipnotis»After : ga seru yks hipnotis
Stemming
» Mengembalikan bentuk dasar dari kata yang memiliki imbuhan » Contoh» Before : ga seru yks malam ini, hipnotistnya garing
@YuKeepSmile_TTV» After : ga seru yks malam ini, hipnotist garing
@YuKeepSmile_TTV
Naïve Bayes Classifier
TRAINING
Membentuk FiturMenghitung probabilitas kelasMenghitung Frekuensi Fitur
Membentuk Fitur• Telah disiapkan 8 data latih sebagai berikut :
Tweet Kategori Fitur
Acara di tv monoton... nyari orgen tunggal tlh negatif Monoton (1)
Perasaan kemaren nntn yks live ga seru deh:( paling atas sih
negatif ga_seru (1), kecewa (1)
Seneng bgt km bs\nbergabung di Junior Master\nChef lagi! @Nicole_JrMCI\nSemangat Nicole :)
positif Senang (2)
Apa ngga bosen tiap hari liat yks negatif Bosen (1)
RT @RMAdhyatma: Kalo nonton acara \"INDONESIA LAWAK KLUB\" ketawa ngakak terus :D @LawakKlubTrans7 @trans7channel @TRANS7
positif Ketawa (2), ngakak (1)
Ini acara tv monoton bgt :( negatif Monoton (1), kecewa (1)
Mata najwa, now on metro tv! Topiknya bagus.. positif Bagus (1)
Indonesia lawak klub (ilk) bikin ngakak =)) positif Ngakak(1), senang(1)
Menghitung probabilias Kelas
Keterangan :
fd(ci) = Jumlah dokumen yang termasuk ci
|D| = Jumlah data latih / jumlah tweet
Menghitung Probabilitas Kelas
Kelas Sentimen (c)
Data(i)
fd()
d1 d2 d3 d4 d5 d6 d7 d8
Positif 0 0 1 0 1 0 1 1 4 4/8
negatif 1 1 0 1 0 1 0 0 4 4/8
Menghitung Frekuensi Fitur
Keterangan :• = Nilai kemunculan kata pada kelas • = Jumlah keseluruhan kata pada kelas Vj• = Jumlah keseluruhan dari
Menghitung Frekuensi Fitur
Kelas Sentimen monoton ga_seru kecewa senang bosen ketawa ngakak bagus
Positif ½ 1/16 1/16 1/16 3/16 1/16 3/16 3/16 2/16Negatif ½ 3/14 2/14 3/14 1/14 2/14 1/14 1/14 1/14
Naïve Bayes Classifier
TESTING
¿
Data Baru : dirumah banjir KETAWA :-D :-D @Ini_Talkshow :-* ?
preprocessing : dirumah banjir ketawa ketawa ketawa senang
x x x
=
= 3017,48 x 10-10
x x x
== 47,43 x 10-10
PERCENTAGE SPLIT
Percentage Split
Data
Data 140%
Data 260%
Data Testing
Data Training
Split
@OVJ_Trans7 gak seru, gak lucu.! Kalo gak ada kang @sule_ovj
@OVJ_Trans7 gak ada #Sule udah gak lucu , Garingg bgt sekarang .. Huekkkk
@DEV0TEES bentar lg ada Rising Star Indonesia :-) bakal lebih bagus dr Idol deh,,
YKS ga ada kang wendi, Ga seru aah :( @WCIndonesia
ILK (Indonesia lawak klub) bikin ngakak :D :D
Sebelum #jum'atan stay di trans7 lihat video2 lucu ala @CCTV_T7
Data Training
Percentage Split
Data Testing
@OVJ_Trans7 gak seru, gak lucu.! Kalo gak ada kang @sule_ovj
@OVJ_Trans7 gak ada #Sule udah gak lucu , Garingg bgt sekarang .. Huekkkk
ILK (Indonesia lawak klub) bikin ngakak :D :D
Sebelum #jum'atan stay di trans7 lihat video2 lucu ala @CCTV_T7
Percentage Split
Data Training
DataKelas Sentimen (c)
Positif Negatif
ga_seru = =
ga_lucu = =
ketawa = =
lucu = =
ngakak = =
Fitur
@DEV0TEES bentar lg ada Rising Star Indonesia :-) bakal lebih bagus dr Idol deh,, YKS ga ada kang wendi, Ga seru aah :( @WCIndonesia
Percentage Split
Data Testing
p(ci)p("yks"|ci)p("ga_ada"| ci) p("kang"| ci)
p("wendi"| ci) p("ga_lucu"| ci)
0.00006
0.000015
p(ci)p("bentar"|ci)p("rising"| ci) p("star"| ci)
p("indonesia"| ci) p(“ketawa"| ci) p("lebih"| ci)
p("bagus"| ci) p("idol"| ci)
0.000030
0.000015
Akurasi = x 100
Akurasi = x 100 = 50%
ANALISIS SISTEM
USE CASE
DIAGRAM ACTIVITY DATA TRAINING
DIAGRAM ACTIVITYDATA TRAINING
CLASS DIAGRAM
SEQUENCE DIAGRAM DATA TRAINING
SEQUENCE DIAGRAM DATA TESTING
SEQUENCE DIAGRAM CROSS VALIDATION
PERANCANGAN ANTARMUKA
Data Training
Data Testing
Pengujian Sistem
Black Box (Equivalence Partitioning)
White Box
Black Box (Sample Testing)
Equivalence Partitioning
Diterima
Black Box
White Box
Cyclometic Complexity Jumlah Region Predicate NodeGraph Matrix
V(G) = 9
Sample Testing
100%
KESIMPULAN
Analisis sentimen dapat dijadikan sebagai alat untuk mengklasifikasikan opini publik mengenai acara televisi
Hasil pengklasifikasian analisis sentiment mengenai acara televisi dapat dijadikan referensi untuk menonton acara televisi dan dapat menjadi masukan bagi pihak statisun televisi
SARAN
Penambahan Sumber Data
Efisiensi Program
Filter Opini
TERIMA KASIH