Slide Presentation Final Project (S1)

Post on 28-May-2015

115 views 6 download

description

Enjoy, this presentation describe my research for final project undergraduate.

Transcript of Slide Presentation Final Project (S1)

Analisis Sentimen Terhadap Acara

Televisi Berdasarkan Opini Publik

JURUSAN TEKNIK INFORMATIKAFAKULTAS TEKNIK DAN ILMU KOMPUTER

UNIVERSITAS KOMPUTER INDONESIABANDUNG

2014

Aditia Rakhmat Sentiaji - 10110139

Penguji 2 :Adam Mukharil Bachtiar S.Kom.,M.T.

Penguji 1 :Dian Dharmayanti S.T.,M.Kom.

Penguji 3 :Rani Susanto S.Kom.,M.Kom.

Σ Stasiun Televisi = Σ Program Televisi

Σ Program Televisi ≠ Σ Kualitas

“seringkali ditampilkan acara yang melanggar norma kesopanan melecehkan orang, menggunakan bahasa kasar dan menggunakan anak dalam setingan film

yang tidak pantas.”Nina Mutmainah Armando – Anggota

Komisioner KPI

Membuat referensi acara televisi

Membuat alat evaluasi bagi stasiun televisi

ANALISIS SENTIMEN

Sumber Data

Pengguna twitter di Indonesia sebanyak ± 20 juta

GAMBARAN SISTEM

Twitter

Basis data

Preprocessing

TrainingFitur

Preprocessing

Testing

1

2 3

5

6

7

89

4

CRAWLING TWEET

Memanfaatkan API Twitter

Menggunakan library twitter4J

PREPROCESSING

Case Folding

Convert Emoticon

Cleansing

Convert Negation

Tokenizing

Stopping

Stemming

Convert Emoticon

» Before : Perasaan kemaren nntn yks live ga seru deh:( paling atas sih

» After : Perasaan kemaren nntn yks live ga seru deh kecewa paling atas sih

:-) :) :o) :] :3 :c) :> =] 8)

=) :} :^) :っ )

[:=8][-oc^ っ ]?[\\)>\\]3\\}pP]+ Senang

:-D :D 8-D 8D x-D xD X-D XD =-D =D =-3 =3 B^D

[:8xX=B][-^]?[D3\\)]+ Ketawa

:-|| :@ >:( [:>][-:]?[\\|\\(@]+ Benci

:$ >:[ :-( :(  :-c :c :-<  : っ C :< :-[ :[ :{ ;( :'-( :'(D:< D: D8 D; D= DX v.v D-':

[>:][-: っ \\.]?[\\[\\(c<\\{C$\\|]+ Kecewa

<3 ;-) ;) *-) *) ;-] ;] ;D ;^) :-, [<:;][^-]?[3*\\)D\\],] Suka

Cleansing

» Before : RT @PratamaDhidien: Kampanye Negatif ala TV One http://t.co/uMvPpwQJyG via @kompasiana\ndasarr tv oon

» After : RT Kampanye Negatif ala TV One via tv oon

Mention @\\S*

Check in \\(@\\s.*\\)

URL \\S+\\.com*(\\.)*(id)*\\/\\S+|\\S+\\.\\w\\w\\/\\S+

Aposthrope \\W+

Case Folding

»Merubah semua karakter menjadi lower case»Contoh : »Before : RT Kampanye Negatif ala TV One via tv oon»After : rt kampanye negatif ala tv one via tv oon

Convert Negation

» Merubah kata yang diawali kata negasi » Kata negasi : “kurang”, “tidak”, “enggak”, “ga”, “nggak”,

“tak”, dan “gak”» Contoh» Before : jadi ga seru ahh di YkS sekarang ada hipnotis...» After : jadi ga_seru ahh di yks sekarang ada hipnotis...

Tokenizing

»Memecah dokumen (tweet) menjadi perkata(token) berdasarkan spasi yang memisahkan.

»Contoh»Before : jadi ga seru ahh di yks sekarang ada hipnotis»After :

jadi ga seruahh di ykssekarang ada hipnotis

Stopping

»Menghapus kata yang termasuk ke dalam stoplist»Contoh»Before : jadi ga seru ahh di yks sekarang ada

hipnotis»After : ga seru yks hipnotis

Stemming

» Mengembalikan bentuk dasar dari kata yang memiliki imbuhan » Contoh» Before : ga seru yks malam ini, hipnotistnya garing

@YuKeepSmile_TTV» After : ga seru yks malam ini, hipnotist garing

@YuKeepSmile_TTV

Naïve Bayes Classifier

TRAINING

Membentuk FiturMenghitung probabilitas kelasMenghitung Frekuensi Fitur

Membentuk Fitur• Telah disiapkan 8 data latih sebagai berikut :

Tweet Kategori Fitur

Acara di tv monoton... nyari orgen tunggal tlh negatif Monoton (1)

Perasaan kemaren nntn yks live ga seru deh:( paling atas sih

negatif ga_seru (1), kecewa (1)

Seneng bgt km bs\nbergabung di Junior Master\nChef lagi! @Nicole_JrMCI\nSemangat Nicole :)

positif Senang (2)

Apa ngga bosen tiap hari liat yks negatif Bosen (1)

RT @RMAdhyatma: Kalo nonton acara \"INDONESIA LAWAK KLUB\" ketawa ngakak terus :D @LawakKlubTrans7 @trans7channel @TRANS7

positif Ketawa (2), ngakak (1)

Ini acara tv monoton bgt :( negatif Monoton (1), kecewa (1)

Mata najwa, now on metro tv! Topiknya bagus.. positif Bagus (1)

Indonesia lawak klub (ilk) bikin ngakak =)) positif Ngakak(1), senang(1)

Menghitung probabilias Kelas

Keterangan :

fd(ci) = Jumlah dokumen yang termasuk ci

|D| = Jumlah data latih / jumlah tweet

Menghitung Probabilitas Kelas

Kelas Sentimen (c)

Data(i)

fd()

d1 d2 d3 d4 d5 d6 d7 d8

Positif 0 0 1 0 1 0 1 1 4 4/8

negatif 1 1 0 1 0 1 0 0 4 4/8

Menghitung Frekuensi Fitur

Keterangan :• = Nilai kemunculan kata pada kelas • = Jumlah keseluruhan kata pada kelas Vj• = Jumlah keseluruhan dari

Menghitung Frekuensi Fitur

Kelas Sentimen monoton ga_seru kecewa senang bosen ketawa ngakak bagus

Positif ½ 1/16 1/16 1/16 3/16 1/16 3/16 3/16 2/16Negatif ½ 3/14 2/14 3/14 1/14 2/14 1/14 1/14 1/14

Naïve Bayes Classifier

TESTING

¿

Data Baru : dirumah banjir KETAWA :-D :-D @Ini_Talkshow :-* ?

preprocessing : dirumah banjir ketawa ketawa ketawa senang

x x x

=

= 3017,48 x 10-10

x x x

== 47,43 x 10-10

PERCENTAGE SPLIT

Percentage Split

Data

Data 140%

Data 260%

Data Testing

Data Training

Split

@OVJ_Trans7 gak seru, gak lucu.! Kalo gak ada kang @sule_ovj

@OVJ_Trans7 gak ada #Sule udah gak lucu , Garingg bgt sekarang .. Huekkkk

@DEV0TEES bentar lg ada Rising Star Indonesia :-) bakal lebih bagus dr Idol deh,,

YKS ga ada kang wendi, Ga seru aah :( @WCIndonesia

ILK (Indonesia lawak klub) bikin ngakak :D :D

Sebelum #jum'atan stay di trans7 lihat video2 lucu ala @CCTV_T7

Data Training

Percentage Split

Data Testing

@OVJ_Trans7 gak seru, gak lucu.! Kalo gak ada kang @sule_ovj

@OVJ_Trans7 gak ada #Sule udah gak lucu , Garingg bgt sekarang .. Huekkkk

ILK (Indonesia lawak klub) bikin ngakak :D :D

Sebelum #jum'atan stay di trans7 lihat video2 lucu ala @CCTV_T7

Percentage Split

Data Training

DataKelas Sentimen (c)

Positif Negatif

ga_seru = =

ga_lucu = =

ketawa = =

lucu = =

ngakak = =

Fitur

@DEV0TEES bentar lg ada Rising Star Indonesia :-) bakal lebih bagus dr Idol deh,, YKS ga ada kang wendi, Ga seru aah :( @WCIndonesia

Percentage Split

Data Testing

p(ci)p("yks"|ci)p("ga_ada"| ci) p("kang"| ci)

p("wendi"| ci) p("ga_lucu"| ci)

0.00006

0.000015

p(ci)p("bentar"|ci)p("rising"| ci) p("star"| ci)

p("indonesia"| ci) p(“ketawa"| ci) p("lebih"| ci)

p("bagus"| ci) p("idol"| ci)

0.000030

0.000015

Akurasi = x 100

Akurasi = x 100 = 50%

ANALISIS SISTEM

USE CASE

DIAGRAM ACTIVITY DATA TRAINING

DIAGRAM ACTIVITYDATA TRAINING

CLASS DIAGRAM

SEQUENCE DIAGRAM DATA TRAINING

SEQUENCE DIAGRAM DATA TESTING

SEQUENCE DIAGRAM CROSS VALIDATION

PERANCANGAN ANTARMUKA

Data Training

Data Testing

Pengujian Sistem

Black Box (Equivalence Partitioning)

White Box

Black Box (Sample Testing)

Equivalence Partitioning

Diterima

Black Box

White Box

Cyclometic Complexity Jumlah Region Predicate NodeGraph Matrix

V(G) = 9

Sample Testing

100%

KESIMPULAN

Analisis sentimen dapat dijadikan sebagai alat untuk mengklasifikasikan opini publik mengenai acara televisi

Hasil pengklasifikasian analisis sentiment mengenai acara televisi dapat dijadikan referensi untuk menonton acara televisi dan dapat menjadi masukan bagi pihak statisun televisi

SARAN

Penambahan Sumber Data

Efisiensi Program

Filter Opini

TERIMA KASIH