You are on page 1of 22

SPEECH RECOGNITION

Pertemuan Ke-6
2015-2016

Ekstraksi Ciri Ucapan Menggunakan


Analisis Komponen Utama
(Principal Components Analysis - PCA)
Dr. R. Rizal Isnanto, ST, MM, MT
Andi Widiasmoro, ST, M.Kom

Pendahuluan
Pada proses pengenalan ucapan, langkah yang dilakukan setelah
pengambilan data atau sampel ucapan adalah EKSTRAKSI CIRI
Ekstraksi ciri bertujuan mengambil ciri-ciri utama dari data dengan
mengambil informasi yang dominan dan membuang informasi lain.
Ciri bersifat unik, seringkali hanya memiliki sejumlah kecil nilai,
namun mewakili satu entitas yang besar

Dengan ekstraksi ciri, maka pengenalan, pembandingan, ataupun


analisis dilakukan pada sejumlah nilai terbatas, misal vektor yang
terdiri atas beberapa nilai, bukan pada keseluruhan nilai pada data
Dengan ekstraksi ciri diharapkan proses pengenalan dapat
dilakukan dengan lebih cepat

Background
Mathematics

Rerata - Mean
n

i 1

Simbol X (dibaca X bar) merupakan rerata dari data X yang


berarti nilai data X ditambahkan dan dibagi jumlah data X
Sayangnya, rerata tidak memberikan banyak informasi selain
nilai dari titik tengah suatu data
Sebagai contoh data berikut mempunyai rerata sama (10), tetapi
datanya berbeda
[0 8 12 20] dan [8 9 11 12]
Jadi apa yang berbeda dari data di atas? Yang berbeda adalah
sebaran datanya
Standar Deviasi biasanya digunakan untuk mengukur sebaran
data seperti di atas

Standar Deviasi
Standar Deviasi Simpangan Baku merupakan rerata jarak
antara suatu data dengan nilai reratanya
n

( X i X )2

i 1

(n 1)

Varians
Varians juga dapat digunakan untuk mengukur sebaran data,
dan rumusnya pun hampir sama dengan standar deviasi
n

s2

( X i X )2

i 1

(n 1)

Untuk mengukur sebaran data, standar deviasi paling banyak


digunakan, tapi varians juga masih digunakan

Kovarians
Standar Deviasi dan Varians digunakan untuk mengukur
sebaran data 1 dimensi, misal tinggi badan orang di suatu
ruangan, nilai Matakuliah Olahraga di suatu kelas
Bagaimana jika dibutuhkan analisis statistik pengaruh tinggi
badan terhadap nilai Olahraga?
Standar Deviasi dan Varians hanya dapat digunakan pada data
1 dimensi dan terpisah dengan data di dimensi yang lain
Sehingga dibutuhkan suatu formula yang sama dengan SD dan
Varians, tapi bisa untuk mengukur sebaran data lebih dari 1
dimesi, dimana dimensi 1 dan yang lainnya bisa saling
berhubungan

Kovarians
Kovarians digunakan untuk mengukur data 2 dimensi
Jika mengukur kovarians terhadap data 1 dimensi dan data lain
yang sama, maka hasilnya ada varians
Jika ada dataset 3 dimensi (x,y,z), maka dapat diukur kovarians
pada dimensi x dan y, dimensi x dan z, dan dimensi y dan z.
Pengukuran dimensi x dan x, y dan y, z dan z, akan
menghasilnya varians
n

var( x)

(X

X )( X i X )

i 1

(n 1)

cov( X , Y )

(X

X )(Yi Y )

i 1

(n 1)

Kovarians

Matriks Kovarians
Kovarians hanya digunakan untuk mengukur data 2 dimensi. jika
ada data lebih dari 2 dimensi, maka akan ada lebih dari 1
perhitungan kovarians-nya
Sebagai contoh, untuk dataset 3 dimensi (dimensi x, y, z), kita
dapat menghitung cov(x,y), cov(x,z), dan cov (y,z)
Cara yang paling mudah adalah masukan semua jumlah
kovarians pada sesuai jumlah dimesinya ke dalam sebuah
matriks
Definisi matriks kovarians adalah :
C nxn (ci , j , ci , j cov( Dimi , Dim j ))

Matriks Kovarians
Definisi matriks kovarians adalah :
C nxn (ci , j , ci , j cov( Dimi , Dim j ))

Dimana Cnxn adalah matriks dengan ukuran n baris dan n kolom,


dan Dimx adalah dimensi ke-x
Artinya jika kita mempunyai dataset sejumlah n dimensi maka
matriks yang terbentuk mempunyai n baris dan n kolom (matriks
bujur sangkar) dan komponen matriks-nya merupakan hasil
perhitungan masing-masing kovarians
Misalnya, komponen pada baris 2 kolom 3, merupakan hasil
perhitungan kovarians antara dimensi ke-2 dan dimensi ke-3

Matriks Kovarians
Sebagai contoh, kita mempunyai dataset sebanyak 3 dimensi,
yaitu dimensi x, y, dan z, maka matriks kovarians-nya
mempunyai 3 baris dan 3 kolom
cov( x, x) cov( x, y ) cov( x, z )

C cov( y, x) cov( y, y ) cov( y, z )


cov( z , x) cov( z , y ) cov( z , z )

Note :
cov(x,x), cov (y,y), dan cov (z,z) varians
cov(x,y) = cov(y,x), cov(x,z) = cov(z,x), cov(y,z) = cov(z,y)
matriks simetris

Aljabar Matriks
Aljabar Matriks digunakan untuk menghitung vektor eigen dan
nilai eigen pada PCA

Vektor Eigen dan Nilai Eigen

Vektor Eigen dan Nilai Eigen

Vektor Eigen dan Nilai Eigen

Vektor Eigen dan Nilai Eigen

Principal Components Analysis - PCA


Pada pengolahan sinyal ucapan, satu gelombang ucapan dibagi
menjadi blok-blok berukuran sama
Blok 1 dimensi (vektor) dibuat sebagai matriks bujursangkar (n x
n)

Setiap blok dicari nilai-nilai eigen-nya (ada n nilai eigen)


Setelah semua blok dicari nilai-nilai eigen-nya, maka semua nilai
eigen tersebut diurutkan dari yang terbesar sampai yang
terkecil (l1, l2, l3, l4, dst.)
Nilai-nilai eigen itulah yang disebut sebagai komponenkomponen utama (principal components)

Principal Components Analysis - PCA


Setelah itu, diambil beberapa komponen utama terbesar,
misalnya 75 terbesar, 50 terbesar, atau 10 terbesar
Komponen-komponen utama tersebut dimasukkan ke dalam
vektor ciri

Vektor ciri dari sinyal ucapan uji dibandingkan dengan vektor ciri
dari sinyal ucapan data latih menggunakan model similarity
measures, misalnya Jarak Euclidean, Jarak Minkowski dan
sebagainya

Principal Components Analysis - PCA


Jarak yang paling kecil (minimum) terhadap satu vektor ciri data
latih menunjukkan bahwa data uji dikenali sebagai paling dekat
kemiripannya dengan data latih tersebut, atau dikenali sebagai
data latih tersebut
Untuk implementasi, sering digunakan nilai ambang (threshold)
untuk menentukan suatu data uji bisa dikenali atau tidak bisa
dikenali. Jika jarak > nilai ambang, maka akan diperoleh
keluaran TIDAK DIKENALI

Jika jarak <= nilai ambang, maka data uji dikenali sebagai salah
satu dari data latih yang menghasilkan jarak (selisih) minimum.

Efisiensi Komputasi dengan PCA


Misal dari seluruh komponen utamanya diambil 25% terbesarnya
Dari n x n ciri (atau dalam sinyal ucapan adalah n2 ciri dalam
baris yang sama) akan diperoleh n komponen utama
Maka jumlah ciri uji yang harus dicocokkan dengan ciri pada
data latih = 0,25n
Sehingga efisiensi komputasi = 1 [(0,25n) / n2]
= 1 [0,25 / n]
= {1 [1/(4n)]} x 100%

TERIMA KASIH