Sie sind auf Seite 1von 24

PROPOSAL TESIS

OPTIMASI MESIN PENCARIAN (SEARCH ENGINE) MENGGUNAKAN LATENT ALGORITMA SEMANTIC PROBABILISTIC

INDEXING (PLSI) DAN MAPREDUCE PADA JARINGAN TERDISTRIBUSI


Ahmad Heryanto 2212 205 008

DOSEN PEMBIMBING Mochamad Hariadi, S !, M!Sc!, Ph!D "hri#tyo$idia#moro, S !, M

P%OG%AM MAGIS E% BIDANG &EAH'IAN (A%INGAN "E%DAS M)' IMEDIA ()%)SAN E&NI& E'E& %O *A&)' AS E&NO'OGI IND)S %I INS I ) S)%ABA+A 201, E&NO'OGI SEP)')H NOPEMBE%

ABSTRAK

Pada tah-n 2012 yan. /a/- #tati#ti0 mencatat, data yan. diha#i/0an o/eh 1eran.0at e/e0troni0 di.ita/ #e2e#ar 342!5 6etta 2yte 78B9 hin..a 0ini ter-# 2er0em2an. #ecara e0#1onen#ia/, 1ara 1ene/iti internet mem1redi0#i 1er0em2an.an data4data te#e2-t a0an menca1ai ,5 8B 1ada tah-n 2020! *enomena ter#e2-t ada/ah Bi.Data, :i0a dio/ah den.an 2ai0 Bi.Data da1at 2erman;aat di2er2a.ai 2idan. 0ehid-1an, cara meman;aat0an data ter#e2-t den.an mencari 0e2eradaan in;orma#i 1entin. yan. terda1at 1ada do0-men, -nt-0 mem1erm-dah 1encarian in;orma#i di2-t-h0an #e2-ah me#in 1encarian 7search engine9 den.an o1tima#i yan. 2ai0, o1tima#i da1at terca1ai :i0a data4data ter#e2-t da1at diinde0#, di#im1an, diana/i#i# dan di<i#-a/i#a#i0an o/eh #i#tem #earch en.ine! Da/am 1ro#e# inde0#i dan ana/i#i# 2e2era1a 1ene/itian ter0ait men..-na0an a/.oritma c/-#terin. #e1erti Decision Tree Classification, Hierarchical Clustering, &4mean clustering, 'DA, 'SI, Nai<e Baye#ian 7NB9, SOM dan S=M, A/.oritma #e1erti Nai<e Baye#ian dan S=M memi/i0i a0-ra#i yan. #an.at 2ai0, nam-n a0-ra#i 0/a#i;i0a#i 2er.ant-n. 1e/atihan yan. di/a0-0an! 0em-dian -nt-0 'SI memi/i0i 0e-n..-/an da/am ha/ 1er;orma dan memi/i0i 0e0-ran.an terhada1 1emahaman to1i0! Sehin..a -nt-0 men-t-1i 0e0-ran.an4 0e0-ran.an dari a/.oritma diata# di1i/ih a/.oritma yan. men..a2-n.an antara Pro2a2i/i#ti0 dan 'SI yait- a/.oritma Probabilistic Latent Semantic Indexing 7P'SI9! Hara1an dari ri#et ini ada/ah #i#tem mam1- men.o1tima#i me#in 1encarian data yan. terda1at 1ada 0/-#ter 0om1-ter den.an mem1ro#e# in;orma#i #ecara 1ara/e/ 1ada #etia1 an..ota 0/-#ter #ehin..a #etia1 c/ient search engine men.in1-t0an query 1ada #i#tem da1at mem2eri0an ha#i/ yan. /e2ih ce1at dan a0-ra#i 1encarian yan. /e2ih 2ai0! Kata Kunci: Search Engine Optimazation (SEO), Public Latent Semantic Indexing (PLSI), MapReduce, Paralel Computing, Distributed computing

DA TAR ISI

DA TAR GAMBAR

DA TAR TABEL

BAB ! PENDAHULUAN
!"! Lata# B$%a&an' Saat ini, 1enin.0atan 1en..-naan 1eran.0at e/e0troni0 #e1erti te0no/o.i gadget, handphone dan 0om1-ter mem2-at <o/-me data di.ita/ 2er0em2an. #ecara e0#1onen#ia/, data ter#e2-t memi/i0i 2ent-0 yan. 2er<aria#i dan ter-# men.a/ir #ecara 0ontin-e den.an 0ece1atan yan. 2era.am, ;enomena4;enomena /o:a0an data ter#e2-t di0ena/ den.an Bi.Data! Pada tah-n 2000 di1er0ira0an tota/ data di.ita/ yan. ter#im1an di#e/-r-h d-nia #e2e#ar 800!000 1enta2yte 7PB9, #e:a0 #aat it- ter-# menin.0at hin..a 1ada tah-n 200> tercatat 0!18 6etta2yte 78B9 dan 1ada tah-n 2012 tercatat #e2e#ar 2!5 8B, 1ara 1ene/iti internet mem1redi0#i 1er0em2an.an data4data te#e2-t a0an menca1ai ,5 8B 1ada tah-n 2020! Ha/ ter#e2-t mem-n.0in0an 0arena 2e2era1a contoh #e1erti media social yan. 1a/in. 1o1-/er #e1erti t$itter men.ha#i/0an /e2ih dari 5 tera2yte 7 B9 data #etia1 hari, ;ace2oo0 10 B dan 2e2era1a 1er-#ahaan /ainnya men.ha#i/0an #at-an tera2yte data #etia1 :am #etia1 hari #e1an:an. tah-n 7"hri# Eaton et a/!, 2012? ID", 20119! Bi.Data 1er/- diinde0#, di#im1an, diana/i#i# dan di<i#-a/i#a#i0an a.ar da1at men.e0#tra0#i in;orma#i ter#e2-t, 1erma#a/ahan tim2-/ 0arena ma#ih /an.0ah hardi#0 yan. 2eredar di1a#aran memi/i0i -0-ran yan. 2e#ar -nt-0 menyim1an Bi.Data, Bi.Data :-.a 1er/- di1ro#e# o/eh "P) den.an 0ece1atan yan. mem-m1-ni nam-n "P) yan. mam1- mem1ro#e# data da/am :-m/ah yan. 2e#ar ma#ih maha/! A/.oritma #e0-en#ia/ #aat ini 0-ran. handa/ menan.ani Bi.Data, #o/-#i ter2ai0 -nt-0 1erma#a/ahan ter#e2-t ada/ah 1enyim1anan data #ecara terdi#tri2-#i dan 1en.o/ahan data #ecara 1ara/e/! A/.oritma Ma1%ed-ce di.-na0an -nt-0 men:a$a2 1er#oa/an ter#e2-t, Ma1%ed-ce da1at diim1/ementa#i0an 1ada 0om1-ter yan. memi/i0i #1e#i;i0a#i 1eran.0at 0era# yan. tida0 ter/a/- tin..i dan da1at me/a0-0an 1en.o/ahan data #ecara terdi#tri2-#i di0/-#ter 0om1-ter yan. 2er2eda42eda! Da/am 1ro#e# inde0#i dan ana/i#i# data di1er/-0an te0ni0 te@t minin., 2anya0 1ene/itian ter0ait yan. men..-na0an a/.oritma c/-#terin. da/am
5

1en.o/ahan

data,

a/.oritma4a/.oritma

ter#e2-t

#e1erti

Decision

Tree

Classification, Hierarchical Clustering, K mean clustering, 'DA, 'SI, !ai"e #ayesian 7NB9, SOM dan S=M7"h-n4hon. et a/!, 2011? Aan. et a/!, 201,? Bi-:-n and 8hon.6hi, 20019, A/.oritma #e1erti Nai<e Baye#ian dan S=M memi/i0i a0-ra#i yan. #an.at 2ai0, nam-n a0-ra#i 0/a#i;i0a#i dida#ar0an 1ada :-m/ah contoh 1e/atihan yan. di/a0-0an! )nt-0 mem2-at #e2-ah #i#tem 1e/atihan yan. 2ai0 1er/- menda1at0an contoh4contoh /a2e/ #ecara man-a/, 0em-dian -nt-0 'SI memi/i0i 0e-n..-/an da/am ha/ 1er;orma dan memi/i0i 0e0-ran.an terhada1 1emahaman to1i0 yan. di1e/a:ari da/am 1ro#e# te@t minin.! Sehin..a -nt-0 men-t-1i 0e0-ran.an40e0-ran.an dari a/.oritma diata# di1i/ih a/.oritma yan. men..a2-n.an antara Pro2a2i/i#ti0 dan 'SI yait- a/.oritma Probabilistic Latent Semantic Indexing 7P'SI9! P'SI mer-1a0an #e2-ah tinda0an, metode dan 1ro#ed-r -nt-0 menem-0an 0em2a/i data yan. ter#im1an 2erda#ar0an ma0naCarti #e2-ah 0ata, 0em-dian menyedia0an in;orma#i men.enai #-2ye0 yan. di2-t-h0an! inda0an ter#e2-t menca0-1 text indexing, inquiry analysis, dan rele"ance analysis $Kho%ale and &tique' ()*+,! Metode P'SI yan. identi0 den.an information -etri"al da1at ditera10an 1ada #e2-ah search engine! O/eh 0arena it-, 1ene/itian ini men.an.0at :-d-/ D O(ti)a*i M$*in P$nca#ian (Search Engine) M$n''una&an A%'+#it)a Probabilistic Latent Semantic Indexing (PLSI) ,an Ma(R$,uc$ Pa,a Ja#in'an T$#,i*t#i-u*iE! Dihara10an 1ene/itian ini #e/an:-tnya da1at mem2eri0an 0ontri2-#i nyata da/am menan..-/an.i e;e0 dari a0ti;ita# ter#e2-t!

!".

P$#u)u*an Ma*a%a/ Ba.aimana cara 1enyim1anan data #ecara terdi#tri2-#i 1er/- di inde@

den.an 2ai0 a.ar 1en.o/ahah dan 1encarian 0em2a/i terhada1 dataC;i/e mem2eri0an ha#i/ yan. ce1at dan te1at den.an F-ery 1en..-na! !"0 !"0"! Tu1uan ,an Man2aat P$n$%itian Tu1uan P$n$%itian

-:-an dari 1ene/itian ada/ah #e2a.ai 2eri0-tG

1! Men.o1tima#i me#in 1encarian data yan. terda1at 1ada 0/-#ter 0om1-ter! 2! Mem1ro#e# In;orma#i #ecara 1ara/e/ 1ada 0om1-ter 0/-#ter! ,! Men.inde@in. ;i/e yan. ter#e2ar 1ada media 1enyim1anan yan. ter0/-#ter!

!"0".

Man2aat P$n$%iti

Man;aat dari 1ene/itian ada/ah #e2a.ai 2eri0-tG 1! Mem2eri0an ha#i/ 1encarian /e2ih ce1at dan te1at terhada1 data yan. diin.in0an o/eh 1en.-na! 2! Mem2-at #i#tem yan. mam1- mem1emro#e#an in;orma#i #ecara 1ara/e/! ,! Da1at menan.ani data yan. 2er#i;at structure dan unstructure den.an :-m/ah dan -0-ran yan. #an.at 2e#ar!

!"3

K+nt#i-u*i P$n$%itian &ontri2-#i 1ene/itian ini ada/ah mem1er/a0-0an Bi.Data -nt-0 diinde0#,

di#im1an, diana/i#i# dan di<i#-a/i#a#i0an a.ar 0eti0a 1-2/i0 men.e0#tra0#i in;orma#i ter#e2-t #e#-ai den.an 0e2-t-han 1en..-na!

BAB . DASAR TEORI


."! Bi'Data

Pada tah-n 2000 di1er0ira0an tota/ data di.ita/ yan. ter#im1an di#e/-r-h d-nia #e2e#ar 800!000 1enta2yte 7PB9, #e:a0 #aat it- ter-# menin.0at hin..a 1ada tah-n 200> tercatat 0!18 6etta2yte 78B9 dan 1ada tah-n 2012 tercatat #e2e#ar 2!5 8B, 1ara 1ene/iti internet mem1redi0#i 1er0em2an.an data4data te#e2-t a0an menca1ai ,5 8B 1ada tah-n 2020! Ha/ ter#e2-t mem-n.0in0an 0arena 2e2era1a contoh 1en.ha#i/ 0onten di.ita/ yan. 1a/in. dominan #aat ini yan. #erin. di.-na0an #e1erti t$itter men.ha#i/0an /e2ih dari 5 tera2yte 7 B9 data #etia1 hari, ;ace2oo0 10 B dan 2e2era1a 1er-#ahaan /ainnya men.ha#i/0an #at-an tera2yte data #etia1 :am #etia1 hari #e1an:an. tah-n7"hri# Eaton et a/!, 2012? ID", 20119! *enomena ter#e2-t diidenti0an den.an Bi.Data, Bi.Data mer-1a0an data 2er-0-ran ra0#a#a yan. <o/-menya ter-# 2ertam2ah, terdiri dari 2er2a.ai :eni# ata- <arieta# data, ter2ent-0 #ecara ter-# mener-# den.an 0ece1atan tertent- dan har-# di1ro#e# den.an 0ece1atan tertent- 1-/a! Bi.Data ada/ah "olume, "elocity dan "ariety

.".

M$*in P$nca#ian (Search Engine) ren 'eda0an in;orma#i yan. di#e2-t den.an Bi.Data menye2a20an user

diinternet a0an men.a/ami 0e#-/itan menda1at0an in;orma#i yan. ce1at, dan re/e<an den.an 0e2-t-hannya! )nt-0 men.ata#i ha/ ter#e2-t di1er/-0an #-at#i#tem 1encarian! Me#in 1encarian 1ada 1rin#i1nya ada/ah #-at- #i#tem yan. a0an mem;orm-/a#i0an #e2-ah request ata- query terhada1 #e0-m1-/an do0-men yan. men.and-n. in;orma#i4in;orma#i! (a$a2an dari reF-e#t ter#e2-t ada/ah #e0-m1-/an do0-men yan. re/e<an dan mem2-an. do0-men yan. tida0 re/e<an! Secara matemati# ha/ ter#e2-t da1at dit-/i#0an #e2a.ai 2eri0-t 7 onni Sina.a, 20089G

%e#1on Me#in Pencarian &eteran.an G H I H-ery D I Do0-men n I (-m/ah do0-men 2nI Him1-nan 2a.ian dari do0-men yan. ditem-0an Search engine didi#ain -nt-0 menem-0an in;orma#i 1ada internet, yan. me/i1-ti ha/aman $e2, .am2ar, dan in;orma#i ;i/e /ain 2ah0an ter0adan. ada yan. da1at men..a/i in;orma#i /an.#-n. 0e data2a#e #er<er /ayanan internet 7Don., 20109! Dimana #i#tem ini da1at di2a.i 0eda/am d-a 0ate.ori 2erda#ar0an #-m2er in;orma#inya yait-G 1! .orld /ide Search 0ngine 2! Local Search 0ngine Anatomi Search 0ngine 7S-/ianta, 20089 *1 Cra/ler (1 Spider

+1 Indexer 21 Database 5! -esult 0ngine

."0

Probabilistic Latent Semantic Indexing (PLSI) Probabilistic Latent Semantic Indexing 7P'SI9 ada/ah #e2-ah metode

#tati#ti0 den.an men..-na0an 1ro2a2i/ita# -nt-0 men.ana/i#a 0ata ata- do0-men 7*an. et a/!, 200J? Ho;mann, 1JJJ9! P'SI da1at di.-na0an -nt-0 men.identi;i0a#i 0ata40ata yan. memi/i0i artiCma0na 0em-dian memeta0an 0ata40ata ter#e2-t da/am 2er2a.ai to1i0! Da/am e#i# ini, P'SI di.-na0an -nt-0 men.e/om1o00an 0ata40ata 0e da/am to1i04to1i0 yan. 2e/-m di0etah-i 7 latent9 #ehin..a nantinya da1at di/a0-0an 1en.0/a#teran do0-men 2erda#ar0an to1i04to1i0 yan. di2aha# da/am ma#in.4ma#in. do0-men! P'SI mer-1a0an #a/ah #at- 1en.em2an.an dari metode latent semantic lndexing 7'SI9! Latent Semantic Indexing 7'SI9 ada/ah metode 1en.inde0#an dan 1encarian yan. men..-na0an te0ni0 Singular 3alue Decomposition 7S=D9 -nt-0 men.identi;i0a#i 1o/a h-2-n.an antara i#ti/ah dan 0on#e140on#e1 yan. ter0and-n. da/am #e2-ah te0# yan. tida0 ter#tr-0t-r! 'SI dida#ar0an 1ada 1rin#i1 2ah$a 0ata40ata yan. di.-na0an da/am 0onte0# yan. #ama cender-n. memi/i0i ma0na yan. #ama! Den.an meman;aat0an semantic structure 7#tr-0t-r a#o#ia#i 0ata40ataCterm den.an do0-men9 yan. #ecara im1/i#it terda1at da/am #-atdo0-men, 'SI da1at me/a0-0an 1encarian do0-men4do0-men yan. re/e<an den.an term yan. terda1at da/am F-ery den.an me/a0-0an de0om1o#i#i terhada1 term4doc-ment matri@ men:adi , matri0# #in.-/ar7Ho;mann, 1JJJ9! &em-dian di/a0-0an ran% lo/ering terhada1 0eti.a matri0 ter#e2-t den.an cara menyim1an 2e2era1a ni/ai singular ter2e#ar dan men.a2ai0an #i#anya, #ehin..a dihara10an da1at di1ero/eh #tr-0t-r #emantic yan. #e#-ai! Se1erti di:e/a#0an #e2e/-mnya a/.oritma P'SI, #edi0it 2anya0 ter1en.ar-h o/eh metode 'SA! Nam-n da/am P'SI, terda1at metode 0xpectation 4aximi5ation 7EM9 -nt-0 men.hit-n. 1ro2a2i/ita# to1i0 di da/am do0-men dan 0ata dan 0em-dian di/a0-0an 1er-/an.an #e#-ai :-m/ah itera#i yan. te/ah

10

ditent-0an7Ho;mann, 1JJJ9! Da/am P'SI, matri0# 0em-nc-/an 0ata da/am do0-men :-.a di.-na0an da/am 1erhit-n.an!

."3

Ma(R$,uc$ Ma1%ed-ce ada/ah te0ni0 1emro.raman -nt-0 mem1ro#e# data 2er-0-ran

2e#ar yan. di1ecah men:adi 2e2era1a 2a.ian data yan. :a-h /e2ih /e2ih 0eci/ #ecara terdi#tri2-#i dan 1ara/e/ da/am 0e/om1o0 0om1-ter yan. #a/in. terh-2-n. yan. di#e2-t 0/-#ter 7Dean and Ghema$at, 20109! &/-#ter 0om1-ter me/a0-0an d-a 1ro#e# -tama 1ada ma1red-ce yait- 1ro#e# Ma1 dan 1ro#e# %ed-ce! Pro#e#4 1ro#e# ini didi#tri2-#i0an 0e #etia1 0om1-ter yan. 2erada da/am #-at- 0/-#ter dimana #etia1 an..ota 2e0er:a #ecara 1ara/e/ tan1a #a/in. 2er.ant-n. #at- den.an yan. /ainnya!

aha1an Pro#e# Ma1 dan %ed-ce

Pada 1ro#e# Ma1 di.-na0an -nt-0 men.-m1-/0an in;orma#i dari 1oton.an41oton.an data yan. terdi#tri2-#i da/am tia1 an..ota c/-#ter 0om1-ter!

11

Ha#i/nya di#erah0an 0e1ada 1ro#e# %ed-ce -nt-0 di1ro#e# /e2ih /an:-t! Ha#i/ 1ro#e# %ed-ce mer-1a0an ha#i/ a0hir yan. di0irim 0e 1en..-na! Pada #i#tem 1en.o/ahan data terdi#tri2-#i, 1ro#e#41ro#e# 4ap-educe 1ada cluster #e1erti yan. te/ihat 1ada .am2ar 2eri0-t!

Pro#e# Ma1%ed-ce Pada "/-#ter Saat ini mode/ 1emro.raman 4ap-educe 2anya0 ditera10an o/eh 1er-#ahaan yan. menan.ani 1en.o/ahan data 2e#ar, #e1erti *ace2oo0, Goo./e, IBM, Micro#o;t, +ahoo, dan /ain4/ain! &on#e1 Ma1%ed-ce a$a/nya di0em2an.0an o/eh .oo./e den.an 6oogle 7ile System 7G*S9, &em-dian .oo./e mem2-0a 0on#e1 ter#e2-t 0e1ada 1-2/i0 #ehin..a m-nc-/ 1en.em2an.an4 1en.em2an.an frame/or% yan. #e:eni# den.an memi/i0i 0emam1-an yan. #ama yait- terdi#tri2-#i dan mam1- menanan.i 1er#oa/an Bi.Data, 2anya0 1roye04 1roye0 yan. dirinti# o/eh 2e2era1a <endor 2er0aitan den.an Ma1%ed-ce! Beri0-t 2e2era1a diantaranyaG 1! A1ache Hadoo1 2! "a#cadin. ,! "o-chDB K! IBM Ma1%ed-ce 5! Micro#o;t Dryad

12

>! Pi. 5! S0ynet

13

BAB 0 METODE PENELITIAN


0"! P$#ancan'an Si*t$) Si#tem yan. a0an di2an.-n mer-1a0an #i#tem 1encarian -nt-0 data #it-#

2erita on4/ine internet yan. ada di Indone#ia #e1erti $$$!0om1a#!com atadatasheet yan. di.-na0an o/eh 1ara 1eri#et da/am 2idan. te@t mini. "A"M 7,20K do0-men9, "ISI 71K>0 do0-men9, "%AN 71,J8 do0-men9 dan MED 710,, do0-men9 ! Data yan. di.-na0an 2er-1a te@t t-/i#an! &om1onen -tama yan. di2-t-h0an -nt-0 mem2an.-n #i#tem ini menca0-1 d-a ha/ yait-? 0e2-t-han 1eran.0at 0era# dan 1eran.0at /-na0! P$#an'&at K$#a* 1! &om1-ter #er<er 7Node9 2! &om1-ter "/ient ,! S$itch P$#an'&at Luna& 1! Python 2! (a<a ,! Hadoo1 K! Si#tem O1era#i 'in-@ 5! Si#tem O1era#i Aindo$#

o1o/o.i :arin.an yan. di.-na0an ada/ah ti1e #tar, den.an 2e2era1a 0om1-ter yan. mem2ent-0 0/-#ter, #ecara <i#-a/ to1o/o.i yan. :arin.an 0/-#ter yan. a0an di2an.-n #e1erti 1ada .am2ar ,!1

14

o1o/o.i Si#tem Search En.ine Perancan.an #i#tem search engine me/a/-i 2e2era1a taha1an4taha1an #e2a.ai 2eri0-t

Dia.ram 2/o0 1ene/itian

15

0". A#*it$&tu# M$*in P$nca#ian Si#tem di2a.i men:adi ti.a #i#tem, yait- Cra/ler dan Spider, Indexer, Database, dan -esult 0ngine! 1! Ae2 Cra/ler L Spider Ae2 cra/ler ada/ah #e2-ah 1ro.ram otomati# yan. men.-n:-.i /in0 1ada $e2#ite, #edan.0an $e2 spider ada/ah 1eran.0at /-na0 yan. me/a0-0an #cannin. do0-men4do0-men ata- mendo$/oad ha/aman $e2#ite 0em-dian menam2ah0annya 1ada inde0# terhada1 /in0 yan. dima0#-d

"ara 0er:a cra$/er dan #1ider 2a.ian in;orma#i yan. diam2i/ o/eh $e2 spider ada/ah 2a.ian dari #e2-ah $e2#ite yan. da1at mere1re#enta#i0an in;orma#i yan. ter0and-n. dari ha/aman ter#e2-t, yait- title page, meta description, url, dan i#i ha/aman!

16

am1i/an #e2-ah $e2#ite a1 Title Page Title page ada/ah :-d-/ dari $e2#ite yan. #edan. di2-0a o/eh $e2 spider

&ode $e2 tit/e 1a.e b1 4eta Description 4eta description ada/ah #a/ah #at- e/emen htm/ ata- @hm/ yan. memi/i0i ;-n.#i mem2eri0an .ari# 2e#ar i#i ha/aman $e2!

17

&ode $e2 Meta De#cri1tion c1 8niform -esource Locator )ni;orm %e#o-rce 'ocator 7)%'9 ada/ah ran.0aian 0ara0ter men-r-t #-at- ;ormat #tandar tertent-, yan. di.-na0an -nt-0 men-n:-00an a/amat #-at- #-m2er #e1erti do0-men dan .am2ar M diInternet!

)r/ yan. a0an di cra$/er d1 I#i Ha/aman I#i ha/aman $e2 ada/ah 2a.ian yan. men.and-n. in;orma#i yan. a0an di#am1ai0an o/eh 1en-/i# 0e 1em2aca!

18

&ode I#i ha/aman $e2 0om1a# (1 Indexer Pada 1ro#e# inde@in. me/i2at0an #e2-ah metode parsing! Parsing ada/ah #-at- cara memecah4mecah #-at- ran.0aian ma#-0an 7do0-men9 yan. a0an men.ha#i/0an #-at- parse tree yan. a0an di.-na0an 1ada taha1 0om1i/a#i 2eri0-tnya yait- ana/i#i# #emanti0! aha1an4taha1an yan. di/a0-0an yaita! o0eni#a#i -nt-0 men.am2i/ 0ata40ata 1entin., den.an mem2-an. 0ata40ata yan. tida0 memi/i0i ma0na 7#top $ord9 dan tanda 2aca 0ata40ata yan. ter#i#a ini nantinya a0an di1ro#e# /e2ih /an:-t yait1erhit-n.an ;re0-en#i ma#in.4ma#in. 0ata da/am do0-men

2! Per-2ahan &ata 0e 2ent-0 da#ar Per-2ahan 0ata 0e da/am 2ent-0 da#arnya men..-na0an metode #temmin., 1en.hi/an.an im2-han 1ada 0ata yan. 2ert-:-an -nt-0 0e2ent-0 da#ar 0ata, ha/ ini di1er/-0an da/am ran.0a mered-0#i dimen#i matri0# term4;re0-en#i! Den.an di/a0-0annya #temmin., 0ata40ata den.an 2ent-0 yan. 2er2eda nam-n memi/i0i 0ata da#ar yan. #ama da1at di:adi0an #at- 0ata #a:a! Setia1 term yan. te/ah

19

di1ero/eh a0an dicoco00an den.an 0ata 1ada ma#in.4ma#in. do0-men #ehin..a dida1at0an :-m/ah 0em-nc-/an tia1 0ata 1ada ma#in.4ma#in. do0-men c! Pro#e# #e/an:-tnya ada/ah men.hit-n. 0em-nc-/an #etia1 0ata da/am ma#in.4ma#in. do0-men!

d! P'SI da1at di.-na0an -nt-0 men.identi;i0a#i 0ata40ata den.an 2e2era1a arti dan 0em-dian memeta0an 0ata40ata ter#e2-t da/am 2er2a.ai to1i0! P'SI di.-na0an -nt-0 a1/i0a#i tem- 0em2a/i in;orma#i! P'SI erat h-2-n.an den.an Sin.-/ar =a/-e Decom1o#ition 7S=D9! Se2-ah Matri@ dimen#i m@n di1ecah men:adi , 2-ah matri0 2ar- yait- matri0 ) den.an dimen#i m@n, matri0 S den.an dimen#i m@n, dan matri0 = den.an dimen#i n@n! ) ada/ah matri0# den.an 0o/om ortonorma/ yan. ni/ai4ni/ainya di1ero/eh dari 1 di2a.i ei.en <a/-e dan di0a/i ei.en <e0tor dari B! S ada/ah matri0# 2er-0-ran m@n yan. -n#-r4-n#-r dia.ona/nya mer-1a0an ni/ai a0ar ei.en <a/-e dari B! = ada/ah 0o/om ortonorma/ yan. men.and-n. ni/ai4ni/ai ei.en <e0tor dari B! &em-dian ha#i/ S=D di1eta0an men:adi 2 dimen#i, yan. da1at men-n:-0an h-2-n.an #e2-ah 0ata den.an do0-men #ehin..a do0-men di0/-#ter men..-na0an 2ent-0 h-2-n.an ter#e2-t #ete/ah it- da1at di/a0-0an 1e/a2e/an to1i0 1ada do0-men

+1 Database Pro#e# ini mer-1a0an 1ro#e# yan. dimana ter:adi 1ro#e# 1encarian data 1ada 2er0a#42er0a# yan. te/ah di#im1an dimana 1ro#e# 1encarian ter#e2-t har-# ce1at a.ar in;orma#i yan. diin.in0an o/eh client ter#a:i den.an ce1at :-.a! Pada taha1an ini di.-na0an te0ni0 1emro.raman den.an 1emro#e#an data #ecara 1ara/e/ den.an men..-na0an 1ro#e# Ma1%ed-ce! Pro#e#

20

Ma1%ed-ce ter:adi #ete/ah #i#tem 2erha#i/ men.-rai0an 0a/imat dari 1ertanyaan yan. dima#-00an o/eh 1en..-na! Sete/ah #i#tem men.erti do0-men den.an 0ara0teri#ti0 a1a #a:a yan. dian..a1 #e#-ai, ma0a 1ro#e# 1encarian data da1at di/a0-0an! Si#tem 1encarian 2er:a/an den.an ma#-00an 2er-1a %ey/ord yan. a0an di/a0-0an 1ro#e# 1encarian! Sete/ah it- 1ro#e# di2a.i 0eda/am 2e2era1a 1ro#e# yan. /e2ih #1e#i;i0 dimana 1ro#e# ter#e2-t dinama0an Ma1, 1ada 1ro#e# Ma1 ter#e2-t, di/a0-0an 1encarian terhada1 data 2er0a# yan. terda1at 1ada data2a#e den.an 0riteria yan. te/ah dima#-00an o/eh c/ient! Setia1 1ro#e# 1encarian yan. di/a0-0an 1ada 1ro#e# Ma1 a0an di .a2-n.0an da/am 1ro#e# %ed-ce den.an 2e.it- da1at mem1erce1at 1ro#e# 1encarian #e/an:-tnya 1ro#e# %ed-ce a0an mem2eri0an o-t1-t terhada1 1encarian yan. te/ah di/a0-0an!

K! %e#-/t En.ine Menam1i/0an ha#i/ 1encarian, 1ada 2a.ian ini #i#tem menam1i/0an #e/-r-h ha#i/ in;orma#i yan. dida1at da/am 1ro#e# 1encarian!

21

Si#tem #earch en.ine den.an Ma1%ed-ce

BAB 3 HASIL 4ANG DIHARAPKAN


Ha#i/ yan. dihara10an 1ada 1ene/itian ada/ah #i#tem mam1-

men.o1tima#i me#in 1encarian data yan. terda1at 1ada 0/-#ter 0om1-ter den.an mem1ro#e# in;orma#i #ecara 1ara/e/ 1ada #etia1 an..ota 0/-#ter #ehin..a #etia1 c/ient search engine men.in1-t0an query 1ada #i#tem da1at mem2eri0an ha#i/ yan. /e2ih ce1at dan a0-ra#i 1encarian yan. /e2ih 2ai0!

22

BAB 5 JAD6AL PENELITIAN


Peni/itian me/i1-ti #t-di /iterat-r, 1erancan.an #i#tem, 1em2-atan #i#tem, -:i co2a #i#tem, ana/i#a #i#tem, 1-2/i0a#i, dan 1en-/i#an 2-0- te#i#! %encanan 1ene/itian 1ada tah-n 201, ter#a:i 1ada a2e/ 5!1!

(ad$a/ Pene/itian

23

DA TAR PUSTAKA
"hri# Eaton, om De-t#ch, Dir0 Deroo#, Geor.e 'a1i#, Pa-/ 8i0o1o-/o#, 2012! IBMG )nder#tandin. Bi. Data A/aytic# ;or Eter1ri#e "/a## Hadoo1 and Streamin. Data! Mc Gra$hi//, Ne$ +or0! Dean, (!, Ghema$at, S!, 2010! Ma1%ed-ceG a ;/e@i2/e data 1roce##in. too/! "omm-n! A"M 5,, 52M55! Don., H!, 2010! Search4En.ine4Oriented heme "ra$/er De#i.n, inG 2010 Internationa/ "on;erence on Sy#tem Science, En.ineerin. De#i.n and Man-;act-rin. In;ormati6ation 7I"SEM9! Pre#ented at the 2010 Internationa/ "on;erence on Sy#tem Science, En.ineerin. De#i.n and Man-;act-rin. In;ormati6ation 7I"SEM9, 11! ,0,M,0>! E0o &-rnia$an &hannedy, 2010! Penera1an Mode/ Pemro.raman Ma1%ed-ce Pada Si#tem Pencarian Mi/i# 'in-@ Di Indone#ia! )ni<er#ita# &om1-ter Indone#ia, Band-n.! *an., B!, Biao.-an., '!, H-an, H!, 200J! "om1ari#on Pro2a2i/i#tic 'atent Semantic Inde@in. Mode/ In "hine#e In;ormation %etrie<a/, inG Internationa/ *or-m on In;ormation echno/o.y and A11/ication#, 200J! I*I A N0J! Pre#ented at the Internationa/ *or-m on In;ormation echno/o.y and A11/ication#, 200J! I*I A N0J, 11! 55JM5>2! Ho;mann, !, 1JJJ! Pro2a2i/i#tic /atent #emantic inde@in., inG Proceedin.# o; the 22nd Ann-a/ Internationa/ A"M SIGI% "on;erence on %e#earch and De<e/o1ment in In;ormation %etrie<a/, SIGI% NJJ! A"M, Ne$ +or0, N+, )SA, 11! 50M55! ID", 2011! ID" Predict# 2012 Ai// Be the +ear o; Mo2i/e and "/o-d P/at;orm Aar# a# I =endor# =ie ;or 'eader#hi1 Ahi/e the Ind-#try %ede;ine# It#e/; OAAA Doc-mentP! he Premier G/o2a/ Mar0et Inte//i.ence *irm! )%' htt1GCC$$$!idc!comC.etdoc!:#1QcontainerIdI1r)S2,155K11 &ho0a/e, %!, AtiF-e, M!, 201,! Inte//i.ent Nat-ra/ 'an.-a.e Inter;ace ;or $e24 2a#ed in;ormation retrie<a/, inG 201, Internationa/ "on;erence on In;ormation "omm-nication and Em2edded Sy#tem# 7I"I"ES9! Pre#ented at the 201, Internationa/ "on;erence on In;ormation "omm-nication and Em2edded Sy#tem# 7I"I"ES9, 11! 25M2J! S-/ianta, *!, 2008! Goo./in. +o-! E/e@ Media &om1-tindo, (a0arta! onni Sina.a, 2008! Search En.ine *i/e Hy1erte@t Ber2aha#a Indone#ia Di Ba1e#ite/da Pemerintah Pro<in#i (a$a Barat! )ni<er#ita# &om1-ter Indone#ia, Band-n.!

24

Das könnte Ihnen auch gefallen