TEKNIK
EVALUASI
Evaluasi adalah suatu tes atas tingkat
penggunaan dan fungsionalitas system yang dilakukan di dalam laboratorium, di
lapangan, atau di dalam kolaborasi dengan pengguna. Yang dievaluasi pada
interaksi manusia dan komputer adalah desain dan implementasinya. Evaluasi
sebaiknya dilakukan dengan mempertimbangkan semua tahapan siklus hidup desain.
Evaluasi
memiliki tiga tujuan utama, yaitu :
1. Melihat seberapa
jauh system berfungsi
Mencakup kesesuaian
penggunaan system terhadap harapan user pada tugas tersebut. Evaluasi pada
tahap ini meliputi pengukuran unjuk kerja dari user pada system, untuk melihat
keefektifan system dalam mendukung tugas.
2. Melihat efek
interface bagi pengguna
Mencakup aspek dari
kemudahan system dipelajari, daya guna dan perilaku user.
3. Mengidentifikasi
problem khusus yang terjadi pada system
Ketika penggunaan suatu
konteks memberikan hasil yang tidak diinginkan, atau terjadi kekacauan di
antara user. Tujuan ini merupakan aspek negatif dari desain.
Ada dua jenis evaluasi.
1.
Dalam kondisi percobaan (Laboratory) : Pengujian system ini
dilakukan pada ruang percobaan dengan beberapa kondisi diantaranya :
a. Laboratorium yang
bagus biasanya memiliki fasilitas perekaman audio/visual yang baik, cermin dua
arah, komputer beserta perlengkapannya yang mungkin tidak ada pada lokasi kerja
yang sebenarnya.
b. Operator terbebas
dari gangguan yang menghambat pekerjaan.
c.
Beberapa situasi
hanya dapat dilakukan di laboratorium, misalnya system yang akan digunakan
ditempatkan pada lokasi yang berbahaya atau terpencil.
d. Dapat memanipulasi
situasi untik memecahkan masalah dan melihat penggunaan presedur atau
membandingkan beberapa alternatif perancangan dengan situasi yang sebenarnya.
e.
Situasi pada laboratorium tidak dapat menggambarkan situasi
ruang kerja yang sebenarnya dan terdapat orang-orang yang tidak bisa bekerja
pada kondisi seperti di laboratorium.
2.
Dalam kondisi lokasi kerja yang sebenarnya : Pengguna
pengujian system ini pada lokasi kerja sebenarnya mempunyai beberapa kondisi,
di antaranya :
a. Tingkat gangguan
yang melebihi ambang batas, tingkat pergerakan yang tinggi dan interupsi yang
tetap, seperti panggilan telepon yang menyebabkan observasi ini sulit
dilakukan.
b. Situasi yang lebih
“terbuka” antar system dan pengguna.
c.
Aneka gangguan yang terjadi pada lokasi ini digunakan
sebagai situasi yang mewakili situasi sebenarnya.
Ada beberapa pendekatan evaluasi yang
dilakukan seperti :
1. Evaluating designs
2. Evaluating
implementations
3. Query techniques
4. Physiological
methods
EVALUASI DESAIN
Evaluasi
ini dilakukan setelah proses perancangan. Evaluasi desain terdiri dari
1.
Cognitive Walkthrough
Bertujuan untuk mengevaluasi
perancangan dengan melihat seberapa besar dukungan yang diberikan ke pengguna
guna memelajari berbagai tugas yang diberikan. Pendekatan ini dikemukakan oleh
Polson. Dalam pendekatan ini terdapat beberapa isu yang timbul, seperti :
a. Dampak interaksi
apakah yang akan terjadi pada pengguna ?
b. Proses kognitif
apakah yang dibutuhkan ?
c.
Masalah pembelajaran apakah yang mungkin terjadi?
Informasi yang dibutuhkan :
a. Deskripsi dari
interface yang dibutuhkan itu.
b.
Deskripsi tugas,
termasuk usaha yang benar untuk melakukannya dan struktur tujuan untuk
mendukungnya.
Langkah walkthrough :
a. Pilih tugas,
b.
Deskripsi tujuan
awal dari user,
c.
Lakukan
kegiatan/aksi yang tepat,
d. Analisis proses
keputusan untuk setiap kegiatan.
Contoh
:
Memprogram
video dengan remote control. Misalkan akan memprogram video ke waktu dimulai
dari jam 18.00 dan berakhir pada jam 19.15 pada saluran 4 pada tanggal 4. Maka
tugas untuk hal tersebut adalah
a. Set waktu awal
b. Set waktu akhir
c.
Set channel
d. Set tanggal
2.
Evaluasi Heuristik
Evaluasi ini diusulkan oleh
Nielsen dan Molich. Heuristik adalah guideline, prinsip umum dan peraturan,
pengalaman yang bisa membantu suatu keputusan atau kritik atas suatu keputusan
yang telah diambil, beberapa penilaian bebas terhadap suatu design supaya
kritik bisa memajukan potensi daya guna.
Ada sepuluh dasar dari
heuristik, seperti :
a. Visibilitas status
system,
b. Kecocokan anatara
system dan dunia nyata,
c.
Kontrol user dan kebebasan,
d. Konsisten dan
standar
e.
Pencegahan kesalahan
f.
Pengenalan atas penarikan kembali
g. Fleksibilitas dan
efisiensi
h. Berhubungan dengan
keindahan dan desain minimalis
i.
Bantuan bagi user untuk mengenali, mendiagnosis dan
memperbaiki dari kesalahan,
j.
Help dan dokumentasi.
Tujuan dari evaluasi
heuristik adalah untuk memperbaiki perancangan secara efektif. Pendekatan ini
mudah dan relatif cepat.
3.
Evaluasi Berbasis Tinjauan
Evaluasi antara
psikologi eksperimen dengan interaksi manusia dan komputer membuahkan hasil
eksperimen yang baik dan pengalaman yang nyata. Misalnya pada daya guna dari
tipe menu yang berbeda, pemanggilan nama perintah dan pemilihan ikon.
4.
Model Evaluasi Dasar
Pendekatan terakhir untuk
mengevaluasi perancangan adalah dengan mengombinasikan spesifikasi perancangan
dan evaluasi ke dalam kerangka kerja yang sama. Contoh GOMS model, keystroke level model dan design
rationale.
Evaluasi Implementasi
Evaluasi
system akhir dengan pengguna nyata untuk mendapatkan suatu system yang
betul-betul baik. Evaluasi implementasi membutuhkan sebuah artefak, prototype
dan implementasi penuh. Ada tiga pendekatan dari evaluasi implementasi, seperti
empiris (teknik percobaan), metode observasi dan metode query (menanyakan user
untuk mendapatkan umpan balik).
EVALUASI EKSPERIMEN
Merupakan metode klasik dengan
pendekatan statistik. Faktor-faktor eksperimental seperti :
1. Subjects : siapa
merepresentasikan, ketercukupan contoh.
a. Pemilihan subjek
b. Harus setepat
mungkin dengan keinginan user.
c.
Subjek yang dipilih
harus sama usia dan tingkat pendidikannya sesuai dengan kelompok user yang dimaksud
d. Ukuran sample yang
dipilih kebanyakan ditentukan dengan pertimbangan pragmatis, kehandalan user
yang terbatas juga harus cukup besar untuk mewakili populasi yang diambil dalam
eksperimen perancangan dan metode statistika yang dipilih.
2.
Variabel : Sesuatu
untuk dimodifikasi dan ukuran
a. Variabel
independen : Karakteristik suatu eksperimen manipulasi untuk menghasilkan
kondisi yang berbeda sebagai perbandingan. Contoh : Jenis interface, level dari
help, jumlah item menu dan perancangan ikon.
b. Variabel
dependen : Variabel yang dapat diukur dalam eksperimen. Contoh variable
independen adalah kecepatan dari pemilihan menu.
3.
Hipotesis : apa yang
ingin ditunjukkan
a. Merupakan
prediksi yang dihasilkan dalam eksperimen.
b. Masih
menggunakan variable independen dan dependen akan menyebabkan perbedaan pada
variable dependen.
c. Untuk
menunjukkan bahwa perkiraan benar dengan menyangkal adanya hipotesis null yang
menyatakan bahwa tidak ada perbedaan dalam variable.
d. Nilai
hasil dapat dibandingkan dengan tingkat kepercayaan.
4. Desain eksperimental :
bagaimana cara melakukannya.
a. Between-Groups
(Randomized)
§ Masing-masing
subjek diberi kondisi yang berbeda
§ Keuntungan
perancangan ini adalah setiap user menghasilkan satu kondisi
§ Kerugiannya
adalah dengan semakin banyaknya jumlah subjek yang tersedia maka akan
menyebabkan hasilnya berkurang dan perbedaan antar setiap individu akan membuat
hasilnya menjadi bias.
b.
Within-Groups
1.
Setiap user akan
menampilkan kondisi yang berbeda
2.
Jumlah user yang
tersedi lebih sedikit.
3.
Pengaruh dari subjek
lebih sedikit.
Variabel yang digunakan
terbagi dalam :
1.
Variabel diskrit :
Menggunakan jumlah yang terbatas dari suatu nilai atau tingkatan. Contoh, warna
layar monitor, yakni merah, hijau atau biru.
2.
Variabel kontinu :
Menggunakan jumlah berapapun (batas atas maupun bawah). Contoh : Ketinggian
seseorang atau waktu yang diperlukan untuk menyelesaikan pekerjaan.
Analisis Data
Data terdiri dari dua jenis, yaitu diskrit
(jumlah terbatas dari nilai-nilai) dan
kontinu (sembarang nilai).
Pada system data
terdapat tiga jenis tes, yaitu :
1.
Parametrik
diasumsi berdistribudi normal data
tetap dapat bekerja serta berdayaguna
dalam berbagai kondisi.
2.
Non-parametrik
distribusinya
diasumsikan tidak berdistribusi normal, kurang berdayaguna tetapi lebih handal.
3.
Tabel kontingensi
klasifikasi
data dengan atribut-atribut diskrit dan menghitung jumlah item data dalam
setiap kelompok.
Tes parametrik dan non-parametrik ditunjukkan
untuk hal-hal berikut :
1.
Informasi apa yang
dibutuhkan untuk analisis data?
2. Adakah perbedaan pada
setiap data?
3.
Seberapa besar
perbedaannya?
4.
Seberapa akurat
taksirannya?
Contoh
:
Kondisi
A : 33,42,25,79,52
Kondisi
B : 87, 65,92,93,91,55
Setelah
diurut mulai 25,33,42,….,92,93 dan kemudian diranking maka 25 jadi 1, 33 jadi
2, dan seterusnya.
Kondisi A : 2,3,1,7,4 =
5 digit
Kondisi B : 8,5,10,11,9,5
= 6 digit
Dengan tes Wilcoxon, setiap kondidi dijumlah rankingnya
kemudian dikurangi dengan nilai terkecilnya sehingga didapatkan nilai statistik
U-nya :
Konsisi
A : 1+2+3+4+5 = 15
Kondisi
B : 1+2+3+4+5+6 = 21
Rank
sum Smallest U
Kondisi
A : (2+3+1+7+4) = 17 - 15 =
2
Kondisi
B : (8+6+10+11+9+5) = 49 - 21 = 28
Ternyata
jumlah dari kedua statistik U tersebut, 2 + 28 = 30, merupakan perkalian dari
jumlah nilai dari masing-masing kondisi 5 X 6.
Studi
Eksperimental pada Grup
Bebarapa masalah yang
timbul yaitu :
1. Subject group : Jumlah
subjek lebih banyak, waktu yang dibutuhkan lebih lama karena munculnya banyak
variasi dan sulit untuk menjadwal anggota grup yang ada.
2.
Task : Harus saking
menyemangati dan kerjasama.
3.
Data gathering : Data
yang dimiliki oleh setiap kelompok berbeda masalah seperti sinkronisasi, volume
tipis dan sebagainya.
4.
Analisis : Waktu
melakukan analisis dari suatu percobaan terdapat banyak variasi dari setiap
anggota group.
TEKNIK OBSERVASI
Think Aload
Menjelaskan apa yang mereka percaya terjadi,
mengapa mereka mengambil tindakan, apa yang mereka coba kerjakan. Think aload
mempunyai keuntungan, yakni sederhana, membutuhkan sedikit pengetahuan untuk
menampilkannya, dan menyediakan pengertian yang berguna dengan interface. Juga
dapat digunakan untuk mengobservasi bagaimana system digunakan.
Evaluasi Kooperatif
User bekerja sama dalam melakukan evaluasi, di
mana baik user maupun evaluator dapat saling memberikan pertanyaan.
Keuntungannya, seperti lebih sedikit batasannya dan mudah untuk digunakan, user
didorong untuk mengkritisi system dan memungkinkan klafifikasi.
Analisis Protokol
Merupakan metode untuk merekam aksi-aksi
yang dilakukan dengan menggunakan beberapa peralatan seperti :
1.
Kertas dan
pensil : Murah tetapi dibatasi oleh kecepatan dalam menulis.
2.
Auto recording :
Baik untuk pertimbangan yang lebih seksama dan sulit untuk mencocokkan dengan
protokol lain.
3.
Video recording
: Lebih akurat dan realistis menggunakan dua peralatan, yang satu mengarah ke
komputer dan yang satu lagi ke user.
4.
Computer logging
: Dilakukan secara otomatis oleh komputer, tetapi data yang ada terlalu besar
dan perlu keahlian khusus untuk melakukan analisis.
5. Notebook : User
menyimpan semua aktivitas dan problem dalam notebook evaluator.
Biasanya untuk merekam aksi-aksi yang
dilakukan user digunakan lebih dari satu protokol, karena jika hanya
menggunakan satu protokol saja maka akan sulit untuk mendapatkan masalahnya
secara benar. Misalnya meski sudah menggunakan video recording, perlu juga
menggunakan kertas untuk mencatat permasalahan secara lebih detail.
Beberapa peranti pembantu secara
otomatis telah tersedia, misalnya EVA (Experimental Video Annotator) yang
merupakan suatu system prototype yang berjalan pada multimedia workstation yang
dihubungkan langsung ke video recorder. Contoh : Workplace Project pada Xerox
PARC.
Post-Task Walkthrough
Sering data didapat melalui observasi
langsung tanpa interpretasi. Walkthrough dibuat untuk mengatasi masalah
tersebut dengan merefleksikan kembali ke subjek aksi mereka setelah event.
Apakah ditulis atau direkam, diputar kembali ke subjek untuk memberikan
komentarnya atau langsung ditanya oleh analis. Keuntungannya adalah bahwa
analis memiliki waktu untuk membuat pertanyaan yang sesuai dan focus pada aksi
khusus.
TEKNIK QUERY
Ada dua tipe teknik query :
1.
Wawancara
Merupakan suatu analisis yang dilakukan dengan menanyai user satu demi
satu, biasanya berdasarkan pertanyaan-pertanyaan yang telah disiapkan sebelum
wawancara dilakukan. Kelebihan
dari metode ini adalah bahwa pertanyaan dapat divariasikan sesuai konteksnya.
Isu dapat dieksplorasi lebih jauh dan pandangan user bisa diperoleh dan
permasalahan tak terantisipasi dapat dikenali.Kekurangannya adalah sangat
subjektif dan memakan waktu yang lama
2. Kuesioner
Kuesioner merupakan
sekumpulan pertanyaan yang sudah pasti yang diberikan kepada pengguna.
Kelebihannya, cepat dan dapat mencapai kelompok pengguna yang besar dan dapat
dianalisis lebih teliti. Kelemahannya, kurang fleksibel dan kurang teliti (faktor
waktu dan pekerjaan user)
Gaya pertanyaan yang umum digunakan
untuk suatu kuesioner :
1. Umum : Pertanyaan
untuk mengetahui latar belakang user dan memasukkannya ke dalam subjek
populasi.
2. Open-ended :
pertanyaan yang membutuhkan jawaban atau opini sendiri, berguna untuk
mengumpulkan informasi subjektif secara umum tetapi sulit untuk dianalisis.
3. Skala : user
diminta memutuskan pertanyaan tertentu berdasarkan skala angka, biasanya
berhubungan dengan setuju atau tidak setuju terhadap pertanyaan.
4. Pilihan ganda :
Responden diberikan pilihan respon secara eksplisit dan hanya boleh memilih
satu atau sebanyak yang diperlukan.
Misal :
software apa yang pernah anda gunakan?
Pengolahan kata
Basis data
Spreadsheet
System pakar
System help online
Kompilator
5. Ranking :
Mengurutkan item dalam daftar dan berguna untuk mengindikasikan preferensi
user.
Untuk
mengurangi kesalahan dari responden, sebaiknya digunakan pertanyaan tertutup
seperti pertanyaan scalar, ranking atau pilihan ganda.
Metode
Fisiologis
Metode ini membutuhkan alat deteksi yang
dirancang untuk mengetahui gerak mata user, tekanan darah, perubahan suhu tubuh
dan sebagainya. Dengan menempatkan alat-alat khusus pada tubuh user, evaluasi
dari suatu desain dapat dilakukan secara otomatis. Data yang
terkumpul dapat dianalisis setelah user selesai menguji suatu program.
Kekurangan dari metode ini adalah alat khusus yang dgunakan sangat mahal
harganya dan hasil yang diberikan tidak begitu akurat karena bergantung desain
dan program dari alat tersebut.
Pemilihan
Metode Evaluasi
Ada 8
faktor yang membantu kita dalam memilih teknik yang sesuai, yaitu :
1. Tingkat siklus
2. Jenis evaluasi
3. Tingkat
objektivitas dan subjektivitas
4. Jenis ukuran yang
tersedia
5. Informasi yang
tersedia
6. Kesiapan dari suatu
respons
7. Tingkat gangguan
yang tidak secara langsung
8. Sumber yang
tersedia
a. Design VS.
Implementation
Evaluasi pada tingkat perancangan hanya
membutuhkan ahlinya dan akan dianalisis sedangkan evaluasi pada tingkat
implementasi menjadikan user sebagai subjek eksperimen.
b. Laboratory VS. Field
studies
Secara ideal proses perancangan mencakup
dua jenis evaluasi ini di mana pada aktivitas di laboratorium merupakan awal
tingkatan sedangkan studi lapangan ditempatkan pada tingkat implementasi.
c.
Subjektif VS. Objektif
Teknik yang subjektif, seperti pada
cognitive walkthrough maupun think about, memercayakan hasilnya pada evaluator
atau orang yang melakukan evaluasi. Teknik objektif seharusnya memberikan hasil
yang berulang yang tidak tergantung pada evaluator. Eksperimen yang terkontrol
merupakan contoh pengukuran objektif. Idealnya pengukuran subjektif dan
objektif sama-sama harus dilakukan.
d. Qualitative VS.
Quantitative measures
Pengukuran menggunakan numerik lebih
mudah dilakukan daripada dengan teknik statistik sedangkan pengukuran
non-numerik lebih sulit dilakukan namun akan menghasilkan sesuatu yang penting
secara lebih lengkap.
e.
Informasi yang tersedia
Tingkatan informasi yang tersedia untuk
evaluator pada setiap tingkat proses perancangan dimulai pada informasi yang
rendah sampai dengan tingkatan yang tinggi.
f.
Kesiapan suatu tindakan
Seperti metode think aloud yang merekam
perilaku user pada waktu interaksi, sedangkan pada post task walkthrough
memercayakannya pada pengumpulan kembali kegiatan user.
g. Intrusiveness
Merupakan teknik yang menghasilkan
pengukuran segera yang dihasilkan user selama interaksi dan mempunyai risiko
akan memengaruhi perilaku user.
h. Sumber-sumber
Hal terakhir yang perlu diperhatikan
adalah peralatan, waktu, biaya, subjek serta evaluator yang ahli.
Tidak ada komentar:
Posting Komentar