Tutorial

Regression Analysis Statistics

Persamaan regresi pada grafik scatter merupakan informasi yang cukup berguna, namun persamaan tersebut belum menjelaskan apakah regresi tersebut signifikan secara statistik. Maka terdapat dua hipotesis yang dapat dipilih:

Ha: tidak ada hubungan linier antara variabel terikat (Y) dengan variabel bebas (X).
Ho: terdapat hubungan linier antara variabel terikat (Y) dengan variabel bebas (X).

Hubungan linier yang diuji adalah dalam bentuk persamaan regresi. Untuk analisis regresi tersebut, dibutuhkan Analysis Toolpak yang terdapat di Excel. Bagi pembaca yang belum mengaktifkan program add ins Analysis Toolpak, dapat dilihat pada Tutorial sebelumnya.

Bagaimana langkah analisis statistik regresi:
1. Membuat worksheet yang akan dilakukan analisa regresi.
2. Klik Analysis Data pada group tab Data yang berada di menu bar.
3. Scroll ke bawah dan pilih Regression kemudian klik OK.
4. Pada kotak input Y, masukkan cel data C1 : C17, sedangkan pada kotak input X masukkan cel data B1 : B17.
5. Karena pada cel awal data merupakan teks label, maka pilih Labels pada cekbox.
6. Klik pilihan New Worksheet Ply dan tuliskan Statistik Regresi pada kotak dialog.
7. Klik semua cekbox pada kotak dialog Residual
8. Kemudian klik OK.




Apabila seluruh langkah 1 hingga 8 telah dikerjakan, maka tabel hasil akan muncul seperti pada gambar berikut ini.



Input tersebut dapat dibagi ke dalam 6 area; yaitu 1). Statistik regresi, 2). Analisis variansi (ANOVA), 3). Nilai estimasi parameter , 4) nilai sisa (residual), 5). Probabilitas output, 6). Grafik plotting.


Bagaimana interpretasi hasil Statistik Regresi:



Multiple R. Nilai multiple R adalah sama dengan akar dari R2, menunjukkan tingkat keeratan hubungan linier antara variabel terikat dengan seluruh variabel bebas secara bersama-sama. Semakin besar nilai multiple R (+ atau -) menunjukkan hubungan yang lebih kuat.

R square (R2). Sering disebut koefisien determinasi, adalah ukuran kebaikan-kesesuaian (goodness of fit) dari persamaan regresi, yaitu memberikan proporsi atau presentase variasi total dalam variabel terikat yang dijelaskan variabel bebas. Kecocokan model regresi semakin tinggi apabila nilai R2 mendekati 1.

Adjusted R square. Istilah disesuaikan (adjusted) berarti R2 sudah disesuaikan dengan banyaknya variabel bebas (derajad bebas) dalam model. Sehingga sering digunakan untuk membandingkan R2 dari dua model regresi yang jumlah variabel berbeda. Meskipun semakin banyak variabel yang digunakan, namun nilai kenaikan dari R2 adjusted tersebut relatif kecil.

Standar error (Se). Merupakan standard error dari estimasi variabel terikat. Semakin kecil standar error apabila dibandingkan dengan standar deviasi variabel terikat, maka model regresi semakin tepat dalam memprediksi variabel terikatnya.


Bagaimana interpretasi hasil ANOVA:
Hasil analysis of variance ANOVA dari contoh di atas adalah sebagai berikut:



Derajad bebas (df). Nilai df pada kolom tabel di atas merupakan derajad bebas. Total derajad bebas adalah sama dengan jumlah observasi dikurang 1 (n-1). Dalam contoh ini total derajad bebas adalah 15, diperoleh dari 16 – 1 = 15. Derajad bebas 1 adalah derajad bebas atribut regresi, dan derajad bebas 14 untuk atribut nilai residual.

Sum square (SS). Total sum square (SS) adalah jumlah kuadrat deviasi antara mortalitas dengan nilai reratanya. SS total merupakan penjumlahan dari SS regresi dan SS residual. SS regresi merupakan jumlah kuadrat deviasi antara nilai persamaan regresi dengan rerata keseluruhan. Sedangkan SS residual adalah jumlah kuadrat deviasi antara mortalitas dengan persamaan regresi.
Pada contoh di atas, hasil SS total adalah 3396.4, yaitu mortalitas bervariasi sebesar nilai SS tersebut. Variasi mortalitas ini disebabkan oleh temperatur dengan SS regresi 2599.5 dan oleh variabel lain yang tidak diikutkan dalam model regresi yaitu SS residual sebesar 796.9. Apabila antara SS regresi kita bagi dengan SS total, maka akan diperoleh nilai R2. Dalam contoh: 2599.5/3396.4 = 0.7654, yaitu koefisien determinasi.

Mean of square (MS). Merupakan hasil bagi antara SS dengan kolom df. Hasil bagi MS regresi dengan MS residual akan diperoleh nilai F, atau dikenal F hitung. Dalam pengujian hipotesa, nilai Fhitung akan dibandingkan dengan Ftabel. Jika Fhitung > Ftabel, maka dapat dinyatakan bahwa variabel bebas berpengaruh secara signifilkan terhadap variabel terikat. Dalam Excel digunakan nilai p-value, apabila taraf nyata > dari p-value maka diperoleh kesimpulan variabel bebas berpengaruh secara signifilkan terhadap variabel terikat, demikian sebaliknya. Pada contoh ini, nilai p-value diperoleh 9.2E-06 jauh lebih kecil dari nilai taraf nyata adalah 5%, atau 0.05, sehingga diperoleh kesimpulan variabel temperatur berpengaruh secara signifikan terhadap mortalitas.





bersambung.... 

Tutorial sebelumnya.

Tidak ada komentar:

Posting Komentar

Related Post

Instal Add Ins Analysis Toolpak di Excel

Apa itu Add Ins "Analysis Toolpak" Add ins adalah suatu program yang dapat ditambahkan pada program utama (build).   Analys...

Joko Suryanto, S.TP., M. Sc
Tahun 2007 hingga sekarang aktif mengajar di Program Studi Teknik Pertanian STIPER Kutai Timur pada minat studi Teknik Sumberdaya Lahan dan Air.
Alamat kontak:
PRODI Teknik Pertanian STIPER Kutai Timur
Jl. Soekarno-Hatta No. 1 Sangatta Utara, Kutai Timur Kalimantan Timur 75387