Analisis Regresi: Pengertian – Contoh Kasus dan Contoh Soal

√ Edu Passed Pass quality & scientific checked by advisor, read our quality control guidelance for more info

Dalam penghitungan statistik, tidak bisa serampangan begitu saja saat menghitung. Agar tidak terjadi kesalahan data. Dan berikut ini adalah pembahasan tentang analisis regresi.

Pengertian Analisis Regresi

Analisis regresi mungkin merupakan teknik statistik yang paling banyak digunakan untuk menyelidiki atau memperkirakan hubungan antara dependen dan satu set variabel penjelas independen. Ini juga digunakan sebagai istilah selimut untuk berbagai teknik analisis data yang digunakan dalam metode penelitian kualitatif untuk memodelkan dan menganalisis banyak variabel.

Dalam metode regresi, variabel dependen adalah prediktor atau elemen penjelas dan variabel dependen adalah hasil atau respons terhadap kueri tertentu.

Analisis regresi sering digunakan untuk memodelkan atau menganalisis data. Mayoritas analis survei menggunakannya untuk memahami hubungan antara variabel, yang selanjutnya dapat digunakan untuk memprediksi hasil yang tepat.

Analisis regresi meliputi beberapa variasi, seperti linier, linier berganda, dan nonlinier. Model yang paling umum adalah linier sederhana dan linier berganda. Analisis regresi nonlinier biasanya digunakan untuk kumpulan data yang lebih rumit di mana variabel dependen dan independen menunjukkan hubungan nonlinier. Analisis regresi menawarkan banyak aplikasi dalam berbagai disiplin ilmu, termasuk keuangan .

Cara Analisis Regresi

Analisis Regresi – Regresi Linier Sederhana

Regresi linier sederhana adalah model yang menilai hubungan antara variabel dependen dan variabel independen. Model linier sederhana dinyatakan dengan menggunakan persamaan berikut:

Y = a + bX +

Di mana:

  • Y – Variabel terikat
  • X – Variabel bebas (penjelas)
  • a – mencegat
  • b – Kemiringan
  • ε – Residual (error).

Analisis Regresi – Regresi Linier Berganda

Analisis regresi linier berganda pada dasarnya mirip dengan model linier sederhana, dengan pengecualian bahwa beberapa variabel independen digunakan dalam model. Representasi matematis dari regresi linier berganda adalah:

Y = a + b X 1  + c X  + d X 3 +

Di mana:

  • Y – Variabel terikat
  • X 1 , X 2 , X – Variabel bebas (penjelas)
  • a – mencegat
  • b, c, d – Lereng
  • ε – Residual (error).

Analisis Regresi dalam Keuangan

Analisis regresi hadir dengan beberapa aplikasi di bidang keuangan. Misalnya, metode statistik merupakan dasar Model Penetapan Harga Aset Modal (CAPM) . Pada dasarnya, persamaan CAPM adalah model yang menentukan hubungan antara pengembalian yang diharapkan dari suatu aset dan premi risiko pasar.

Sangat mudah untuk menjalankan analisis regresi menggunakan Excel atau SPSS, tetapi saat melakukannya, pentingnya empat angka dalam menafsirkan data harus dipahami.

Dua angka pertama dari empat angka berhubungan langsung dengan model regresi itu sendiri.

F-Value: Ini membantu dalam mengukur signifikansi statistik dari model survei. Ingat, F-Value secara signifikan kurang dari 0,05 dianggap lebih bermakna. Kurang dari 0,05 F-Value memastikan hasil analisis survei tidak terjadi secara kebetulan.

  • R-Squared: Adalah nilai di mana variabel independen mencoba menjelaskan jumlah pergerakan oleh variabel dependen. Pertimbangkan nilai R-Squared adalah 0,7, ini berarti 70% pergerakan variabel dependen dapat dijelaskan oleh variabel independen yang diuji. Artinya, hasil analisis survei yang akan kita peroleh bersifat sangat prediktif dan dapat dianggap akurat.

Dua angka lainnya berhubungan dengan masing-masing variabel independen saat menafsirkan analisis regresi.

  • P-Value: Sama seperti F-Value, bahkan P-Value memiliki signifikansi statistik utama. Selain itu, di sini menunjukkan seberapa relevan dan signifikan secara statistik pengaruh variabel independen. Sekali lagi, kami mencari nilai yang kurang dari 0,05.
  • Angka keempat berkaitan dengan koefisien yang dicapai setelah mengukur dampak variabel. Misalnya, kami menguji beberapa variabel independen untuk mendapatkan koefisien yang memberi tahu kami, ‘dengan nilai berapa variabel dependen diharapkan meningkat ketika variabel independen (yang kami pertimbangkan) meningkat satu ketika semua variabel independen lainnya stagnan pada nilai yang sama . Dalam beberapa kasus, koefisien sederhana diganti dengan koefisien standar yang menunjukkan kontribusi dari masing-masing variabel independen untuk menggerakkan atau membawa perubahan pada variabel dependen.

Contoh Kasus Analisis Regresi

Agen perawatan kesehatan rumah nirlaba telah bertanya kepada “seorang konsultan” apakah CEO-nya dibayar secara adil relatif terhadap pasar untuk agensi serupa. Agensi telah menyediakan database untuk konsultan, yang juga memiliki database survei gaji CEO sendiri.

Kasus ini akan menunjukkan bagaimana data regresi dapat digunakan untuk menjawab pertanyaan ini.

Dalam hal ini, tarif CEO adalah 800.000 per jam (atau 16.500.000 per tahun). Pendapatan Agensi adalah 250 juta. Apakah CEO dibayar dengan adil? Survei tingkat gaji lembaga perawatan kesehatan rumah nirlaba menunjukkan tingkat gaji dalam tabel di bawah ini.

Kasus ini akan menunjukkan bagaimana data regresi dapat digunakan untuk menjawab pertanyaan ini. Variabel independen adalah “Pendapatan”; variabel dependennya adalah “gaji pokok CEO.”

  • Pertama (Agar Aman)
    Pastikan untuk menyusun data dari tinggi ke rendah untuk variabel independen (dan, tentu saja, pastikan untuk menautkan nilai variabel dependen ke nilai variabel independen terkait saat mengurutkan data). Periksa kembali apakah perangkat lunak statistik perusahaan secara akurat dapat menghitung data regresi jika tidak dpat mengurutkan data.
  • Selanjutnya, Siapkan Excel
    Jika Anda belum melakukannya, di Excel 10.0, unduh paket alat analisis, “paket alat analisis”. Buka file → options → add-in → sorot “analysis toolpack” → “go” → “centang” kotak untuk toolpack di kotak dialog berikutnya yang muncul → “OK.” Untuk mengakses paket alat, klik “data” di pita menu di atas. “Analisis data” akan berada di paling kanan Anda di baris menu di atas.
  • Untuk Melakukan Analisis Regresi
    Pergi ke “analisis data” → klik “regresi” → OK Tentukan berikut ini:
    • Rentang input: variabel x (iv) dan y (dv).
    • Tetapkan tingkat kepercayaan: 95%.
    • Pilih rentang keluaran (pilih sel di spreadsheet).
    • Klik “Oke”; outputnya akan muncul.
  • Membaca Output Analisis:
    Hasil kami adalah:
    • r² = .9075 = .9 (Bagus! Artinya 90% dari variasi variabel dependen CEO Base Pay dapat “dijelaskan” oleh independen
    • Nilai “y-intercept” (“b” dalam persamaan garis lurus) = 39,378
    • Nilai “koefisien” adalah 1.47417E-06. Ini diterjemahkan menjadi .00000147417 dari notasi ilmiah

Contoh Soal Analisis Regresi

Contoh 1

Misalkan nilai X dan Y diketahui.

Tabel 1

xY
11
21.5
32.5
42.8
54

Jawab :

Persamaan utama adalah:

Y = a + b(X) +e (istilah kesalahan)

Dalam hal ini, e adalah nol karena diasumsikan bahwa variabel bebas (X) memiliki kesalahan yang dapat diabaikan.

Oleh karena itu, tetap Y = a + b(X).

Sekarang mari kita cari nilai b.

b = [ XY – (∑Y)(∑X)/n ] / (X-X') 2

Substitusikan nilai-nilai dalam rumus di atas:

b = [ 42,7 – (15*10,8)/5 ]/10 = [ 42,7 – 162/5 ]/10 = [ 42,7 – 32,5 ]/10 = 10,2/10 = 1,02
b = 1,02

Oleh karena itu,

a = Y – b(X)
a = Y – 1,02(X) atau a = Y/n – 1,02 (∑X/n)a = 2.16 – 1.02*3 = 2.16 – 3.06
a = -1,06

Dengan mensubstitusi nilai a, b dan X, kita dapat menemukan nilai Y yang sesuai.

Y = a + b(X) = -1,06 + 1,02
Ketika X = 1
Y = -1,06 + 1,02*1 = -0,04
Ketika X = 2
Y = - 1,06 + 1,02*2 = 0,98
Ketika X = 3, Y akan menjadi 2
Ketika X = 4, Y akan menjadi 3,02
Ketika X = 5, Y akan menjadi 4,04.

Contoh 2

xY
1-0,04
20,98
32
43.02
54.04

Jawab :

Dilambangkan dengan R 2 , nilainya terletak antara 0 dan 1. Ketika:

  • R 2 = 0 : nilai variabel dependen tidak dapat diprediksi dari variabel independen.
  • R 2 = 1, nilai variabel dependen dapat dengan mudah diprediksi dari variabel independen. Tidak ada kesalahan dalam data.

Semakin tinggi nilai R 2 , semakin cocok model dengan data.

Sekarang mari kita pahami cara menghitung R 2 . Rumus untuk temuan R 2 adalah:

R 2 = { (1 / n) * (X-X') * (Y-Y') } / (σx * y) 2

Dimana n = jumlah pengamatan = 5

(X-X’) * (Y-Y’) = 7,64 (Ref Tabel 2)

x adalah simpangan baku X dan y adalah simpangan baku Y

x = akar kuadrat dari (X-X’) 2 /n = 10/5 = 2 = 1,414

y = akar kuadrat dari (Y-Y’) 2 /n = 5.69/5 = 1.138 = 1.067

Sekarang mari kita tentukan nilai R 2

R 2 = { 1/5 (7.64) } / (1.414 * 1.067) 2 = 1.528 / (1.509) 2 = 1.528/2.277 = 0.67

Oleh karena itu R 2 = 0,67

Semakin tinggi nilai koefisien determinasi, semakin rendah standar errornya. Hasilnya menunjukkan bahwa sekitar 67% variasi remunerasi dapat dijelaskan oleh pengalaman kerja. Hal ini menunjukkan bahwa pengalaman kerja berperan besar dalam menentukan remunerasi.

Contoh 3

Hitung koefisien regresi linier dan kesalahan standarnya untuk data dalam Contoh 1 Kuadrat Terkecil untuk Regresi Berganda (diulangi di bawah pada Gambar dengan menggunakan teknik matriks.

Jawab :

Standar error dari masing-masing koefisien di B dapat dihitung sebagai berikut. Pertama hitung larik suku kesalahan E (rentang O4:O14) menggunakan rumus larik I4:I14 – M4:M14. Kemudian hanya seperti dalam kasus regresi sederhana SS Res = DEVSQ (O4: O14) = 277,36, df Res = nk – 1 = 11 – 2 – 1 = 8 dan MS Res = SS Res / df Res = 34,67.

Kami meninjau kembali Contoh 1 Korelasi Berganda , menganalisis model di mana tingkat kemiskinan dapat diperkirakan sebagai kombinasi linier dari angka kematian bayi, persentase populasi kulit putih dan tingkat kejahatan kekerasan (per 100.000 orang) .

Kita perlu menemukan parameter  b 0 , b 1  dan sedemikian sehingga

Kemiskinan (diprediksi) = b 0  + b 1  Bayi + b 2  Putih + b 3  Kejahatan.

Dengan demikian, kita melihat bahwa garis regresi adalah

Kemiskinan = 0,437 + 1,279 Kematian Bayi + 0,0363 Putih + 0,00142 Kejahatan

Di sini Kemiskinan mewakili nilai yang diprediksi. Kita juga melihat bahwa R Square adalah 0,337 (yaitu 33,7% varians dalam tingkat kemiskinan dijelaskan oleh model), kesalahan standar estimasi adalah 2,47, dll.

Contoh 4

Baru-baru ini, jumlah tahunan kematian pengemudi per 100.000 untuk kelompok usia yang dipilih adalah sebagai berikut:

UsiaJumlah Kematian Pengemudi per 100.000
17.538
2236
29.524
44.520
64.518
8028
  • Untuk setiap kelompok umur, pilih titik tengah interval untuk nilai x . (Untuk grup 75+, gunakan 80.)
  • Dengan menggunakan “usia” sebagai variabel bebas dan “Jumlah kematian pengemudi per 100.000” sebagai variabel terikat, buatlah diagram pencar dari data tersebut.
  • Hitung garis kuadrat terkecil (paling cocok). Jadikan persamaan dalam bentuk: = a + bx
  • Cari koefisien korelasi. Apakah itu signifikan?
  • Perkirakan jumlah kematian untuk usia 40 dan 60 tahun.
  • Berdasarkan data yang diberikan, apakah ada hubungan linier antara usia pengemudi dan tingkat kematian pengemudi?
  • Berapa kemiringan garis kuadrat terkecil (paling cocok)? Menafsirkan kemiringan.

Jawaban :

UsiaJumlah Kematian Pengemudi per 100.000
16–1938
20–2436
25–3424
35–5420
55–7418
75+28

b. Periksa solusi siswa.

c. y^=35.5818045−0.19182491x

d. r=−0.57874

Untuk empat df dan alfa =0.05, yang diberikan LinRegTTest p-value=0.2288

jadi kami tidak menolak hipotesis nol; tidak ada hubungan linier yang signifikan antara kematian dan usia.

Menggunakan tabel nilai kritis untuk koefisien korelasi, dengan empat df , nilai kritisnya adalah 0,811. Koefisien korelasir=−0.57874

tidak kurang dari -0,811, jadi kami tidak menolak hipotesis nol.

e. jika umur = 40, y^ (deaths) =35.5818045–0.19182491(40)=27.9

jika umur = 60, y^ (deaths) =35.5818045–0.19182491(60)=24.1

f. Untuk seluruh dataset, terdapat hubungan linier untuk usia sampai dengan 74 tahun. Kelompok usia tertua menunjukkan peningkatan kematian dari kelompok sebelumnya, yang tidak konsisten dengan usia yang lebih muda.

g. slope=−0.19182491

Contoh 5

Jelaskan apa yang dimaksud dengan korelasi yang memiliki r2 dari 0,72.

Jawab :

Artinya 72% dari variasi variabel terikat (y) dapat dijelaskan oleh variasi variabel bebas (x).

Kesimpulan Pembahasan

Statistik adalah “abstraksi” data yang membantu kita memahami sifat data dengan lebih baik. Ini dapat membantu kita membuat keputusan praktis tentang karyawan dan tempat kerja dalam banyak cara.

Namun, pastikan untuk menafsirkan data dengan hati-hati. Jangan “membaca terlalu banyak” data. Gunakan statistik sebagai alat penting yang melengkapi pengamatan pribadi diri kamu di perusahaan.

Apakah kamu menerapkan akuntabilitas dan logika untuk mendukung keputusan kompensasimu? Tanpa kartu skor kompensasi yang efektif, untuk menghadapi risiko harus mempersenjatai organisasi diri untuk membuat pilihan yang bertanggung jawab dan adil.

Kompensasi mungkin merupakan salah satu pengeluaran terbesar organisasi perusahaan dan mungkin salah satu yang paling sulit untuk dikelola. Mengapa? Karena tidak ada jawaban “satu ukuran cocok untuk semua”. Kamu akan tahu titik-titik masalah: kelebihan atau kekurangan pembayaran untuk posisi relatif terhadap pasar, kenaikan gaji yang tidak sejalan dengan pendapatan yang dihasilkan organisasi, dan daftarnya terus berlanjut.

fbWhatsappTwitterLinkedIn