Daftar isi
Dalam penghitungan statistik, tidak bisa serampangan begitu saja saat menghitung. Agar tidak terjadi kesalahan data. Dan berikut ini adalah pembahasan tentang analisis regresi.
Analisis regresi mungkin merupakan teknik statistik yang paling banyak digunakan untuk menyelidiki atau memperkirakan hubungan antara dependen dan satu set variabel penjelas independen. Ini juga digunakan sebagai istilah selimut untuk berbagai teknik analisis data yang digunakan dalam metode penelitian kualitatif untuk memodelkan dan menganalisis banyak variabel.
Dalam metode regresi, variabel dependen adalah prediktor atau elemen penjelas dan variabel dependen adalah hasil atau respons terhadap kueri tertentu.
Analisis regresi sering digunakan untuk memodelkan atau menganalisis data. Mayoritas analis survei menggunakannya untuk memahami hubungan antara variabel, yang selanjutnya dapat digunakan untuk memprediksi hasil yang tepat.
Analisis regresi meliputi beberapa variasi, seperti linier, linier berganda, dan nonlinier. Model yang paling umum adalah linier sederhana dan linier berganda. Analisis regresi nonlinier biasanya digunakan untuk kumpulan data yang lebih rumit di mana variabel dependen dan independen menunjukkan hubungan nonlinier. Analisis regresi menawarkan banyak aplikasi dalam berbagai disiplin ilmu, termasuk keuangan .
Analisis Regresi – Regresi Linier Sederhana
Regresi linier sederhana adalah model yang menilai hubungan antara variabel dependen dan variabel independen. Model linier sederhana dinyatakan dengan menggunakan persamaan berikut:
Y = a + bX +
Di mana:
Analisis Regresi – Regresi Linier Berganda
Analisis regresi linier berganda pada dasarnya mirip dengan model linier sederhana, dengan pengecualian bahwa beberapa variabel independen digunakan dalam model. Representasi matematis dari regresi linier berganda adalah:
Y = a + b X 1 + c X 2 + d X 3 +
Di mana:
Analisis Regresi dalam Keuangan
Analisis regresi hadir dengan beberapa aplikasi di bidang keuangan. Misalnya, metode statistik merupakan dasar Model Penetapan Harga Aset Modal (CAPM) . Pada dasarnya, persamaan CAPM adalah model yang menentukan hubungan antara pengembalian yang diharapkan dari suatu aset dan premi risiko pasar.
Sangat mudah untuk menjalankan analisis regresi menggunakan Excel atau SPSS, tetapi saat melakukannya, pentingnya empat angka dalam menafsirkan data harus dipahami.
Dua angka pertama dari empat angka berhubungan langsung dengan model regresi itu sendiri.
F-Value: Ini membantu dalam mengukur signifikansi statistik dari model survei. Ingat, F-Value secara signifikan kurang dari 0,05 dianggap lebih bermakna. Kurang dari 0,05 F-Value memastikan hasil analisis survei tidak terjadi secara kebetulan.
Dua angka lainnya berhubungan dengan masing-masing variabel independen saat menafsirkan analisis regresi.
Agen perawatan kesehatan rumah nirlaba telah bertanya kepada “seorang konsultan” apakah CEO-nya dibayar secara adil relatif terhadap pasar untuk agensi serupa. Agensi telah menyediakan database untuk konsultan, yang juga memiliki database survei gaji CEO sendiri.
Kasus ini akan menunjukkan bagaimana data regresi dapat digunakan untuk menjawab pertanyaan ini.
Dalam hal ini, tarif CEO adalah 800.000 per jam (atau 16.500.000 per tahun). Pendapatan Agensi adalah 250 juta. Apakah CEO dibayar dengan adil? Survei tingkat gaji lembaga perawatan kesehatan rumah nirlaba menunjukkan tingkat gaji dalam tabel di bawah ini.
Kasus ini akan menunjukkan bagaimana data regresi dapat digunakan untuk menjawab pertanyaan ini. Variabel independen adalah “Pendapatan”; variabel dependennya adalah “gaji pokok CEO.”
Misalkan nilai X dan Y diketahui.
Tabel 1
x | Y |
1 | 1 |
2 | 1.5 |
3 | 2.5 |
4 | 2.8 |
5 | 4 |
Jawab :
Persamaan utama adalah:
Y = a + b(X) +e (istilah kesalahan)
Dalam hal ini, e adalah nol karena diasumsikan bahwa variabel bebas (X) memiliki kesalahan yang dapat diabaikan.
Oleh karena itu, tetap Y = a + b(X).
Sekarang mari kita cari nilai b.
b = [ XY – (∑Y)(∑X)/n ] / (X-X') 2
Substitusikan nilai-nilai dalam rumus di atas:
b = [ 42,7 – (15*10,8)/5 ]/10 = [ 42,7 – 162/5 ]/10 = [ 42,7 – 32,5 ]/10 = 10,2/10 = 1,02
b = 1,02
Oleh karena itu,
a = Y – b(X)
a = Y – 1,02(X) atau a = Y/n – 1,02 (∑X/n)a = 2.16 – 1.02*3 = 2.16 – 3.06
a = -1,06
Dengan mensubstitusi nilai a, b dan X, kita dapat menemukan nilai Y yang sesuai.
Y = a + b(X) = -1,06 + 1,02 Ketika X = 1 Y = -1,06 + 1,02*1 = -0,04 Ketika X = 2 Y = - 1,06 + 1,02*2 = 0,98 Ketika X = 3, Y akan menjadi 2 Ketika X = 4, Y akan menjadi 3,02 Ketika X = 5, Y akan menjadi 4,04.
x | Y |
1 | -0,04 |
2 | 0,98 |
3 | 2 |
4 | 3.02 |
5 | 4.04 |
Jawab :
Dilambangkan dengan R 2 , nilainya terletak antara 0 dan 1. Ketika:
Semakin tinggi nilai R 2 , semakin cocok model dengan data.
Sekarang mari kita pahami cara menghitung R 2 . Rumus untuk temuan R 2 adalah:
R 2 = { (1 / n) * (X-X') * (Y-Y') } / (σx * y) 2
Dimana n = jumlah pengamatan = 5
(X-X’) * (Y-Y’) = 7,64 (Ref Tabel 2)
x adalah simpangan baku X dan y adalah simpangan baku Y
x = akar kuadrat dari (X-X’) 2 /n = 10/5 = 2 = 1,414
y = akar kuadrat dari (Y-Y’) 2 /n = 5.69/5 = 1.138 = 1.067
Sekarang mari kita tentukan nilai R 2
R 2 = { 1/5 (7.64) } / (1.414 * 1.067) 2 = 1.528 / (1.509) 2 = 1.528/2.277 = 0.67
Oleh karena itu R 2 = 0,67
Semakin tinggi nilai koefisien determinasi, semakin rendah standar errornya. Hasilnya menunjukkan bahwa sekitar 67% variasi remunerasi dapat dijelaskan oleh pengalaman kerja. Hal ini menunjukkan bahwa pengalaman kerja berperan besar dalam menentukan remunerasi.
Hitung koefisien regresi linier dan kesalahan standarnya untuk data dalam Contoh 1 Kuadrat Terkecil untuk Regresi Berganda (diulangi di bawah pada Gambar dengan menggunakan teknik matriks.
Jawab :
Standar error dari masing-masing koefisien di B dapat dihitung sebagai berikut. Pertama hitung larik suku kesalahan E (rentang O4:O14) menggunakan rumus larik I4:I14 – M4:M14. Kemudian hanya seperti dalam kasus regresi sederhana SS Res = DEVSQ (O4: O14) = 277,36, df Res = n – k – 1 = 11 – 2 – 1 = 8 dan MS Res = SS Res / df Res = 34,67.
Kami meninjau kembali Contoh 1 Korelasi Berganda , menganalisis model di mana tingkat kemiskinan dapat diperkirakan sebagai kombinasi linier dari angka kematian bayi, persentase populasi kulit putih dan tingkat kejahatan kekerasan (per 100.000 orang) .
Kita perlu menemukan parameter b 0 , b 1 dan sedemikian sehingga
Kemiskinan (diprediksi) = b 0 + b 1 Bayi + b 2 Putih + b 3 Kejahatan.
Dengan demikian, kita melihat bahwa garis regresi adalah
Kemiskinan = 0,437 + 1,279 Kematian Bayi + 0,0363 Putih + 0,00142 Kejahatan
Di sini Kemiskinan mewakili nilai yang diprediksi. Kita juga melihat bahwa R Square adalah 0,337 (yaitu 33,7% varians dalam tingkat kemiskinan dijelaskan oleh model), kesalahan standar estimasi adalah 2,47, dll.
Baru-baru ini, jumlah tahunan kematian pengemudi per 100.000 untuk kelompok usia yang dipilih adalah sebagai berikut:
Usia | Jumlah Kematian Pengemudi per 100.000 |
---|---|
17.5 | 38 |
22 | 36 |
29.5 | 24 |
44.5 | 20 |
64.5 | 18 |
80 | 28 |
Jawaban :
Usia | Jumlah Kematian Pengemudi per 100.000 |
---|---|
16–19 | 38 |
20–24 | 36 |
25–34 | 24 |
35–54 | 20 |
55–74 | 18 |
75+ | 28 |
b. Periksa solusi siswa.
c. y^=35.5818045−0.19182491x
d. r=−0.57874
Untuk empat df dan alfa =0.05, yang diberikan LinRegTTest p-value=0.2288
jadi kami tidak menolak hipotesis nol; tidak ada hubungan linier yang signifikan antara kematian dan usia.
Menggunakan tabel nilai kritis untuk koefisien korelasi, dengan empat df , nilai kritisnya adalah 0,811. Koefisien korelasir=−0.57874
tidak kurang dari -0,811, jadi kami tidak menolak hipotesis nol.
e. jika umur = 40, y^ (deaths) =35.5818045–0.19182491(40)=27.9
jika umur = 60, y^ (deaths) =35.5818045–0.19182491(60)=24.1
f. Untuk seluruh dataset, terdapat hubungan linier untuk usia sampai dengan 74 tahun. Kelompok usia tertua menunjukkan peningkatan kematian dari kelompok sebelumnya, yang tidak konsisten dengan usia yang lebih muda.
g. slope=−0.19182491
Jelaskan apa yang dimaksud dengan korelasi yang memiliki r2 dari 0,72.
Jawab :
Artinya 72% dari variasi variabel terikat (y) dapat dijelaskan oleh variasi variabel bebas (x).
Statistik adalah “abstraksi” data yang membantu kita memahami sifat data dengan lebih baik. Ini dapat membantu kita membuat keputusan praktis tentang karyawan dan tempat kerja dalam banyak cara.
Namun, pastikan untuk menafsirkan data dengan hati-hati. Jangan “membaca terlalu banyak” data. Gunakan statistik sebagai alat penting yang melengkapi pengamatan pribadi diri kamu di perusahaan.
Apakah kamu menerapkan akuntabilitas dan logika untuk mendukung keputusan kompensasimu? Tanpa kartu skor kompensasi yang efektif, untuk menghadapi risiko harus mempersenjatai organisasi diri untuk membuat pilihan yang bertanggung jawab dan adil.
Kompensasi mungkin merupakan salah satu pengeluaran terbesar organisasi perusahaan dan mungkin salah satu yang paling sulit untuk dikelola. Mengapa? Karena tidak ada jawaban “satu ukuran cocok untuk semua”. Kamu akan tahu titik-titik masalah: kelebihan atau kekurangan pembayaran untuk posisi relatif terhadap pasar, kenaikan gaji yang tidak sejalan dengan pendapatan yang dihasilkan organisasi, dan daftarnya terus berlanjut.