Kebenaran data terkait erat dengan kredibilitas dan akurasi hasil ramalan. Karena itu peramal harus menyadari bahwa tingkat akurasi ramalan tidak akan lebih baik dari kadar kebenaran datanya. Hasil ramalan tak akan dipercaya jika datanya juga tak dapat dipercaya kebenerannya.
Ada tiga jenis data yang tersedia untuk analisis empirik, yaitu time series, cross-section, dan pooled data. Berikut adalah penjelasannya.
Merupakan jenis data yang nilai variabelnya dapat disusun menurut urutan waktu, periode, pengumpulannya dapat harian (seperti kurs, dan harga saham), mingguan (uang edaran), bulanan (tingkat inflasi), triwulan (laporan rugi laba), tahunan (pendapatan nasional), dan sepuluh tahunan (jumlah penduduk hasil sensus).
Ada juga data yang diterbitkan baik secara bulanan maupun tahunan, seperti tingkat inflasi, kurs, uang beredar, dan lain-lain.
Merupakan jenis data yang dikumpulkan pada waktu yang sama dari beberapa daerah, perusahaan, atau perorangan. Misalnya data tentang produksi padi, curah hujan, dan luas lahan dari setiap propinsi, data keuntungan setiap bank, data konsumsi dan penghasilan rumah tangga pada tahun 2000 dan lain-lain.
Pada data jenis ini definisi variabel dan cara pengumpulan data pada setiap unit perlu mendapat perhatian lebih. Agar dapat dibandingkan hal-hal itu perlu seragam. Jika di antaranya ada perbedaan, kesimpulan dan analisis dapat tidak tepat.
Merupakan jenis data penggabungan antara time series dan cross-section data. Contohnya data keuntungan setiap bank setiap tahun selama periode 1989-2000.
Tujuan penggunaan data ini umumnya untuk memperbanyak observasi guna memenuhi keperluan jumlah observasi minium. Namun penggabungan ini dapat menimbulkan kesulitan, misalnya jika parameter cross-section mengalami perubahan dari satu periode ke periode lain.