10 Kumpulan Open Datasets untuk Regresi Linier


Laptopinformatika.com - Setiap ilmuwan data kemungkinan harus melakukan tugas-tugas regresi linier dan proses pemodelan prediktif di beberapa titik dalam studi atau karier mereka. Bagi Anda yang ingin mempelajari lebih lanjut tentang topik ini atau menyelesaikan beberapa tugas sampel, artikel ini akan memperkenalkan 10 dataset terbuka untuk regresi linier. Selain itu, beberapa kumpulan data dalam daftar ini menyertakan tugas regresi untuk Anda lengkapi dengan data.

Read More : Bagaimana Cara Memilih Krim Anti Kerut yang Sempurna?

Kumpulan Data Regresi Linier untuk Pembelajaran Mesin


1. Regresi Linier Kanker

Dataset ini mencakup data yang diambil dari cancer.gov tentang kematian akibat kanker di Amerika Serikat. Seiring dengan dataset, penulis menyertakan langkah-langkah penuh tentang bagaimana mereka bersumber dan menyiapkan data, analisis eksplorasi mereka, pemilihan model, diagnostik, dan interpretasi.

2. Data CDC: Nutrisi, Aktivitas Fisik, Obesitas

Dari Sistem Surveilans Faktor Risiko Perilaku di CDC, set data ini mencakup informasi tentang aktivitas fisik, berat badan, dan diet orang dewasa rata-rata.

3. Dataset Pasar Ikan

Dibangun untuk regresi linier berganda dan analisis multivariat, Dataset Pasar Ikan berisi informasi tentang spesies ikan umum dalam penjualan pasar. Dataset mencakup spesies ikan, berat, panjang, tinggi, dan lebar.

4. Biaya Asuransi Medis

Dataset ini terinspirasi oleh buku Machine Learning with R oleh Brett Lantz. Data tersebut berisi informasi medis dan biaya yang ditagih oleh perusahaan asuransi kesehatan. Ini berisi 1338 baris data dan kolom berikut: usia, jenis kelamin, BMI, anak-anak, perokok, wilayah, biaya asuransi.

5. Dataset Bursa Efek New York

Dibuat sebagai sumber daya untuk analisis teknis, set data ini berisi data historis dari pasar saham New York. Dataset datang dalam empat file CSV: harga, penyesuaian harga, sekuritas, dan fundamental. Dengan menggunakan data ini, Anda dapat bereksperimen dengan pemodelan prediktif, regresi linier berguling, dan banyak lagi.

6. Tantangan Regresi OLS

Tantangan regresi OLS menugasi Anda memprediksi tingkat kematian akibat kanker untuk negara bagian AS. Dataset berisi data dari cancer.gov, clinicaltrials.gov, dan American Community Survey. Itu dalam format CSV dan mencakup informasi berikut tentang kanker di AS: tingkat kematian, kasus yang dilaporkan, nama county AS, pendapatan per county, populasi, demografi, dan banyak lagi.

7. Prediksi Harga Real Estat

Dataset real estat ini dibangun untuk analisis regresi, regresi linier, regresi berganda, dan model prediksi. Ini termasuk tanggal pembelian, umur rumah, lokasi, jarak ke stasiun MRT terdekat, dan harga rumah dari satuan luas.

8. Kualitas Anggur Merah

Dari Repositori Pembelajaran Mesin UCI, dataset ini dapat digunakan untuk pemodelan regresi dan tugas klasifikasi. Dataset mencakup info tentang sifat kimia berbagai jenis anggur dan bagaimana kaitannya dengan kualitas keseluruhan.

Read More : Bagaimana Mengonversi MKV ke MP4, Cepat, Sederhana dan Gratis!

9. Vehicle Dataset dari CarDekho

Dataset yang berguna untuk prediksi harga, dataset kendaraan ini mencakup informasi tentang mobil dan motor yang terdaftar di CarDekho.com. Data tersebut ada dalam file CSV yang mencakup kolom berikut: model, tahun, harga jual, harga showroom, penggerak kilometer, tipe bahan bakar, tipe penjual, transmisi, dan jumlah pemilik sebelumnya.

10. Statistik WHO tentang Harapan Hidup

Dataset ini berisi informasi yang dihimpun oleh Organisasi Kesehatan Dunia dan PBB untuk melacak faktor-faktor yang mempengaruhi harapan hidup. Data berisi 2938 baris dan 22 kolom. Kolom meliputi: negara, tahun, status perkembangan, kematian orang dewasa, harapan hidup, kematian bayi, konsumsi alkohol per kapita, pengeluaran negara untuk kesehatan, cakupan imunisasi, IMT, kematian di bawah 5 tahun, kematian akibat HIV / AIDS, PDB, populasi, kondisi tubuh, informasi pendapatan, dan pendidikan.

Berlangganan update artikel terbaru via email:

0 Response to "10 Kumpulan Open Datasets untuk Regresi Linier"

Post a Comment

Iklan Atas Artikel

Iklan Tengah Artikel 1

Iklan Tengah Artikel 2

Iklan Bawah Artikel