Ilmu Data

Dipublikasikan oleh Muhammad Farhan Fadhil

25 Maret 2022, 17.11

(ISTIMEWA)

Ilmu data (bahasa Inggris: data science) adalah suatu disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur. Berbagai subjek yang dibahas dalam ilmu data meliputi semua proses data, mulai dari pengumpulan data, analisis data, pengolahan data, manajemen data, kearsipan, pengelompokan data, penyajian data, distribusi data, hingga cara mengubah data menjadi kesatuan informasi yang dapat dipahami semua orang.

Ilmu data merupakan kombinasi dari ilmu sains dan ilmu sosial. Ilmu-ilmu yang menjadi penunjang utama dalam ilmu data terdiri dari matematika, statistika, ilmu komputer, sistem informasi, manajemen, ilmu informasi, termasuk juga ilmu komunikasi dan ilmu perpustakaan, kearsipan, dan dokumentasi. Bahkan ilmu ekonomi, terutama ilmu bisnis, juga berperan penting dalam ilmu data.

Etimologi
Penggunaan awal
Pada tahun 1962, John Tukey menggambarkan sebuah bidang pengetahuan yang dia sebut "data analisis", yang telah menyusun data sains modern. Tahun 1985, pada sesi kuliah yang diberikan oleh Akademi Sains Cina di Beijing, C.F Jeff Wu menggunakan istilah data sains untuk pertama kalinya sebagai alternatif nama untuk statistika. Selanjutnya, peserta simposium statistika Universitas Montpellier II mengakui munculnya sebuah disiplin bidang baru yang fokus kepada berbagai macam bentuk dan asal data, yang dikombinasikan dengan membangun konsep menggunakan prinsip statistika dan data analisis dengan komputer.

Istilah "data sains" bisa dilacak kembali ke tahun 1974, ketika Peter Naur mengajukan alternatif nama untuk ilmu komputer. Pada tahun 1997 C.F. Jeff Wu sekali lagi menyarankan bahwa statistika harusnya diubah namanya menjadi data sains. Beliau beralasan bahwa nomenklatur baru tersebut akan membantu statistika melepaskan stereotip yang selama ini tidak akurat, seperti identik dengan akuntasi, atau hanya terbatas pada penggambaran data. Pada tahun 1998, Hayashi Chikio berpendapat bahwa data sains adalah cabang ilmu pengetahuan baru dengan tiga aspek: desain data, pengumpulan data, dan analisis data

Selama tahun 1990-an, ada banyak istilah populer dalam proses menemukan pola pada kumpulan data (yang sangat luas) termasuk "penemuan pengetahuan" dan "penambangan data".

Penggunaan di era modern
Peng-artian modern dari data sains sebagai sebuah cabang ilmu baru salah satunya berkat William S.Cleveland. Dalam sebuah makalah tahun 2001 dia menganjurkan perluasan teori statistik lebih dalam ke wilayah teknis; karena akan mengubah bidang secara signifikan, sehingga membutuhkan nama baru. "Data sains" menjadi lebih banyak dipakai pada tahun-tahun berikutnya setelah tahun 2002, Komite Data untuk Ilmu Pengetahuan dan Teknologi merilis Data Science Journal. Di tahun 2003, Columbia University merilis The Journal of Data Science. Pada 2014 Asosiasi Statistika Amerika mengubah nama satu seksinya menjadi Pembelajaran Statistik dan Data Sains, yang menggambarkan kepopuleran dari data sains.

Pada tahun 2008 DJ Patil dan Jeff Hammerbacher mempelopori gelar profesional dari "data saintis". Meskipun gelar tersebut telah digunakan oleh Dewan Sains Nasional pada laporan mereka di tahun 2005, "Long-Lived Digital Data Collections: Enabling Research an Education pada Abad ke-21", yang secara luas mengacu pada peran kunci dalam mengelola sebuah kumpulan data digital.

Sumber Artikel: id.wikipedia.org