Ilmu Data
Dipublikasikan oleh Muhammad Farhan Fadhil pada 25 Maret 2022
Definisi, karakteristik, dan manfaat
Definisi data mining, secara sederhana, adalah istilah yang digunakan untuk menjelaskan proses pencarian atau penambangan knowledge dari data yang sangat besar. Menurut analogi, orang mungkin berpikir bahwa istilah data mining adalah sesuatu yang tidak tepat; menambang emas dari bebatuan atau lumpur diacu sebagai ‘penambangan emas’ dan bukannya penambangan ‘batu’ atau ‘lumpur’. Jadi, data mining barangkali lebih cocok diberi nama ‘knowledge mining’ atau ‘knowledge discovery’. Meskipun ada ketidakcocokan antara makna dan istilah, data mining telah menjadi pilihan bagi komunitas ilmu ini. Banyak nama-nama lain yang ter-asosiasi dengan data mining antara lain ‘knowledge extraction’, ‘pattern analysis’, ‘data archaeology’, ‘information harvesting’, ‘pattern searching’, dan ‘data dredging’.
Secara teknis, data minig adalah proses yang memanfaatkan teknik-teknik statistik, matematika, dan kecerdasan buatan untuk mengekstrak dan mengidentifikasi informasi dan knowledge selanjutnya (atau pola-pola) yang berasal dari sekumpulan data yang sangat besar. Berbagai macam pola tersebut bisa dalam bentuk aturan bisnis, kesamaan-kesamaan, korelasi, trend, atau model-model prediksi. Kebanyakan literatur mendefinisikan data mining sebagai “proses yang rumit untuk mengidentifikasi pola-pola yang valid, baru, memiliki potensi bermanfaat, dan bisa dipahami, terhadap data yang disimpan di dalam database yang terstruktur”, dimana data diorganisir dalam baris-baris yang terstruktur menurut kategori, ordinal/berurutan, dan variable-variabel yang berkesinambungan. Dalam definisi ini, beberapa arti dari kata-kata kunci di atas adalah seperti berikut:
Proses: artinya data mining terdiri dari banyak langkah perulangan Rumit: artinya bahwa ada suatu dugaan/kesimpulan atau pencarian yang berbasis eksperimentasi yang dilibatkan; yang artinya bahwa, itu bukanlah suatu hal yang mudah seperti komputasi terhadap suatu kuantitas yang sudah ditetapkan sebelumnya
Valid: artinya bahwa pola-pola yang ditemukan seharusnya tetap benar bila diterapkan pada data yang baru dengan tingkat kepastian yang tinggi
Baru: artinya bahwa pola-pola tidaklah diketahui sebelumnya oleh pengguna dalam konteks sistem yang sedang dianalisa
Berpotensi bermanfaat: artinya adalah bahwa pola-pola yang ditemukan harus membawa manfaat bagi pengguna atau pada pekerjaan
Dapat dipahami: artinya bahwa pola harus masuk akal secara bisnis yang membuat pengguna berkata “mmmm! Ini masuk akal; mengapa saya tidak memikirkan hal itu” .
Data mining bukanlah disiplin ilmu baru, tetapi lebih pada definisi yang baru untuk pemanfaatan banyak disiplin ilmu. Data mining diposisikan erat di irisan berbagai disiplin ilmu, termasuk statistik, artificial intelligence (kecerdasan buatan), machine learning, management science, information systems (sistem informasi), dan database. Lihat gambar di bawah ini:
Dengan menggunakan perkembangan di semua disiplin itu, data mining berusaha membuat perkembangan dalam mengekstrak informasi dan knowledge dari database yang besar. Ini adalah bidang ilmu yang muncul ke permukaan dan menarik banyak perhatian dalam waktu yang singkat.
Berikut adalah karakteristik utama dan tujuan dari data mining:
Data seringkali terkubur dalam database yang sangat besar, yang terkadang berisi data selama bertahun-tahun. Dalam banyak kasus, data dibersihkan dan disatukan ke dalam data warehouse.
Environment data mining pada umumnya adalah arsitektur client-server atau arsitektur sistem informasi berbasis web.
Berbagai tool baru yang canggih, termasuk berbagai tool visualisasi yang canggih, membantu untuk mengangkat biji informasi yang terkubur dalam file-file korporat atau record-record arsip. Untuk mendapatkannya akan melibatkan memoles dan mensinkronisasikan data untuk mendapatkan hasil-hasil yang tepat. Data miners yang mutakhir juga memeriksa kemanfaatan data (misalnya, teks yang tak terstruktur yang disimpan dalam tempat-tempat seperti database Lotus Notes, file-file teks di internet, atau intranet korporat).
Si penambang seringkali adalah end-user, yang didukung dengan ‘bor-bor data’ dan berbagai tool query handal lainnya untuk menanyakan pertanyaan-pertanyaan dengan tujuan tertentu dan mendapatkan jawaban-jawaban dengan cepat, dengan sedikit atau bahkan tanpa skill pemrograman sekalipun.
Dalam menemukan pola seringkali menemukan hasil yang tak diharapkan dan meminta end-user untuk berpikir secara kreatif dalam menjalankan proses, termasuk interpretasi terhadap temuan.
Banyak tool data mining siap dikombinasikan dengan berbagai spreadsheet dan tool development software lainnya. Jadi, data yang ditambang bisa dianalisa dan diterapkan dengan cepat dan mudah.
Karena jumlah data yang sangat besar dan usaha pencarian yang massif, kadang-kadang perlu menggunakan pemrosesan parallel untuk data mining.
Perusahaan yang secara efektif memanfaatkan tool-tool dan teknologi data mining bisa mendapatkan dan mempertahankan keunggulan kompetitif strategis. Data mining menawarkan perusahaan suatu environment yang sangat diperlukan untuk meningkatkan keputusan untuk memanfaatkan peluang-peluang baru dengan mentransformasikan data menjadi senjata yang strategis.
Sumber Artikel: binus.ac.id
Ilmu Data
Dipublikasikan oleh Muhammad Farhan Fadhil pada 25 Maret 2022
Ilmu data (bahasa Inggris: data science) adalah suatu disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur. Berbagai subjek yang dibahas dalam ilmu data meliputi semua proses data, mulai dari pengumpulan data, analisis data, pengolahan data, manajemen data, kearsipan, pengelompokan data, penyajian data, distribusi data, hingga cara mengubah data menjadi kesatuan informasi yang dapat dipahami semua orang.
Ilmu data merupakan kombinasi dari ilmu sains dan ilmu sosial. Ilmu-ilmu yang menjadi penunjang utama dalam ilmu data terdiri dari matematika, statistika, ilmu komputer, sistem informasi, manajemen, ilmu informasi, termasuk juga ilmu komunikasi dan ilmu perpustakaan, kearsipan, dan dokumentasi. Bahkan ilmu ekonomi, terutama ilmu bisnis, juga berperan penting dalam ilmu data.
Etimologi
Penggunaan awal
Pada tahun 1962, John Tukey menggambarkan sebuah bidang pengetahuan yang dia sebut "data analisis", yang telah menyusun data sains modern. Tahun 1985, pada sesi kuliah yang diberikan oleh Akademi Sains Cina di Beijing, C.F Jeff Wu menggunakan istilah data sains untuk pertama kalinya sebagai alternatif nama untuk statistika. Selanjutnya, peserta simposium statistika Universitas Montpellier II mengakui munculnya sebuah disiplin bidang baru yang fokus kepada berbagai macam bentuk dan asal data, yang dikombinasikan dengan membangun konsep menggunakan prinsip statistika dan data analisis dengan komputer.
Istilah "data sains" bisa dilacak kembali ke tahun 1974, ketika Peter Naur mengajukan alternatif nama untuk ilmu komputer. Pada tahun 1997 C.F. Jeff Wu sekali lagi menyarankan bahwa statistika harusnya diubah namanya menjadi data sains. Beliau beralasan bahwa nomenklatur baru tersebut akan membantu statistika melepaskan stereotip yang selama ini tidak akurat, seperti identik dengan akuntasi, atau hanya terbatas pada penggambaran data. Pada tahun 1998, Hayashi Chikio berpendapat bahwa data sains adalah cabang ilmu pengetahuan baru dengan tiga aspek: desain data, pengumpulan data, dan analisis data
Selama tahun 1990-an, ada banyak istilah populer dalam proses menemukan pola pada kumpulan data (yang sangat luas) termasuk "penemuan pengetahuan" dan "penambangan data".
Penggunaan di era modern
Peng-artian modern dari data sains sebagai sebuah cabang ilmu baru salah satunya berkat William S.Cleveland. Dalam sebuah makalah tahun 2001 dia menganjurkan perluasan teori statistik lebih dalam ke wilayah teknis; karena akan mengubah bidang secara signifikan, sehingga membutuhkan nama baru. "Data sains" menjadi lebih banyak dipakai pada tahun-tahun berikutnya setelah tahun 2002, Komite Data untuk Ilmu Pengetahuan dan Teknologi merilis Data Science Journal. Di tahun 2003, Columbia University merilis The Journal of Data Science. Pada 2014 Asosiasi Statistika Amerika mengubah nama satu seksinya menjadi Pembelajaran Statistik dan Data Sains, yang menggambarkan kepopuleran dari data sains.
Pada tahun 2008 DJ Patil dan Jeff Hammerbacher mempelopori gelar profesional dari "data saintis". Meskipun gelar tersebut telah digunakan oleh Dewan Sains Nasional pada laporan mereka di tahun 2005, "Long-Lived Digital Data Collections: Enabling Research an Education pada Abad ke-21", yang secara luas mengacu pada peran kunci dalam mengelola sebuah kumpulan data digital.
Sumber Artikel: id.wikipedia.org
Ilmu Data
Dipublikasikan oleh Muhammad Farhan Fadhil pada 25 Maret 2022
Pernahkah Anda bertanya bagaimana media sosial merekomendasikan artikel, web page, atau user lain untuk diikuti? Atau, barangkali Anda pernah mendapati iklan tentang barang yang secara kebetulan dibutuhkan muncul tiba-tiba saat sedang asyik mengulik foto maupun video di media sosial Instagram? Jika iya, berarti Anda sedang merasakan sendiri bagaimana teknologi digital mengubah pola advertising saat ini. Hal-hal tersebut bisa terjadi berkat fenomena big data yang saat ini digunakan oleh perusahaan digital. Seiring kemunculan berbagai platform tempat berbagi konten foto, teks, video, dan data diri, data pribadi pun sudah tak menjadi hal yang sifatnya privasi di era ini.
Jumlah data ini luar biasa banyak sehingga dapat dikelola dengan baik untuk berbagai kepentingan, termasuk dalam bidang bisnis. Head of Data Science Program Bina Nusantara (Binus University) Alexander Gunawan mengatakan, perkembangan teknologi yang semakin pesat membuat hampir semua perusahaan memiliki dan dapat memanfaatkan big data, baik yang bersifat publik maupun privat. “Di Indonesia, semakin banyak perusahaan berbasis teknologi informasi (TI) seperti start-up yang berjalan secara online menggunakan data digital,” kata Alexander saat diwawancara Kompas.com, Kamis (26/11/2020). Alex juga mengatakan, big data tidak hanya dapat dimanfaatkan untuk kepentingan bisnis perusahaan teknologi, tetapi juga bidang lain mulai dari pemerintahan, perbankan, aktuaria (asuransi), konsultan jasa statistik, telekomunikasi, industri pabrik, pemasaran, industri kimia dan farmasi, hingga riset kesehatan.
Gunanya bermacam-macam. Di bidang pemerintahan misalnya, big data digunakan untuk mempercepat pengambilan keputusan, monitoring, dan evaluasi. Sementara di perbankan, big data dapat digunakan untuk meminimalisasi terjadinya kredit bermasalah dan kerugian bank, serta sebagai basis informasi mengenai rekam jejak debitur dalam aktivitas bisnis sehari-hari. Alexander menjelaskan, untuk mengambil, menyimpan, dan menganalisis data-data digital, diperlukan keilmuan data science dengan sumber daya manusia (SDM) yang kompeten dalam bidang ini. Dengan mengoptimalisasi data-data tersebut, lanjut Alexander, perusahaan dapat memperbaiki sekaligus meningkatkan layanan kepada konsumen.
“Jika (perusahaan) tidak mengacu pada data dan melihat perkembangan tren selera customer, mereka tidak dapat mengembangkan aplikasi maupun layanan yang relevan dengan kebutuhan konsumen,” jelasnya. Karenanya, lanjut dia, perusahaan perlu melakukan upgrading skill data analis SDM sehingga karyawan mahir sebagai data scientist.
Kebutuhan vital SDM data science
Di Indonesia, SDM dengan kompetensi data science masih kurang. Untuk mengisi kesenjangan (gap) terhadap kebutuhan tersebut, kata Alex, perusahaan melakukan upgrading SDM yang sudah ada lewat training (pelatihan) dari pihak ketiga. "Dengan begitu, SDM yang sudah ada bisa dimanfaatkan untuk mengolah data," kata Alex.
Meski demikian, menurutnya, akan lebih efektif jika perusahaan tetap memiliki karyawan yang memiliki disiplin ilmu data science. Hal ini memudahkan mereka jika ingin mengolah data, membaca proyeksi bisnis, dan mengambil keputusan. "Makanya, kalau misal di perusahaan ada yang berlatar belakang pendidikan data science, orang-orang ini biasanya yang dijadikan pimpinan divisi," tambahnya. Sebagai pimpinan divisi, kata Alex, SDM potensial tersebut berperan untuk menyeragamkan kompetensi data science anggota divisi yang berasal dari berbagai latar belakang pendidikan, seperti ekonomi, informatika, maupun matematika. Kebutuhan akan SDM dengan disiplin ilmu data science juga diungkap Alex lewat publikasi World Economic Forum 2020 berdasarkan survei "Future of Job Report 2018". Di situ disebut bahwa data analyst dan data scientist menjadi peringkat pertama dari 10 pekerjaan paling bertumbuh pada 2022.
Alex memaparkan, keahlian dari disiplin ilmu ini memang akan terus dibutuhkan. Apalagi, imbuh Alex, di masa mendatang, ilmu data science semakin berkembang diikuti dengan jumlah data yang lebih besar. Keilmuan data science yang bersifat dinamis menurut Alexander juga menjadi tantangan tersendiri. Seiring laju teknologi yang semakin cepat, keahlian SDM harus diperbaharui setiap tahun. “Tahun ini pakai program apa, tahun depan (sudah) ganti program lain yang lebih relevan,” urainya. Di sisi lain, ilmu data science membutuhkan pengetahuan dasar yang kuat dalam bidang matematika dan statistik sebagai dasar kemampuan analis. Baca juga: Menuju 40 Tahun, Binus University Lakukan Hal-hal Ini Ia menilai, dua hal tersebut menjadi salah satu tantangan dalam menyiapkan SDM yang relevan.
Mempersiapkan SDM kompeten
Merespons kebutuhan industri terhadap SDM dengan kompetensi data science, Bina Nusantara (Binus) University menyediakan program studi strata 1 (S1) Data Science. Program Data Science merupakan bagian dari School of Computer Science yang terakreditasi A. Program studi ini mempelajari semua jenis data yang dihasilkan oleh proses bisnis dan operasional perusahaan. Kemudian, dianalisis menggunakan teknik mining data (penambangan data) untuk memahami bagaimana kinerja suatu bisnis dan untuk mengidentifikasi peluang yang baru. Adapun program ini dirancang untuk memberikan mahasiswa keterampilan programming software development, machine learning, proses riset, dan domain knowledge berdasarkan kasus dari berbagai bidang.
“(Seorang) data scientist sebenarnya seperti ‘detektif’. Mereka harus punya kemampuan untuk memecahkan persoalan dan memberikan solusi. Skill utama ‘detektif’ adalah mengumpulkan data, kemudian menganalisis data, mencari hubungan antara setiap fakta sehingga menghasilkan suatu insight atau solusi. Itu skill utamanya,” papar Alexander. Dalam proses belajar, lanjut dia, kalkulus dan statistik menjadi pelajaran fundamental untuk melakukan interpretasi data. Ketika berhadapan dengan data, terutama data yang detail dan ingin melakukan interpretasi hubungan variabel, ilmu statistik menjadi kunci. “Ketika jumlah data (yang dianalisis) sangat besar atau disebut big data atau mahadata, program studi Data Science mempelajari machine learning untuk mengolah data atau mencari pola data sehingga modelnya bisa digunakan untuk melakukan prediksi,” jelasnya.
Kemampuan lain yang juga harus dimiliki seorang lulusan Program Data Science adalah komunikasi. Kata Alex, solusi atau data yang telah diolah pada akhirnya akan disajikan dalam bentuk presentasi pada stakeholder. Di bagian ini, mereka harus cakap berkomunikasi, bahkan harus pintar storytelling. Alex menyebut, khusus di Binus, lulusan Program Data Science dipersiapkan untuk mampu bekerja di dunia industri. Karenanya, mahasiswa program tersebut dibekali portofolio sejumlah kasus untuk dipecahkan. “Bila mahasiswa yang punya minat pada teknologi, mereka bisa mengambil data-data maupun kasus yang berkaitan dengan teknologi. Bila tertarik pada bidang bisnis, (mereka) bisa mengambil data-data yang berkaitan dengan bisnis seperti data transaksi,” imbuhnya. Dengan portofolio tersebut, perkembangan skill mahasiswa bisa diketahui berdasarkan studi kasus yang telah dikerjakan.
Persiapan lain yang dilakukan agar mahasiswa siap berhadapan langsung dengan pelaku industri atau masyarakat adalah 3+1 Enrichment Program. Program ini berlangsung selama 2 semester atau sebanyak 32 SKS yang dimulai dari semester 5 atau 6 sampai semester 7. Selama setahun, mahasiswa akan belajar di luar lingkungan kampus dan menimba ilmu dari perusahaan-perusahaan multinasional atau global. Tujuan program ini adalah memberi kesempatan pada mahasiswa untuk terjun lebih awal ke dunia kerja. Dengan cara itulah, mahasiswa lebih siap bersaing. “Dalam 3+1 Enrichment Program, ada 5 jalur yang dapat dipilih mahasiswa, antara lain magang di industri, proyek riset, magang di luar negeri, entrepreneurship, dan kuliah kerja nyata (KKN),” terangnya.
Sumber Artikel: kompas.com
Ilmu Data
Dipublikasikan oleh Muhammad Farhan Fadhil pada 25 Maret 2022
Menteri Komunikasi dan Informatika (Menkominfo) Johnny G. Plate mendorong pers untuk mulai mengadopsi kemajuan teknologi digital yang berbasis big data, kecerdasan buatan (artificial intelligence/AI), dan metaverse.
Johnny yakin, penggunaan big data, AI, hingga metaverse akan berguna untuk memperkaya data dan analisis untuk produksi serta distribusi konten industri media.
“Orientasi industri media yang baik akan tercermin dari jurnalisme yang berkualitas berbasiskan data, analisis dan pendekatan teoritis yang memadai,” kata Johnny dalam acara Konvensi Nasional HPN 2022 dikutip dari Antara, Selasa (8/2/2022).
Johnny menilai bahwa transformasi tersebut juga penting dilakukan insan pers agar bisa menemukan model bisnis baru media, di tengah dampak krisis global akibat pandemi.
Johnny menambahkan, kondisi pertumbuhan arus data yang semakin besar memungkinkan perusahaan untuk melakukan identifikasi serta menyasar khalayak dengan lebih akurat.
Untuk distribusi konten, perkembangan kecerdasan buatan juga memudahkan perusahaan membangun personalisasi produk, serta layanan bagi audiens yang berbeda sesuai dengan kebutuhan.
“Saat ini di Indonesia pun kita melakukan roll out dan deployment 5G untuk merespons munculnya beragam teknologi, serta media digital yang baru misalnya metaverse, cloud computing, yang akan semakin mendorong pergeseran produksi maupun konsumsi di bidang komunikasi jurnalisme dan media,” jelasnya.
Johnny kemudian memberi contoh dengan mengutip laporan The New York Times yang menyebutkan bahwa hampir sepertiga konten yang diterbitkan jurnalis Bloomberg News dibuat dengan bantuan kecerdasan buatan atau robot reporter.
Ada pula The Huffington Post yang juga telah memanfaatkan big data sejak 2014 untuk mengoptimalisasi konten, mengautentikasi komentar, memastikan efektivitas iklan, mengatur penempatan iklan, hingga membuat personalisasi pasif.
Sumber Artikel: kompas.tv
Ilmu Data
Dipublikasikan oleh Muhammad Farhan Fadhil pada 25 Maret 2022
Profesi di bidang data kini tengah menjadi kebutuhan besar di banyak perusahaan. Hampir seluruh perusahaan kini membutuhkan tenaga praktisi data untuk dapat mengolah data dengan sebaik mungkin demi kemajuan bisnis.
Olahan data yang sempurna dapat mendatangkan informasi dan insight yang bermanfaat bagi kemajuan perusahaan. Oleh sebab itu, perusahaan pun rela memberikan upah besar kepada para praktisi data. Tak heran, jika semakin tahun semakin banyak orang yang tertarik untuk bisa berkarier di dunia data.
Sejalan dengan riset Kementerian Komunikasi dan Informatika RI yang menyatakan Indonesia membutuhkan setidaknya 9 juta Sumber Daya Manusia (SDM) atau talenta digital hingga tahun 2030 untuk bisa meraih manfaat maksimal dari ekosistem digital. DQLab Universitas Multimedia Nusantara (UMN) membahas sejumlah profesi di ranah data yang bersinar di tahun 2022 dan semakin menjanjikan 5 tahun mendatang:
1. Data Analyst
Pekerjaan ini berhubungan dengan berbagai jenis data serta memiliki peran dalam melakukan pengumpulan data, melakukan data preprocessing tahap awal, reporting, dan visualisasi data sebagai bentuk kesimpulan. Selain itu, sebagai Data Anlyst juga memanipulasi database dengan bahasa query serta bertanggung jawab terhadap analisis statistik dan interprestasi data. Sebagai Data Analyst yang kompeten dibutuhkan skill set yang harus dikuasai, yang mana mencangkup tools, seperti spreadsheets, Google Analytics, SQL, dan Tableau, serta ilmu dasar yang terdiri dari bahasa pemograman, visualisasi data, dan statistika.
2. Data Scientist
Profesi ini berperan membuat prediksi berdasarkan pola dari kumpulan data yang berasal dari masa lalu dan sekarang, kemudian data akan diolah dan dianalisis sampai menghasilkan informasi.Bisa dikatakan, Data Scientist lebih ke arah hal teknis seputar data, yang mana tugasnya meliputi perencanaan strategis untuk analisis data, melakukan data preprocessing dan visualisasi data. Seorang Data Scientist dituntut memiliki beberapa skill set, seperti statistika dan analytical skill, data mining, algoritma machine learning and deep learning, bahasa pemograman Python & R, serta komunikatif dalam menyampaikan hasil melalui visualisasi data.
3. Data Engineer
Pada profesi ini kamu akan menangani data yang mentah diperlukan kemampuan logis dan pengetahuan dasar terkait database serta bahasa pemograman. Tugasnya melibatkan komponen IT yang bertanggung jawab terhadap infrastruktur data di sebuah industri. Data Engineer berperan dalam mempersiapkan arsitektur data, membangun data warehouse, dan melakukan proses periapan data agar dapat digunakan oleh Data Scientist dan Data Analyst. Jika dilihat lebih spesifik, keterampilan yang dibutuhkan seorang Data Engineer adalah ETL (Extract, Transform, Load), menguasai pemodelan data, Data Warehousing, manipulasi data dengan SQL dan NoSQL, serta visualisasi data.
4. Business Intelligence
Dengan adanya profesi ini, perusahaan dapat menentukan langkah yang tepat berdasarkan fakta data yang sudah diolah sehingga menghasilkan kesimpulan. Business Intelligence merupakan gabungan antara business analytics, data mining, dan data visualization. Secara umum, perannya adalah meninjau data pelanggan yang telah dikumpulkan, mengawasi penyebaran data ke data warehouse, serta mengembangkan kebijakan dan prosedur untuk pengumpulan data dan analisis data. Skill set yang harus dikuasai untuk berkarier menjadi Business Intelligence, yang pertama kemampuan analisis data agar dapat melihat relevansi dan makna dari banyaknya data mentah. Ilmu komunikasi tak kalah penting, skill ini dibutuhkan saat kamu mempresentasikan hasil visualisasi data kamu serta yang terakhir adalah pengetahuan di bidang industri.
5. Business Analytics
Pada dasarnya, business analytics juga memiliki peran penting ketika perusahaan berbicara soal big data. Sederhananya, business analytics adalah pendekatan yang dapat dimanfaatkan untuk akses dan eksplorasi data perusahaan. Tujuannya tidak lain untuk menggali wawasan baru yang dapat meningkatkan rencana bisnis dan kinerja perusahaan. Oleh sebab itu, business analytics disebut sebagai pelengkap kehadiran business intelligence. Jika mereka dapat berjalan secara bersamaan, makan bisa menginterpretasikan data sebaik mungkin dalam memprediksi apa yang akan terjadi berdasarkan data. Business analytics juga dapat membantu dalam menyusun strategi, mengenal peluang pasar, menunjukkan potensi risiko, dan lain semacamnya.
Sumber Artikel: edukasi.kompas.com
Ilmu Data
Dipublikasikan oleh Admin pada 01 Maret 2022
Analisis data adalah proses inspeksi, pembersihan dan pemodelan data dengan tujuan menemukan informasi yang berguna, menginformasikan kesimpulan dan mendukung pengambilan keputusan. Analisis data memiliki banyak sisi dan pendekatan, mencakup beragam teknik dengan berbagai nama, dan digunakan dalam berbagai bidang bisnis, ilmu pengetahuan, dan ilmu sosial. Dalam dunia bisnis saat ini, analisis data berperan dalam membuat keputusan lebih ilmiah dan membantu bisnis beroperasi lebih efektif.[1]
Penggalian data adalah teknik analisis data tertentu yang berfokus pada pemodelan statistik dan penemuan pengetahuan untuk tujuan prediksi dan bukan murni deskriptif, sedangkan intelijen bisnis mencakup analisis data yang sangat bergantung pada agregasi, dengan fokus utama pada informasi bisnis.[2]
Proses analisis data
Diagram alur proses ilmu data dari Doing Data Science, oleh Schutt & O'Neil (2013)
Analisis, mengacu pada membagi keseluruhan menjadi komponen-komponen yang terpisah untuk pemeriksaan individu.[3] Analisis data, adalah proses untuk memperoleh data mentah, dan selanjutnya mengubahnya menjadi informasi yang berguna untuk pengambilan keputusan oleh pengguna.[4] Data, dikumpulkan dan dianalisis untuk menjawab pertanyaan, menguji hipotesis, atau menyangkal teori.[5]
Ahli statistik John Tukey, mendefinisikan analisis data pada tahun 1961, sebagai:
“Prosedur untuk menganalisis data, teknik untuk menafsirkan hasil dari prosedur tersebut, cara merencanakan pengumpulan data untuk membuat analisisnya lebih mudah, lebih tepat atau lebih akurat, dan semua mesin dan hasil statistik (matematis) yang berlaku untuk menganalisis data."[6]
Ada beberapa fase yang dapat dibedakan, dijelaskan di bawah ini. Fase-fase tersebut berulang, di mana umpan balik dari fase selanjutnya dapat menghasilkan pekerjaan tambahan di fase sebelumnya.[7] Kerangka kerja CRISP, yang digunakan dalam penambangan data, memiliki langkah serupa.
Persyaratan data
Data diperlukan sebagai masukan untuk analisis, yang ditentukan berdasarkan kebutuhan mereka yang mengarahkan analisis atau pelanggan (yang akan menggunakan produk akhir analisis).[8][9] Jenis umum entitas di mana data akan dikumpulkan disebut sebagai unit eksperimen (misalnya, orang atau populasi orang). Variabel khusus mengenai populasi (misalnya, usia dan pendapatan) dapat ditentukan dan diperoleh. Data mungkin numerik atau kategorikal (yaitu, label teks untuk angka).[7]
Pengumpulan data
Data dikumpulkan dari berbagai sumber.[10][11] Persyaratan dapat dikomunikasikan oleh analis kepada penjaga data; seperti, personel Teknologi Informasi dalam suatu organisasi.[12] Data juga dapat dikumpulkan dari sensor di lingkungan, termasuk kamera lalu lintas, satelit, alat perekam, dll. Data juga dapat diperoleh melalui wawancara, unduhan dari sumber online, atau membaca dokumentasi.[7]
Pengolahan data
Fase siklus kecerdasan yang digunakan untuk mengubah informasi mentah menjadi kecerdasan atau pengetahuan yang dapat ditindaklanjuti secara konseptual mirip dengan fase dalam analisis data. Data, ketika awalnya diperoleh, harus diproses atau diatur untuk analisis.[13][14] Misalnya, ini mungkin melibatkan penempatan data ke dalam baris dan kolom dalam format tabel (dikenal sebagai data terstruktur) untuk analisis lebih lanjut, seringkali melalui penggunaan spreadsheet atau perangkat lunak statistik.[7]
Sumber: id.wikipedia.org