Machine Learning
- Get link
- X
- Other Apps
Machine Learning
Halo, Machine Learning
Pak Tatang bapaknya Lingling.
Selamat datang di modul Machine Learning.
Horas! Tidak terasa perjalanan Anda hampir menuju tujuan akhir. Sebelumnya, Anda telah melewati perjalanan panjang mulai dari mempelajari konsep dasar data, fundamental data science, analisis data beserta latihannya, kemudian mengenal teknologi dan tools pendukung data science, hingga akhirnya sampai di pembelajaran machine learning untuk data science.
Untuk Anda yang baru pertama kali berkecimpung di bidang machine learning, mungkin Anda akan banyak berkenalan dengan istilah-istilah baru yang sangat menarik. Namun, apakah Anda mengetahui mengapa kita perlu mempelajari machine learning bersamaan dengan data science?
Sederhananya, machine learning merupakan disiplin ilmu yang bersinggungan dengan data science. Keduanya banyak digunakan perusahaan yang memanfaatkan teknologi ini karena cakupan pemanfaatannya yang sangat besar dan diharapkan mampu mengembangkan bisnis mereka. Menarik sekali, ya? Lalu, bagaimanakah penerapan machine learning yang lebih luas pada data science? Yuk, simak materi di bawah ini dengan saksama.
Berkenalan dengan Machine Learning
Tak kenal maka tak … (isi sendiri)
Sebelum mengetahui secara mendalam terkait machine learning, tentunya Anda perlu berkenalan terlebih dahulu, bukan? Mari kita simak definisi dari machine learning berikut.
Dilansir dari website AWS (Amazon Web Services) bahwa machine learning adalah ilmu pengembangan algoritma dan model secara statistik yang digunakan sistem komputer untuk menjalankan tugas tanpa instruksi eksplisit dan mengandalkan pola serta inferensi sebagai gantinya. Sederhananya, machine learning adalah ilmu pengembangan algoritma yang memanfaatkan konsep matematis dan statistik dalam menjalankan tugas tertentu tanpa instruksi eksplisit. Pada prosesnya, machine learning akan berusaha mengenal pola yang terdapat dalam sebuah data serta menggunakannya untuk menghasilkan prediksi.
Nah, sebelum membahas lebih dalam terkait cara kerja machine learning, perhatikan contoh dari penerapan machine learning di bawah ini.
Tentu Anda sudah tidak asing dengan tampilan tersebut. Yups! Gambar di atas merupakan salah satu representasi dari machine learning, yaitu Google Maps. Berkat bantuan machine learning, saat ini siapa pun yang ingin berpergian jauh tidak perlu khawatir lagi karena telah ada petunjuk yang hampir akurat menunjukkan jalan secara real-time. Selain itu, model machine learning pada aplikasi ini mampu memberikan berbagai rekomendasi jalur yang dapat dilalui beserta waktu tempuhnya.
Adapun contoh lain dari implementasi machine learning dan data science adalah fraud detection atau deteksi penipuan di bank menggunakan machine learning. Simak penjelasannya di bawah ini.
Penipuan merupakan masalah yang terus berkembang di industri perbankan, baik dalam hal kerugian finansial maupun hilangnya kredibilitas di mata user. Namun, tahukah Anda? Dari semua lembaga keuangan yang disurvei, hanya 56% yang mengatakan bahwa mereka menyelidiki insiden penipuan terburuk mereka.
Ternyata, pola penipuan berubah dan berkembang lebih cepat daripada yang bisa ditangani, salah satunya adalah False Positives (blocking genuine customers) yaitu memblokir pelanggan asli. Permasalahan penipuan ini adalah sulit terdeteksi karena banyaknya volume data yang akan diproses. Nah, tantangan tersebut ternyata dapat diatasi dengan menggunakan machine learning dalam sistem manajemen penipuan (fraud management systems).
Lalu, bagaimana machine learning menerapkan fraud detection?
Pada dasarnya, machine learning menganalisis kumpulan data yang sangat besar menggunakan algoritma kompleks untuk mengidentifikasi pola. Deep learning yang merupakan bagian dari machine learning berperan penting dalam membantu mesin memprediksi dan merespons situasi, meskipun tidak diprogram secara eksplisit dengan cara tersebut.
Gagasan di balik penggunaan machine learning adalah bahwa fraud detection menunjukkan pola tertentu yang membedakannya dari yang asli. Pola yang tidak biasa inilah yang akan diidentifikasi oleh model machine learning dan ditandai sebagai fraud atau penipuan. Algoritma machine learning dapat mendeteksi aktivitas penipuan lebih cepat dan lebih akurat daripada sistem berbasis aturan tradisional karena mereka dapat menggunakan kumpulan data yang lebih besar.
Setelah mengetahui cara machine learning menerapkan fraud detection, kira-kira seperti apa machine learning membantu fraud detection? Simak penjelasannya di bawah ini.
Program pencegahan penipuan (fraud prevention) dan manajemen risiko menggunakan machine learning dengan cara mengumpulkan dan mengategorikan sebanyak mungkin data sebelumnya, termasuk informasi tentang transaksi yang sah dan transaksi penipuan.
Nah, data-data tersebut kemudian digunakan untuk acuan dalam melatih model machine learning guna memprediksi transaksi curang.
Agar sistem fraud detection ini berhasil, ada baiknya memiliki data sebanyak mungkin dengan pola penipuan yang beragam sehingga memberikan banyak contoh untuk dipelajari. Sederhananya, semakin banyak data yang dikumpulkan dan dikategorikan, maka pola penipuan akan semakin beragam dan alhasil bentuk penipuan akan semakin dikenali.
Scope Machine Learning
Sebelum Anda mengenal machine learning, mari berkenalan dengan sanak keluarga machine learning lainnya. Pada dasarnya, Artificial Intelligence (AI), Machine Learning (ML), dan Deep Learning (DL) adalah konsep yang terkait dalam bidang teknologi komputer dan sering digunakan secara bergantian. Di bawah ini merupakan gambar dari hubungan ketiga bidang tersebut berdasarkan evolusi dan pengaruhnya.
Simak penjelasan detail berikut.
- Artificial Intelligence (AI)
Terlihat jelas pada gambar di atas bahwa eksistensi AI dimulai dari tahun 1950-an. AI menjadi langkah awal lahirnya machine learning dan deep learning di masa sekarang. Namun, sebenarnya apa sih istilah AI itu sendiri? AI adalah bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola. - Machine Learning (ML)
Keberadaan machine learning terjadi sekitar tahun 1980-an, yang berarti terjadi gap selama 30 tahun setelah konsep AI dikenal. Lalu, apa yang dilakukan oleh ML? Pada dasarnya, ML adalah subset AI yang membuat sistem mampu mengadaptasi kemampuan manusia untuk belajar. - Deep Learning (DL)
Terhitung masih belia, ketika kelas ini ditulis, DL baru menginjak 13 tahun karena ia lahir sekitar tahun 2010-an. Namun, algoritma Artificial Neural Network, yang merupakan bagian dari deep learning, telah dikenal sejak lama, lho. Kira-kira, apa definisi dari deep learning, ya? Deep learning adalah metode dalam AI yang mengajarkan komputer untuk memproses data dengan cara yang terinspirasi dari otak manusia. Model deep learning dapat mengenali pola kompleks dalam gambar, teks, suara, dan data lain untuk menghasilkan wawasan dan prediksi yang akurat. Oh iya! DL juga merupakan salah satu teknik dalam machine learning, lho!
Tidak terasa ya, ternyata sudah lebih dari 5 dekade eksistensi AI dan diikuti oleh keberadaan ML dan DL. Namun, sebenarnya mengapa kita perlu machine learning? Yuk, kita cari tahu alasannya di materi berikutnya.
Popularitas Machine Learning
Popularitas machine learning saat ini sudah tidak diragukan lagi. Kian hari machine learning makin dianggap penting karena volume dan variasi data yang semakin besar dari efek samping transformasi digital. Machine learning memungkinkan proses analisis kumpulan data besar dan kompleks dengan cepat dan akurat. Mudahnya, semakin besar keberadaaan volume dan variasi data, semakin berbanding lurus pula penggunaan machine learning.
Namun, apakah Anda tahu faktor yang memengaruhi peningkatan popularitas machine learning? Mari kita simak penjelasannya!
Faktor Popularitas Machine Learning
- Mature Field: Bidang machine learning telah banyak mengalami perubahan dan perkembangan selama beberapa dekade terakhir.
- Abundant Data: Jumlah data yang tersimpan setiap harinya semakin bertambah. Keberadaan machine learning menjadi penyelamat untuk keberlimpahan data tersebut karena mampu membantu mengolah data yang besar dan kompleks menjadi sebuah informasi yang bermakna untuk mendorong pengambilan keputusan.
- Abundant Computation: Machine learning populer karena sumber daya komputasi yang berlimpah dan murah. Hal ini memungkinkan kita mengolah data yang berjumlah sangat besar dan melakukan eksperimen dengan algoritma machine learning yang lebih kompleks.
Dari ketiga faktor alasan popularitas machine learning tersebut, dapat disimpulkan bahwa kemampuan machine learning telah matang, baik dari segi metode maupun alat. Kemudian, berlimpahnya data yang dapat dipelajari untuk membuat keputusan serta mudahnya akses komputasi untuk menjalankan metode yang terdapat dalam machine learning turut menyumbang popularitasnya.
Pentingnya Machine Learning
Popularitas yang kian meningkat otomatis menaikkan pentingnya keberadaan machine learning. Tak dapat dipungkiri, Anda pun telah mengetahui bahwa banyak teknologi yang menggunakan machine learning. Namun, apakah sepenting itu sebuah machine learning di era teknologi saat ini? Mari kita cari tahu jawabannya di bawah ini.
Data adalah sumber kehidupan dari semua bidang, terlebih lagi untuk sebuah bisnis. Keputusan berdasarkan data semakin membuat perbedaan antara mengikuti persaingan pasar atau tertinggal lebih jauh. Keberadaan machine learning menjadi kunci untuk membuka nilai perusahaan serta membuat keputusan agar tetap terdepan dalam persaingan.
Terlebih lagi, machine learning dianggap begitu penting karena memberikan perusahaan sebuah pandangan tentang tren perilaku pelanggan (customer behaviour) dan pola operasional bisnis, serta mendukung pengembangan produk baru. Banyak perusahaan terkemuka saat ini seperti Facebook dan Google menjadikan machine learning sebagai bagian sentral dari operasi mereka.
Dengan demikian, dapat disimpulkan bahwa machine learning telah menjadi pembeda kompetitif yang signifikan bagi banyak perusahaan.
Mari kita intip beberapa hasil karya Google dalam memanfaatkan machine learning di bawah ini.
- Google Translate
Siapa yang tidak tahu teknologi satu ini? Mungkin Anda merupakan salah satu yang menggunakan teknologi ini untuk memudahkan dalam menerjemahkan bahasa. Fitur Google Translate menggunakan Neural Machine Translation (NMT) untuk membantu banyak orang menerjemahkan teks ke dalam bahasa pilihan mereka sendiri. Pembahasan terkait NMT akan dibahas di materi akhir.
- Gmail
Lagi-lagi, siapa yang tidak menganggap Gmail bagian penting dari hidupnya? Tentu, di era teknologi ini, proses pengiriman pesan menjadi lebih efisien berkat adanya bantuan pesan elektronik. Gmail menjadi salah satu provider pesan elektronik yang memudahkan penggunanya dalam mengirim sebuah pesan ke seluruh dunia.
Gmail memiliki fitur kategorisasi Inbox untuk setiap email yang masuk, seperti Utama, Promosi, dan Sosial. Hal tersebut karena Google menggunakan algoritma machine learning untuk memfilter email dan mengklasifikasikannya berdasarkan riwayat pencarian, riwayat browser melalui sistem, dan minat. Selain itu, layanan Gmail juga punya fitur smart reply yang menggunakan algoritma machine learning untuk menyarankan balasan cepat sesuai dengan teks yang diterima pada email tertentu.
- Google Photos
Saat ini, sebagian orang menggunakan berbagai aplikasi media sosial untuk menunjukkan status dan foto mereka terkait dengan gaya hidup dan sebagai wadah penyimpanan banyak gambar untuk digunakan di masa mendatang. Tentunya, dengan kebutuhan tersebut, dibutuhkan sebuah media penyimpanan yang baik. Google Photos hadir membantu pengguna untuk menyimpan gambar mereka di cloud. Pengguna dapat mengaksesnya kapan saja mereka mau. Google Photos menggunakan algoritma machine learning untuk menyarankan beberapa foto terbaik dari album yang telah dibuat. Fitur lain yang dimiliki oleh Google Photos adalah pengorganisasian gambar berdasarkan pengenalan wajah, lokasi, waktu, dan lain-lain. Sangat menarik, ya?
Seperti ketiga penerapan machine learning yang telah diterapkan oleh Google, tentu Anda paham bahwa eksistensi machine learning sudah tidak dapat diragukan lagi, bahkan mungkin Anda sendiri juga menggunakannya. Lalu, bagaimana sebenarnya hubungan antara data science dan machine learning, ya? Yuk, simak penjelasannya di bawah ini.
Peran Machine Learning di Data Science
Menjadi bagian dari data science, tentunya machine learning memiliki peran khusus dalam perkembangan dan penggunaannya. Sebelum mengetahui peran machine learning di data science, mari kita ketahui terlebih dahulu perbedaan di antara keduanya.
| Machine Learning | Data Science |
|---|---|
Machine learning adalah bagian dari bidang artificial intelligence (AI) yang memungkinkan sistem belajar dari data untuk mengidentifikasi pola dan membuat prediksi secara otomatis dengan campur tangan manusia yang minimal. | Data science adalah semua tentang proses dan sistem untuk mengekstrak insight dari data terstruktur dan semi terstruktur. |
Machine learning memanfaatkan pengalaman masa lalu untuk mempelajari tentang data. | Data science berurusan dengan data, baik masa lalu maupun real-time. |
Adapun peran machine learning dalam data science adalah sebagai berikut.
Machine learning dan artificial intelligence telah mendominasi industri yang membayangi setiap aspek data science lainnya, seperti analisis data, business intelligence, dan lain-lain.
Pada bidang data science, machine learning banyak digunakan untuk menghasilkan prediksi dan membantu dalam mengambil keputusan. Pada prosesnya, machine learning akan mencari pola dalam data yang sangat besar, lalu menggunakannya untuk menghasilkan sebuah prediksi. Kemampuan machine learning dalam mengolah dan mengidentifikasi pola dalam data inilah yang membuatnya menjadi tools utama para data scientist profesional.
Alur tipikal untuk machine learning adalah seperti berikut:
- Anda mengumpulkan data yang akan digunakan untuk melatih model (sering disebut data latih).
- Kemudian, Anda memproses data dan menentukan fitur (kolom) terbaik untuk melatih model sesuai dengan tujuan Anda.
- Selanjutnya, model dilatih untuk mengidentifikasi pola yang terdapat dalam data latih.
- Terakhir, performa model akan diuji untuk memastikan model tersebut menghasilkan prediksi yang baik.
- Setelah performa model dirasa cukup, model tersebut siap untuk membuat prediksi saat Anda mengunggah kumpulan data baru di lain waktu.
Anda mungkin pernah mendengar aplikasi Google Lens. Ia merupakan sebuah aplikasi yang memungkinkan Anda mengidentifikasi apa pun yang Anda potret. Misalkan Anda ingin menyiapkan makanan untuk kebutuhan liburan, Anda ingin mengetahui harga dari makanan tersebut dengan menggunakan bantuan Google Lens seperti berikut.
Google Lens akan melihat bentuk dan rupa dari barang yang Anda cari. Ketika kita menekan shutter, Google Lens mulai memindai gambar tersebut dan menampilkan gambar yang serupa. Gambar yang serupa tersebut merupakan hasil rekomendasi dari model machine learning. Pada prosesnya, ia akan mengenali pola yang terdapat dalam gambar, lalu mencari gambar atau konten yang mirip.
Mari kita simak alur kerja untuk machine learning dalam data science di bawah ini.
Simak penjabaran berikut.
- Memahami masalah bisnis
Untuk membangun model bisnis yang sukses, sangat penting untuk memahami masalah bisnis yang dihadapi klien. Misalnya, destinasi wisata di Bali yang tidak merata sehingga perlu peninjauan khusus terkait peningkatan kualitas destinasi wisata yang memiliki rating berada di bawah rata-rata.
- Pengumpulan data
Setelah memahami pernyataan masalah, Anda harus mengumpulkan data yang relevan. Sesuai masalah bisnis, data dikategorikan berdasarkan data terstrukur, tidak terstruktur, dan semi-terstruktur dari basis data apa pun di seluruh sistem.
- Persiapan data
Langkah pertama persiapan data adalah melakukan pembersihan data. Ini adalah langkah yang penting untuk dilakukan. Dalam persiapan data, Anda menghilangkan duplikat dan nilai kosong, tipe data yang tidak konsisten, entri yang tidak valid, data yang hilang, dan pemformatan yang tidak tepat.
- Analisis data eksplorasi atau exploratory data analysis (EDA)
Exploratory Data Analysis memungkinkan Anda untuk mengungkap wawasan berharga yang akan berguna di fase berikutnya dari siklus hidup data science.
- Rekayasa fitur (feature engineering)
Rekayasa fitur adalah salah satu langkah penting dalam proyek data science. Ini membantu dalam membuat fitur baru atau mengubah dan menskalakan fitur. Dalam domain ini, keahlian teknis memainkan peran penting dalam menghasilkan wawasan baru dari langkah eksplorasi data.
- Pelatihan model
Dalam pelatihan model, terdapat tahap menyesuaikan data pelatihan; di sinilah proses “belajar” dimulai. Pada tahap ini, kita melatih model machine learning menggunakan data latih.
- Model evaluasi
Setelah pelatihan model selesai, saatnya untuk mengevaluasi kinerjanya. Mengevaluasi model pada kumpulan data baru akan memberi Anda gambaran tentang bagaimana kinerja model Anda.
- Penyetelan hyperparameter
Setelah model dilatih dan dievaluasi, kinerja model dapat ditingkatkan lagi dengan menyetel hyperparameter-nya. Penyesuaian hyperparameter model penting untuk meningkatkan kinerja model secara keseluruhan.
- Membuat prediksi dan siap diterapkan
Ini adalah tahap akhir dari machine learning. Di sini, model machine learning yang telah dilatih siap menghasilkan prediksi. Pada tahap ini, Anda dapat memasukkan model tersebut ke dalam tahap produksi.
Tipe-Tipe Machine Learning
Setelah berkenalan dan mengetahui popularitas machine learning di dunia, pada bagian ini Anda akan dikenalkan dengan algoritma machine learning yang umum digunakan. Model machine learning dapat dibedakan berdasarkan penggunaannya, seperti supervised, unsupervised, dan reinforcement learning. Ketiganya merupakan istilah yang digunakan untuk memisahkan model dalam fungsi tertentu. Ingin tahu lebih lanjut? Yuk, kita simak materi berikutnya.
Supervised Learning
Supervised learning adalah pendekatan machine learning yang ditentukan oleh penggunaan kumpulan data yang berlabel. Kumpulan data ini dirancang untuk melatih atau mengawasi algoritma dalam mengklasifikasikan data atau memprediksi nilai kontinu. Dengan menggunakan data berlabel, kita dapat mengukur performa model sehingga performanya dapat meningkat dari waktu ke waktu.
Berikut merupakan fungsi dari supervised machine learning.
- Mengklasifikasikan berbagai jenis file, seperti gambar, dokumen, atau kata-kata tertulis.
- Memprediksi nilai dari data kontinu.
- Meramal tren dan hasil masa depan melalui pola pembelajaran dalam data penelitian.
Sebagai contoh penggunaan supervised learning adalah prediksi harga emas, tren pandemi Covid-19, dan sebagainya.
Unsupervised Learning
Bertolak belakang dengan supervised learning, tipe unsupervised learning merupakan pelatihan model pada data tidak berlabel. Ini sering digunakan untuk mengidentifikasi pola dan tren dalam kumpulan data atau mengelompokkan data serupa ke dalam sejumlah kelompok tertentu.
Berikut merupakan fungsi dari unsupervised machine learning.
- Mengklasifikasikan dataset pada kesamaan antara fitur atau segmen pada data.
- Memahami hubungan antara berbagai titik data
- Melakukan analisis data awal.
Contoh kasus penggunaan unsupervised learning adalah sistem rekomendasi pada Spotify. Apabila Anda pengguna Spotify, tentu sudah tidak asing dengan cara penggunaannya. Apabila Anda sering menggunakan Spotify sebagai sarana mendengarkan musik, pasti Anda akan melihat rekomendasi lagu selanjutnya yang akan diputar seperti berikut.
Hal di atas merupakan salah satu implementasi unsupervised learning, yaitu ketika mesin mampu belajar dari data yang ada dan belum dilabelkan. Hal tersebut juga terjadi pada platform lain seperti Youtube, Netflix, dan masih banyak lagi.
Reinforcement Learning
Reinforcement learning adalah salah satu dari tiga paradigma machine learning di samping supervised dan unsupervised. Secara umum, tipe machine learning ini mampu memahami dan menginterpretasikan lingkungannya, mengambil tindakan, dan belajar melalui coba-coba. Lalu, kapan kita bisa menggunakan reinforcement learning?
Jawabannya adalah ketika terjadi interaksi antara kita dan mesin, long-term reward, hingga decision-making. Pada reinforcement learning, sulit untuk mendapatkan data yang “benar” untuk setiap kondisi.
Gambar di atas merupakan penerapan reinforcement learning di setiap bidang. Berikut merupakan pembahasan salah satu penerapan reinforcement learning, yaitu traffic signal control.
Dalam contoh ini, reinforcement learning digunakan sebagai pendekatan berbasis data yang sedang tren untuk mengontrol sinyal lalu lintas yang adaptif. Model ini dilatih dengan tujuan mempelajari kebijakan penggunaan fungsi nilai yang secara optimal mengontrol lampu lalu lintas berdasarkan status lalu lintas saat ini.
Ada beberapa batasan dalam menerapkan algoritma reinforcement learning ke jaringan transportasi, seperti eksplorasi-eksploitasi, skema pelatihan multi agen, ruang tindakan berkelanjutan, koordinasi sinyal, dll.
Algoritma Machine Learning
Seperti yang telah kita ketahui bahwa evolusi machine learning berawal dari artificial intelligence, lalu masuk machine learning, dan sekarang berada di zaman deep learning. Nah, pada materi ini, Anda hanya akan mempelajari terkait machine learning.
Berikut merupakan penjelasan dua dari banyak algoritma machine learning, yaitu Linear Regression dan Logistic Regression.
Linear Regression
Linear regression atau regresi linier merupakan jenis algoritma machine learning. Lebih khusus lagi, ia merupakan algoritma machine learning supervised yang belajar dari kumpulan data berlabel dan memetakkan titik data ke fungsi linier yang paling optimal serta dapat digunakan untuk prediksi pada kumpulan data baru.
Tujuan dari algoritma ini adalah untuk menemukan persamaan linier terbaik yang dapat memprediksi nilai variabel dependen berdasarkan variabel independen. Persamaan tersebut memberikan garis lurus yang mewakili hubungan antara variabel dependen dan independen. Kemiringan garis menunjukkan seberapa besar perubahan variabel dependen untuk satu unit perubahan dalam variabel independen.
Logistic Regression
Logistic regression atau regresi logistik adalah salah satu algoritma machine learning paling populer yang berada di bawah teknik supervised learning. Ia digunakan untuk memprediksi kategori variabel dependen menggunakan seperangkat variabel independen yang diberikan.
Logistic regression memprediksi output dari kategori variabel dependen. Oleh karena itu, hasilnya harus menjadi nilai kategoris atau diskrit yang bisa berupa “Ya” atau “Tidak”, “0” atau “1”, “Benar” atau “Salah”, dan lain sebagainya. Namun, alih-alih memberikan nilai pasti sebagai 0 dan 1, ia akan memberikan probabilitas yang terletak antara 0 dan 1.
Logistic regression sangat mirip dengan linear regression kecuali cara penggunaannya. Linear regression digunakan untuk menyelesaikan masalah regresi, sedangkan logistic regression digunakan untuk menyelesaikan masalah klasifikasi.
Linear Regression vs. Logistic Regression
| Linear Regression | Logistic Regression |
|---|---|
Regresi linier digunakan untuk memprediksi variabel dependen kontinu menggunakan sekumpulan variabel independen tertentu. | Regresi logistik digunakan untuk memprediksi variabel dependen kategoris menggunakan seperangkat variabel independen yang diberikan. |
Regresi linier digunakan untuk menyelesaikan masalah regresi. | Digunakan untuk memecahkan masalah klasifikasi. |
Memprediksi nilai variabel kontinu. | Memprediksi nilai variabel kategoris. |
Fit line (garis lurus). | Menggunakan s-curve. |
Keluaran berupa nilai kontinu, seperti harga, umur, dll. | Keluaran berupa nilai kategoris. seperti 0 atau 1, Ya atau Tidak, dll. |
Bagaimana terkait penjelasan algoritma yang terdapat pada machine learning? Apakah cukup paham? Apabila Anda merasa kurang paham, bisa langsung bertanya di forum diskusi, ya.
Algoritma Deep Learning
Sebelum membahas terkait deep learning, alangkah baiknya mari kita identifikasi perbedaan dari kedua hal tersebut.
Pada algoritma machine learning, kita perlu menentukan secara manual fitur utama yang akan digunakan untuk melatih model. Di sisi lain, pada deep learning, model akan mengidentifikasi sendiri fitur penting yang terdapat di dalam sebuah data.
Selain itu, algoritma machine learning biasanya digunakan untuk mengidentifikasi pola yang terdapat dalam data terstruktur (tabular), sedangkan deep learning biasanya digunakan untuk memproses unstructure data seperti gambar, suara, text, dll.
Berkenalan dengan Deep Learning
Deep learning adalah metode dalam bidang artificial intelligence yang mengajarkan komputer untuk memproses data layaknya otak manusia ketika berpikir. Model deep learning dapat mengenali pola kompleks dalam gambar, teks, suara, dan data lain untuk menghasilkan wawasan serta prediksi akurat. Anda dapat menggunakan metode deep learning untuk mengotomatiskan tugas yang biasanya membutuhkan kecerdasan manusia, seperti mendeskripsikan citra atau menyalin file suara ke dalam teks.
Fitur Deep Learning
Mengapa deep learning menjadi hal yang populer? Alasannya adalah karena ia dapat mengolah jumlah data yang besar dan kompleks. Andrew Ng mengemukakan “Analogi deep learning adalah mesin roket.” Maksud dari analogi tersebut adalah model deep learning seperti roket dan bahan bakarnya adalah data yang besar.
Biasanya, algoritma deep learning membutuhkan waktu lama untuk dilatih karena memiliki banyak parameter, sedangkan algoritma machine learning hanya memerlukan waktu hitungan detik hingga beberapa jam saja.
Salah satu fitur yang dimiliki deep learning adalah pengenalan wajah (face recognition). Beberapa perusahaan memperkenalkan face recognition untuk karyawannya, salah satunya adalah Facebook untuk mengenali wajah dalam foto. Namun, mungkin di masa mendatang, face recognition itu tidak hanya untuk kebutuhan karyawan, melainkan bisa jadi untuk pelanggan yang ingin membayar hasil belanja di supermarket menggunakan face recognition.
Namun, masih terdapat masalah atau kekurangan yang dimiliki oleh fitur deep learning ini, yaitu ketika terdapat perubahan pada wajah Anda, baik mencukur rambut, memotong kumis, maupun menggunakan penutup kepala, maka fitur tersebut kemungkinan takkan berfungsi dengan baik karena sistem tidak dapat memindai wajah terbaru Anda.
Mengapa Perlu Deep Learning
Deep learning adalah subset dari machine learning dan secara tidak langsung merupakan bagian dari artificial intelligence (AI). Pada penerapannya, artificial intelligence dan deep learning saling menopang satu sama lain sehingga menjadi satu paduan teknologi yang canggih.
Pada dasarnya, artificial intelligence (AI) akan melatih komputer untuk berpikir dan belajar layaknya manusia sehingga dari hal tersebut terdapat beberapa teknologi deep learning yang mendorong banyak aplikasi AI seperti berikut.
- Asisten digital (digital assistant atau chatbot),
- Deteksi penipuan (fraud detection),
- Pengenalan wajah otomatis (face recognition),
- dan masih banyak lagi.
Jadi, sebenarnya mengapa kita perlu deep learning?
Adanya deep learning sangat bermanfaat bagi para data scientist yang bertugas mengumpulkan, menganalisis, dan menafsirkan data dalam jumlah besar. Deep learning juga akan membuat proses apa pun menjadi lebih cepat dan mudah.
Neural Network
Neural network adalah metode dalam artificial intelligence yang mengajarkan komputer untuk memproses data yang terinspirasi dari cara kerja otak manusia. Neural network adalah tipe proses machine learning yang termasuk dalam deep learning. Dalam prosesnya, ia menggunakan simpul atau neuron yang saling terhubung dalam struktur berlapis yang menyerupai otak manusia.
Agar Anda lebih paham dengan cara kerja dari neural network, perhatikan contoh penerapannya di bawah ini.
Sebagian masyarakat yang menggunakan bahasa Indonesia sebagai bahasa ibu tentu akan merasa kebingungan untuk memahami maksud dari kalimat tersebut. Anda pasti menggunakan Google Translate untuk mengartikannya, bukan?
Pernahkah terlintas dalam pikiran Anda: Kok bisa, ya, Google Translate mentranslasi banyak bahasa?
Nah, tahukah Anda? Pada kenyataannya, sebuah translator membutuhkan teknologi yang cukup rumit untuk bisa menerjemahkan bahasa asing secara akurat. Teknologi di balik Google Translate itu disebut Machine Translation (MT).
Machine Translation adalah mesin yang bertugas untuk mengonversi sebuah teks antarbahasa secara otomatis yang memanfaatkan konsep machine learning yang merupakan bagian dari Artificial Intelligence. Tentunya, proses yang dilewati oleh MT ini sangatlah kompleks karena setiap bahasa memiliki ciri khasnya tersendiri dan kaya akan diksi serta konteks yang menyertainya.
Contohnya, Anda ingin menyampaikan kalimat seperti di bawah ini.
“Saya tidak enak badan.”
Apabila Anda menerjemahkannya kata per kata ke dalam bahasa Inggris, artinya akan seperti di bawah ini.
“I don’t delicious body.”
Aneh sekali, ya? Belum lagi, kalimat di atas tidak tepat secara diksinya. Padahal, Anda bisa menyampaikan dengan singkat dan tepat seperti berikut.
“I’m not feeling well.”
Sebelumnya, teknologi MT pada Google Translate bekerja sebagai penerjemah kata per kata (word-by-word) menggunakan statistical machine translation sehingga masih sulit dipercaya sebagai translator yang baik. Jadi, pada tahun 2016, Google beralih menggunakan Neural Machine Translation (NMT) yang dinamai sebagai Google Neural Machine Translation (GNMT).
Lalu, bagaimana cara kerja NMT?
Jika memperhatikan gambar di atas, proses menerjemahkan kalimat pada Google Translate dasarnya hanya melalui dua tahap, yaitu input bahasa yang akan diterjemahkan, kemudian diproses oleh neural network di dalamnya. Setelah diproses, ia akan menghasilkan output berupa bahasa hasil terjemahan.
Namun, apa isi di dalam neural network sehingga dapat menerjemahkan banyak bahasa yang kita butuhkan?
Sebagaimana namanya, neural network merupakan jaringan saraf buatan yang terinspirasi dari jaringan saraf biologis yang menyusun otak manusia. Neural network umumnya terdiri dari 3 lapisan yaitu input layer, hidden layer, dan output layer.
- Input layer merupakan bagian yang menampung masukan (pada konteks ini merupakan kata atau kalimat yang akan diterjemahkan) yang akan diproses oleh neural network.
- Hidden layer merupakan bagian yang akan memproses inputan tersebut guna menghasilkan sebuah output.
- Output layer (bisa berupa angka, nilai probabilitas, ataupun vektor) merupakan lapisan yang akan menghasilkan keluaran dari neural network tersebut.
Bagaimana terkait pembahasan neural network? Apakah Anda cukup paham? Apabila Anda masih merasa bingung terkait pembahasan tersebut, bertanya di forum diskusi, yuk!
Implementasi Deep Learning di Industri
Di bawah ini merupakan implementasi deep learning di berbagai sektor industri yang terdiri dari sektor penegakan hukum, sektor layanan keuangan, dan customer service. Bagaimana cara implementasinya? Yuk, simak penjelasannya di bawah ini.
- Penegakan Hukum
Deep learning dapat menganalisis dan belajar dari data transaksional untuk mengidentifikasi pola berbahaya yang mengindikasikan kemungkinan aktivitas penipuan atau kriminal. Speech recognition, computer vision, dan aplikasi deep learning lainnya dapat meningkatkan efisiensi dan efektivitas analisis investigasi dengan mengekstraksi pola dan bukti dari rekaman suara, video, gambar, dan dokumen. Hal tersebut tentunya akan membantu penegak hukum untuk menganalisis data dalam jumlah besar secara lebih cepat dan akurat.
- Layanan Keuangan
Lembaga keuangan secara teratur menggunakan analitik prediktif untuk mendorong perdagangan algoritmik saham, menilai risiko bisnis untuk persetujuan pinjaman, mendeteksi penipuan, serta membantu mengelola portofolio kredit dan investasi untuk klien.
- Customer Service
Banyak organisasi dan perusahaan memasukkan teknologi deep learning ke dalam proses customer service mereka. Salah satu teknologi tersebut adalah Chatbots yang digunakan dalam berbagai aplikasi, layanan, dan customer service portal.
Machine Learning Project for Beginner
Untuk melengkapi portofolio sebagai data scientist, Anda dapat melatih kemampuan dalam machine learning dengan mencoba beberapa proyek pemula seperti yang tertera di bawah ini.
- Machine Learning untuk Prediksi Harga Rumah di Airbnb
Ini memandu Anda melalui seluruh alur kerja, mulai dari rekayasa fitur, pemilihan model, pembuatan prototype, hingga pemindahan prototype ke produksi.
- Machine Learning untuk Meningkatkan Kualitas Streaming Netflix
Pada 2018, Netflix melakukan streaming ke lebih dari 117 juta anggota di seluruh dunia, setengah dari mereka tinggal di luar AS. Postingan blog ini menjelaskan beberapa tantangan teknis mereka dan bagaimana mereka menggunakan machine learning untuk mengatasi tantangan ini, termasuk memprediksi kualitas jaringan, mendeteksi anomali perangkat, dan mengalokasikan sumber daya untuk caching prediktif.
Rangkuman Machine Learning untuk Data Science
Menurut AWS (Amazon Web Services) bahwa machine learning adalah ilmu pengembangan algoritma dan model secara statistik yang digunakan sistem komputer untuk menjalankan tugas tanpa instruksi eksplisit dan mengandalkan pola serta inferensi sebagai gantinya.
Sederhananya, machine learning adalah ilmu pengembangan algoritma yang memanfaatkan konsep matematis dan statistik dalam menjalankan tugas tertentu tanpa instruksi eksplisit. Pada prosesnya, machine learning akan berusaha mengenal pola yang terdapat dalam sebuah data serta menggunakannya untuk menghasilkan prediksi.
Scope Machine Learning
- Artificial Intelligence (AI)
Terlihat jelas pada gambar di atas bahwa eksistensi AI dimulai dari tahun 1950-an. AI menjadi langkah awal lahirnya machine learning dan deep learning di masa sekarang. Namun, sebenarnya apa sih istilah AI itu sendiri? AI adalah bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia, seperti pembelajaran, pemecahan masalah, dan pengenalan pola. - Machine Learning (ML)
Keberadaan machine learning sekitar tahun 1980an yang berarti terjadi gap selama 30 tahun setelah konsep AI dikenal. Lalu, apa yang dilakukan oleh ML? Pada dasarnya ML adalah subset AI yang membuat sistem agar mampu mengadaptasi kemampuan manusia untuk belajar. - Deep Learning (DL)
Terhitung masih belia, ketika kelas ini ditulis, DL baru menginjak 13 tahun karena ia lahir sekitar tahun 2010-an. Namun, algoritma Artificial Neural Network yang merupakan bagian dari deep learning telah dikenal sejak lama, lho. Kira-kira apa definisi dari deep learning, ya? Deep learning adalah metode dalam AI yang mengajarkan komputer untuk memproses data dengan cara yang terinspirasi otak manusia. Model deep learning dapat mengenali pola kompleks dalam gambar, teks, suara, dan data lain untuk menghasilkan wawasan dan prediksi yang akurat.
Faktor Popularitas Machine Learning
- Mature Field
Bidang machine learning telah banyak mengalami perubahan dan perkembangan selama beberapa dekade terakhir. Awalnya, machine learning tumbuh dari bidang artificial intelligence dan merupakan kumpulan metode yang dipelajari dari data atau pengalaman sebelumnya. Seiring berkembangnya zaman, machine learning berfokus pada metode statistik dan probabilitas yang dipadupadankan dengan data dan pengalaman yang telah dipelajari sebelumnya.
- Abundant Data
Jumlah data yang tersimpan setiap harinya semakin bertambah. Keberadaan machine learning menjadi penyelamat untuk keberlimpahan data tersebut karena mampu membantu mengolah data yang besar dan kompleks menjadi sebuah informasi yang bermakna untuk mendorong pengambilan keputusan.
- Abundant Computation
Machine learning populer karena sumberdaya komputasi yang berlimpah dan murah. Hal ini memungkinkan kita mengolah data yang berjumlah sangat besar dan melakukan eksperimen dengan algoritma machine learning yang lebih kompleks.
Pentingnya Machine Learning
Data adalah sumber kehidupan dari semua bidang terlebih lagi untuk sebuah bisnis. Keputusan berdasarkan data semakin membuat perbedaan antara mengikuti persaingan atau tertinggal lebih jauh. Keberadaan machine learning ini menjadi kunci untuk membuka nilai data perusahaan dan customer serta membuat keputusan yang membuat perusahaan tetap terdepan dalam persaingan. Terlebih lagi, machine learning dianggap begitu penting karena memberikan perusahaan sebuah pandangan tentang tren perilaku pelanggan (Customer Behaviour) dan pola operasional bisnis, serta mendukung pengembangan produk baru. Di bawah ini merupakan hasil dari penerapan machine learning di industri.
- Google Translate
- Gmail
- Google Photos
Peran Machine Learning di Data Science
Di bawah ini merupakan perbedaan antara machine learning dan data science yang perlu Anda ketahui.
| Machine Learning | Data Science |
|---|---|
Machine learning adalah bidang artificial intelligence (AI) yang memungkinkan software belajar dari data untuk mengidentifikasi pola dan membuat prediksi secara otomatis dengan campur tangan manusia yang minimal. | Data Science adalah semua tentang proses dan sistem untuk mengekstrak insight dari data terstruktur dan semi terstruktur. |
Machine learning memanfaatkan pengalaman masa lalu untuk mempelajari tentang data. | Data Science berurusan dengan data, baik masa lalu maupun real-time. |
Machine learning terdiri dari tiga jenis: Supervised learning, Unsupervised learning, dan Reinforcement learning. | Data gathering, manipulasi, data cleaning, dll adalah operasi data science. |
Alur Kerja Machine Learning Dalam Data Science
Alur machine learning dalam data science umumnya terbagi menjadi 9 tahap seperti yang tertera pada gambar di bawah ini.
- Memahami masalah bisnis
Untuk membangun model bisnis yang sukses, sangat penting untuk memahami masalah bisnis yang dihadapi klien. Misalnya, destinasi wisata di Bali yang tidak merata, sehingga perlu peninjauan khusus terkait peningkatan kualitas destinasi wisata yang memiliki rating berada di bawah rata-rata.
- Pengumpulan data
Setelah memahami pernyataan masalah, Anda harus mengumpulkan data yang relevan. Sesuai masalah bisnis, data dikategorikan berdasarkan data terstruktur, tidak terstruktur, dan semi-terstruktur dari basis data apa pun di seluruh sistem.
- Persiapan data
Langkah pertama persiapan data adalah melakukan pembersihan data. Ini adalah langkah yang penting untuk dilakukan. Dalam persiapan data, Anda menghilangkan duplikat dan nilai null, tipe data yang tidak konsisten, entri yang tidak valid, data yang hilang, dan pemformatan yang tidak tepat.
- Exploratory Data Analysis (EDA)
Exploratory Data Analysis memungkinkan Anda untuk mengungkap wawasan berharga yang akan berguna di fase berikutnya dari siklus hidup data science.
- Rekayasa fitur (Fitur Engineering)
Rekayasa fitur adalah salah satu langkah penting dalam proyek data science. Ini membantu dalam membuat fitur baru, mengubah dan menskalakan fitur. Dalam domain ini, keahlian memainkan peran kunci (key role) dalam menghasilkan wawasan baru dari langkah eksplorasi data.
- Pelatihan Model
Dalam pelatihan model, terdapat tahap menyesuaikan data pelatihan; di sinilah proses “belajar” dimulai. Pada tahap ini kita melatih model machine learning menggunakan data latih.
- Evaluasi Model
Setelah pelatihan model selesai, saatnya untuk mengevaluasi kinerjanya. Jadi, mengevaluasi model pada kumpulan data baru akan memberi Anda gambaran tentang bagaimana kinerja model Anda di data mendatang.
- Penyetelan Hyperparameter
Setelah model dilatih dan dievaluasi, kinerja model dapat ditingkatkan lagi dengan menyetel hyperparameternya. Penyesuaian hyperparameter model penting untuk meningkatkan kinerja model secara keseluruhan.
- Membuat prediksi dan siap diterapkan
Ini adalah tahap akhir dari machine learning. Di sini, model digunakan untuk menjawab setiap pertanyaan Anda berdasarkan hasil pelatihannya. Setelah membuat prediksi yang akurat, model machine learning diterapkan ke dalam produksi.
Tipe-tipe Machine Learning
Secara umum, model machine learning dapat dibedakan berdasarkan penggunaannya, seperti supervised, unsupervised, dan reinforcement. Ketiganya merupakan istilah yang digunakan untuk memisahkan model dalam fungsi tertentu. Ingin tahu lebih lanjut? Yuk, kita simak materi berikutnya.
Supervised Learning
Machine learning supervised adalah pendekatan machine learning yang ditentukan oleh penggunaan kumpulan data yang berlabel.
Berikut merupakan fungsi dari supervised machine learning.
- Mengklasifikasikan berbagai jenis file, seperti gambar, dokumen, atau kata-kata tertulis.
- Memprediksi nilai dari data kontinu.
- Meramal tren dan hasil masa depan melalui pola pembelajaran dalam data penelitian.
Unsupervised Learning
Bertolak belakang dengan supervised machine learning, tipe ini adalah pelatihan model pada data tidak berlabel.
Berikut merupakan fungsi dari unsupervised machine learning.
- Mengklasifikasikan dataset pada kesamaan antara fitur atau segmen pada data.
- Memahami hubungan antara berbagai titik data
- Melakukan analisis data awal.
Reinforcement Learning
Reinforcement machine learning adalah salah satu dari tiga paradigma machine learning disamping supervised dan unsupervised.
Algoritma Machine Learning Tradisional
Di bawah ini merupakan bagian dari machine learning tradisional, yaitu Linear Regression dan Logistic Regression.
Linear regression vs. Logistic regression
| Linear Regression | Logistic Regression |
|---|---|
Regresi linier digunakan untuk memprediksi variabel dependen kontinu menggunakan sekumpulan variabel independen tertentu. | Regresi logistik digunakan untuk memprediksi variabel dependen kategoris menggunakan seperangkat variabel independen yang diberikan. |
Regresi linier digunakan untuk menyelesaikan masalah regresi. | Digunakan untuk memecahkan masalah klasifikasi. |
Memprediksi nilai variabel kontinu. | Memprediksi nilai variabel kategoris. |
Fit line (garis lurus). | Menggunakan s-curve. |
Keluaran berupa nilai kontinu, seperti harga, umur, dll. | Keluaran berupa nilai kategoris. seperti 0 atau 1, Ya atau tidak, dll. |
Algoritma Deep Learning
Di bawah ini merupakan serba-serbi deep learning yang perlu Anda ketahui mulai dari definisi deep learning hingga berkenalan dengan neural network.
Berkenalan dengan Deep Learning
Deep learning adalah metode dalam artificial intelligence yang mengajarkan komputer untuk memproses data layaknya otak manusia ketika berpikir. Model deep learning dapat mengenali pola kompleks dalam gambar, teks, suara, dan data lain untuk menghasilkan wawasan serta prediksi akurat.
Mengapa Perlu Deep Learning
Dengan adanya deep learning ini sangat bermanfaat bagi para data scientist yang bertugas mengumpulkan, menganalisis, dan menafsirkan data dalam jumlah besar. Dan juga membuat proses apapun menjadi lebih cepat dan lebih mudah.
- Asisten digital (chat bot),
- Deteksi penipuan (fraud detection),
- Pengenalan wajah otomatis (face recognition), dst.
Neural Network
Neural network adalah metode dalam artificial intelligence yang mengajarkan komputer untuk memproses data yang terinspirasi dari cara kerja otak manusia. Neural network adalah tipe proses machine learning yang termasuk dalam deep learning. Dalam prosesnya, ia menggunakan simpul atau neuron yang saling terhubung dalam struktur berlapis yang menyerupai otak manusia.
Last but not least, pada modul berikutnya Anda akan mempelajari cara untuk menembus lowongan pekerjaan mulai dari mencari peluang data scientist, membuat CV, dan sebagainya. So, tunggu apa lagi? Yuk! Kita langsung ke modul berikutnya.
Bersambung ke:
Peluang Karier di Dunia Data
- Get link
- X
- Other Apps
























Comments
Post a Comment