Apa sebenarnya yang dimaksud dengan data? Definisi dari data adalah informasi tentang dunia dan semua orang yang ada di dalamnya yang dikumpulkan dan dianalisis untuk membantu pengambilan keputusan. Saat ini data sering dikaitkan dengan visualisasi data seperti bagan atau infografis, maka dari itu penting sekali untuk memahami sejarah evolusi data.

Kembali ke tahun 3200 SM, ketika tulisan pertama kali dikembangkan di Mesopotamia, para juru tulis saat itu mencatat segala hal terkait kehidupan sehari-hari - seperti informasi pajak dan tanaman - guna meningkatkan sistem akuntansi dan pertanian mereka.

Kemudian seiring berkembangnya ilmu alam dan matematika, dibarengi dengan kemajuan teknologi, maka peran ilmu statistika matematika pun berkembang menjadi sesuatu yang semakin besar: data science.

keseruan belajar data science
Data Science bisa menjadi sesuatu yang seru!

Data Science merupakan kombinasi antara statistika dan ilmu komputer yang digunakan untuk menganalisis data dalam jumlah besar sekaligus untuk mencari cara analisis yang baru.

Jika data analytics memanfaatkan ilmu matematika dari bidang statistika untuk melakukan pemodelan data, maka data science digunakan untuk mengekstrak informasi dan menghasilkan informasi dari suatu data dalam jumlah besar. Beberapa ilmu dasar yang perlu Anda kuasai untuk mempelajari data science:

  • Kalkulus I dan II
  • Aljabar Linear
  • Teori Probabilitas
  • Statistika Matematika
  • Ilmu Komputer

Terdapat banyak sekali sumber belajar online yang bisa membantu Anda untuk mempelajari atau mengasah kemampuan Anda dalam ilmu-ilmu dasar tersebut. Situs seperti Superprof misalnya, menawarkan banyak pilihan tutor yang bisa memberikan Anda kursus statistika matematika dan ilmu komputer baik secara online maupun tatap muka.

Baca tentang metode dan konsep statistika dasar.

Tersedia guru-guru Data science terbaik
M arizal, mse
4.9
4.9 (21 ulasan)
M arizal, mse
Rp250,000
/jam
Gift icon
Kursus pertama gratis!
Raditya
5
5 (39 ulasan)
Raditya
Rp150,000
/jam
Gift icon
Kursus pertama gratis!
Andjar tito, st, mm
5
5 (54 ulasan)
Andjar tito, st, mm
Rp250,000
/jam
Gift icon
Kursus pertama gratis!
Ramadhany
4.8
4.8 (10 ulasan)
Ramadhany
Rp85,000
/jam
Gift icon
Kursus pertama gratis!
Moch iqbal faiz
5
5 (11 ulasan)
Moch iqbal faiz
Rp150,000
/jam
Gift icon
Kursus pertama gratis!
Nasrul
5
5 (15 ulasan)
Nasrul
Rp100,000
/jam
Gift icon
Kursus pertama gratis!
Eka
5
5 (5 ulasan)
Eka
Rp150,000
/jam
Gift icon
Kursus pertama gratis!
Ardian
5
5 (5 ulasan)
Ardian
Rp400,000
/jam
Gift icon
Kursus pertama gratis!
M arizal, mse
4.9
4.9 (21 ulasan)
M arizal, mse
Rp250,000
/jam
Gift icon
Kursus pertama gratis!
Raditya
5
5 (39 ulasan)
Raditya
Rp150,000
/jam
Gift icon
Kursus pertama gratis!
Andjar tito, st, mm
5
5 (54 ulasan)
Andjar tito, st, mm
Rp250,000
/jam
Gift icon
Kursus pertama gratis!
Ramadhany
4.8
4.8 (10 ulasan)
Ramadhany
Rp85,000
/jam
Gift icon
Kursus pertama gratis!
Moch iqbal faiz
5
5 (11 ulasan)
Moch iqbal faiz
Rp150,000
/jam
Gift icon
Kursus pertama gratis!
Nasrul
5
5 (15 ulasan)
Nasrul
Rp100,000
/jam
Gift icon
Kursus pertama gratis!
Eka
5
5 (5 ulasan)
Eka
Rp150,000
/jam
Gift icon
Kursus pertama gratis!
Ardian
5
5 (5 ulasan)
Ardian
Rp400,000
/jam
Gift icon
Kursus pertama gratis!
Mulai

Apa itu Big Data dan Big Data Analytics?

Mendefinisikan data science harus diawali dengan mendefinisikan big data terlebih dahulu. Terobosan pertama dalam bidang big data terjadi pada saat Perang Dunia kedua dimana saat itu terdapat sebuah komputer bernama Colossus.

Para kriptografer Inggris menggunakan komputer tersebut pada tahun 1943-1945 untuk memecahkan kode yang digunakan oleh tentara Nazi. Meskipun istilah big data baru muncul 50 tahun kemudian oleh John Mashey di Silicon Graphics sejak terobosan itu, tapi big data - dan sekumpulan data dalam jumlah besar yang menjadi ciri khasnya - tetap sama dalam penggunaannya. Artinya, proses analisis data dalam jumlah besar untuk mencari pola dan tren tetap menggunakan program komputer dan algoritme.

Saat ini, analisis terhadap big data bisa dilakukan dengan berbagai software dan bisa dilakukan baik oleh individu, pemerintah, maupun perusahaan. Hadoop misalnya, sebuah software yang dirilis pada tahun 2005 ini merupakan software open-source gratis pertama yang banyak digunakan kalangan bisnis dan pedagang untuk menyimpan data dalam jumlah besar dan memberikan fitur pencarian yang cukup baik bagi pelanggan mereka.

Beberapa contoh perusahaan besar di internet yang menggunakan Hadoop di antaranya adalah Facebook, Twitter, Amazon, dan LinkedIn. Selain Hadoop yang sudah dikenal sebagai suatu software revolusioner di bidang analisis big data dan bisnis, terdapat juga beberapa program lainnya seperti Spark yang tidak kalah canggihnya.

Definisi yang sering digunakan dalam menjelaskan apa itu big data adalah definisi yang dikemukakan oleh Doug Laney pada tahun 2001 yang dikenal dengan “3 V:”

  1. Volume: yaitu perusahaan dan pemerintah mengumpulkan data dalam jumlah yang besar dari berbagai sumber, seperti media sosial dan transaksi bisnis
  2. Variety: data memiliki berbagai bentuk, termasuk teks, audio, dan email
  3. Velocity: data mengalir dengan sangat cepat dan harus diproses dengan efisien dan cepat

Lanjutan paling penting dari definisi ini adalah innovation, yaitu sesuatu yang sangat dibutuhkan untuk dapat menerapkan agar 3 V tersebut dengan efektif, dan juga decision making atau pengambilan keputusan yang merupakan hasil akhir dari pemrosesan big data.

tugas seorang data scientist
Mentransformasi data yang tidak terstruktur menjadi suatu keputusan

Apa Tugas Seorang Data Scientist?

Di awal dekade ini, Harvard Business Review pernah menyebut data science sebagai “pekerjaan paling sexy di abad 21.” Sebutan ini tidak hanya muncul karena semakin besarnya peran big data dalam dunia bisnis dan pemerintahan, tetapi juga karena fakta. Bahkan dua dari 5 pekerjaan baru teratas pada platform LinkedIn di tahun 2018 merupakan rumpun data scientist. Pertanyaannya adalah, apa sih yang sebenarnya dilakukan oleh data scientist?

Pada tahun 1962, Jon W. Turkey menulis “The Future of Data Analysis,” dimana saat itu ia mulai bertanya-tanya apakah perannya di bidang pekerjaannya saat itu di bidang statistik mulai bergeser ke suatu arah yang disebut data analysis atau analisis data.

Meskipun saat ini data analysis sudah menjadi sesuatu yang biasa saja, namun ambiguitas yang sama yang terjadi pada suatu disiplin ilmu yang baru muncul di akhir abad 20 juga terjadi pada suatu bidang yang paling populer saat ini: data science. Meskipun ada begitu banyak sekali penjelasan mengenai peran data scientist, namun pada intinya peran mereka adalah sebagai berikut:

  • Mengumpulkan, membersihkan, dan mentransformasi data dalam jumlah besar yang seringkali tidak terstruktur
  • Memanfaatkan bahasa pemrograman komputer dalam melakukan hal-hal tersebut (seperti SAS, SPSS, Phyton, R)
  • Mencari pola pada dan membuat pemodelan big data dari perusahaan dan pemerintah untuk meningkatkan profit dan menyusun strategi.
  • Menemukan cara baru menangani big data
  • Mengotomatisasi pemrosesan-pemrosesan tersebut

Point terakhir tersebut adalah implikasi yang sangat penting dari data science. Disamping banyaknya perusahaan merekrut data scientist untuk memanfaatkan data konsumen mereka untuk memaksimalkan bisnisnya, ada pula berbagai sektor lain yang memanfaatkan data scientist untuk membuat kemajuan di masa depan. Skill yang sering dikaitkan dengan otomatisasi ini adalah machine learning dan deep learning.

Anda bisa mulai mengikuti les data science hari ini.

Apa itu Machine Learning dan Deep Learning?

Meskipun dulu pernah dianggap sebagai suatu masa depan yang hampir mustahil, namun kini artificial intelligence, atau yang dikenal dengan AI, kini banyak digunakan dalam kehidupan sehari-hari - mulai dari asisten digital hingga fitur pengenalan wajah. Mungkin banyak yang berpikir bahwa AI hanya melibatkan ilmu komputer saja, namun kenyataannya di dalamnya juga terdapat berbagai aspek data science. Dua contoh nyata dari hal ini adalah machine learning dan deep learning.

Salah satu terobosan pertama dalam hal machine learning dilakukan oleh seseorang bernama Alan Turing. Pada tahu 1950, dalam makalahnya yang berjudul “Computing Machinery and Intelligence,” Turing berusaha menjawab apakah mesin benar-benar bisa “berpikir.”

Satu tahun setelah makalah tersebut dipublikasikan, Marvin Minsky dan Dean Edmonds memperkenalkan simulasi berbasis komputer yang mereplikasi otak manusia - yang dikenal sebagai artificial neural network. Sejak saat itu, machine learning berkembang hingga deifinisinya pun mencakup keterlibatan kemampuan komputer dalam menerima informasi dan belajar dari data tersebut dengan sendirinya, dan menjadi semakin tajam seiring terus “belajar”nya komputer tersebut.

Machine learning sering dianggap sebagai bagian dari AI, dan deep learning sering dianggap sebagai bagian dari machine learning. Selangkah lebih maju dari otomatisasi, tujuan dari deep learnig adalah agar mesin dapat mengenali suatu objek dan konsep tanpa harus diprogram terlebih dahulu.

Satu contoh yang sering digunakan dalam menjelaskan machine dan deep learning adalah contoh tentang kucing. Jika suatu mesin bisa dilatih dengan menggunakan algoritme untuk bisa mengenali kucing melalui proses machine learning, maka dalam deep learning mesin tersebut akan diperkenalkan dengan banyak gambar kucing sehingga nantinya mesin tersebut akan bisa mengenali seekor kucing dengan sendirinya.

Dengan kata lain, dalam machine learning ada proses manipulasi data agar mesin bisa memprediksi hasil, sedangkan dalam deep learning ada proses pengenalan data dalam jumlah besar agar mesin bisa memprediksi hasil. Kedua hal ini mengarah kepada hal yang sama yaitu analisis prediktif.

Temukan kursus data science di Jakarta di sini.

cara pengaplikasian ilmu data science
Menjadi peneliti atau kepala tim IT

Bagaimana Cara Menjadi Data Scientist?

Apapun tujuannya, entah untuk mempelajari dari awal atau untuk memantapkan pengetahuan Anda yang sudah ada, ada banyak sekali sumber belajar terkait data scientist.

Bagi Anda yang sedang mencari jurusan data science yang tepat bagi Anda baik untuk tingkat sarjana maupun pascasarjana, ada dua hal yang harus Anda perhatikan:

  • Apakah data science memang tepat untuk Anda?
  • Apa saja peluang kerja data science?

Saat menentukan pilihan jurusan data science mana yang tepat bagi Anda, penting bagi Anda untuk membandingkan mata kuliah yang ditawarkan pada setiap program. Ada jurusan atau program yang fokus pada matematika dan cenderung menekankan pada aplikasi teoritis kuantitatif, dan ada pula yang fokus pada business intelligence berbasis data.

Salah satu cara yang dapat membantu Anda mengambil keputusan adalah menari tahu peluang kerja di bidang data science yang kiranya menarik dan sesuai dengan minat Anda. Jika kemudian Anda menemukan sejumlah skill yang sering dibutuhkan pada pekerjaan yang Anda minati, tulislah skill-skill tersebut dan cari apakah skill tersebut diajarkan pada jurusan-jurusan yang menjadi pilihan Anda. Dengan cara ini, selain akan membantu Anda menemukan jurusan yang tepat, juga akan membantu Anda mendapatkan pekerjaan yang tepat setelah lulus nanti.

Jika Anda adalah seorang profesional yang ingin banting setir, maka pastikan terlebih dahulu apakah data science memang tepat untuk Anda. Untuk itu, ada baiknya Anda melihat berbagai lowongan pekerjaan yang kiranya menarik bagi Anda dan teliti dengan baik skill apa saja yang dibutuhkan oleh posisi tersebut.

Jika skill yang dibutuhkan sepertinya bisa Anda pelajari, dan jika skill tersebut berbeda dengan profesi Anda saat ini, maka sudah saatnya untuk mencari cara untuk mempelajari skill tersebut. Beberapa kemampuan yang dituntut dari seorang data scientist adalah:

  • SQL
  • Python
  • Hadoop
  • Statistik
  • Kemampuan analitis
  • Data preparation

Anda bisa latihan dengan beberapa masalah statistika di sini.

Situs seperti Superprof hadir menawarkan banyak sekali pilihan tutor di bidang ini yang bisa ditemukan dengan cepat dan mudah di website mereka. Untuk informasi lebih jauh mengenai dataset dan berbagai tool analisis, Anda bisa mencoba sejumlah sumber online seperti Kaggle dan data science toolbox.

Apa Anda menyukai artikel ini? Berikan penilaian Anda

5.00 (1 nilai)
Loading...

Kurniawan

Seseorang yang senang berbagi ilmu dan pengetahuan yang diharapkan akan bermanfaat bagi banyak orang