R vs Python

Era Industri 4.0 dan Big Data sudah dimulai. Di era ini, data telah menjadi suatu elemen yang sangat penting. Tentunya data tersebut harus di analisa untuk bisa menjawab suatu permasalahan. Alat dan metode analisa pun kini kian banyak di implementasikan.

Saat ini software analisa data yang paling sering digunakan adalah R dan Python. Software ini sangat cocok digunakan untuk menjawab kasus advanced analytics (bisa disebut juga statistika inferensia atau bisa dibilang dalam lingkup machine learning, deep learning dan AI).

Dunia analitik seolah-olah terbagi menjadi kubu R dan kubu Python. R merupakan bahasa pemrograman yang memang ditujukan untuk analisa data. Tidak heran bahwa yang sering menggunakan software ini berasal dari jurusan statistika dan matematika.

      ” R is a free software environment for statistical computing and graphics ” 

Sedangkan Python merupakan bahasa pemrograman  yang multi-guna dan multi-fungsi. Kebanyakan pengguna software ini dari jurusan teknik informatika maupun ilmu komputer.

     ” Python is an interpreted, high-level, general-purpose programming language 

Secara garis besar, bahasa R dan Python tidak jauh berbeda. Bisa dibilang seperti satu saudara. Oleh karena itu, pengguna R kemungkinan besar tidak akan menemukan kesulitan yang sangat besar ketika belajar python, begitu juga sebaliknya. Meskipun banyak kesamaan, tentunya ada beberapa hal yang membedakan kedua software tersebut. Belajar R saja atau Python saja atau keduanya itu adalah selera setiap pengguna. 

Seberapa sama R dan Python ? Dalam hal ini akan ditunjukkan perbandingan source code bahasa R dan Python dalam konteks analisis data.

## Data Input dan Output

  1. Importing data
  2. Struktur dan tipe data
  3. Working with date
  4. Membuat koneksi ke database
  5. Exporting data

## Cleaning Data

  1. Operasi data
  2. Tipe Data
  3. Dataframe

## Visualisasi Data

  1. Bar Chart
  2. Time Series
  3. Pie Chart
  4. Donut Chart
  5. Area Chart

## Teori

  1. Distribusi Peluang Diskrit

## Advance Analytics

  1. Supervised Learning
  2. Unsupervised Learning
  3. Ensemble method
  4. Membagi dataset menjadi data train dan data test