Belajar Regex di Python

Belajar Regex

Regex merupakan singkatan dari Regular Expression yang merupakan  serangkaian karakter yang mendefinisikan sebuah pola pencarian. Beberapa bidang yang menggunakan metode ini adalah seperti Natural Language Processing (NLP), Text Mining, Data Validation, Finding Pattern, Anomaly Detection dan lainnya.

Pada dasarnya Regex bisa diterapkan di berbagai bahasa pemrograman dengan berbagai tujuan. Dalam artikel ini akan diterapkan regex untuk tujuan analisis data. Akan di beberapa section agar lebih mudah memahami setiap penggunaan regex.

Baca Juga : Menulis Efisien Code di Python

1. Most Used Regex Code

Berikut ini merupakan pola regex dasar yang paling sering digunakan.

2. Application

Berikut ini merupakan beberapa penerapan regex di python untuk beberapa kasus. Selengkapnya bisa dilihat di sini.

a) Find word, numbers

Hal pertama yang bisa kita latih dalam regex adalah mendapatkan angka dan bilangan.

b) Menghilangkan tanda baca dan angka

Teknik ini paling sering digunakan dalam text mining. Hal ini karena punctuation (tanda baca) dan angka dinilai tidak mengandung makna yang mampu merepresentasikan arti.

c) Mendapatkan no-hp

Mendapatkan nomor telephone bergantung dari format yang sudah tersedia.

d) Mendapatkan alamat email

Alamat email mempunyai pola mengandung karakter @ yang diapit diantara dua kata (word).

e) Mencari exact match beberapa kata

Berikut ini merupakan cara untuk mencari exact match beberapa kata sekaligus

Reference

  1. https://www.jetbrains.com/help/pycharm/regular-expression-syntax-reference.html
  2. https://cheatography.com/davechild/cheat-sheets/regular-expressions/
  3. https://www.dataquest.io/blog/regex-cheatsheet/

 

 

 

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *

Related posts