Semenjak
satu atau dua tahun terakhir, alat pembayaran digital seperti seperti
Go-pay, OVO, Traveloka PayLater, Kredivo dan lain-lain mulai digandrungi
oleh banyak pengguna smartphone di Indonesia. Alasannya jelas karena lebih simple <coret> dan banyak promo-promo menarik </coret>.
Namun sayangnya untuk mendapatkan fitur-fitur premium dari metode
pembayaran ini pengguna harus melakukan verifikasi dengan cara
mengunggah identitas diri mereka ke layanan-layanan tersebut.
Verifikasi
ini pada umumnya dilakukan dengan menguggah identitias diri seperi foto
Kartu Tanda Penduduk Elektronik (e-KTP), Surat Izin Mengemudi (SIM),
atau passport. Jika seorang pengguna ingin melakukan verifikasi, tentu
perusahaan pembayaran digital tersebut harus memastikan apakah data yang
diunggah benar atau salah. Jika benar, maka pengguna akan mendapatkan
fitur premium dan jika salah, mohon maaf Anda belum beruntung dan
silahkan coba lagi. :p
Kini
bayangkan bahwa dalam satu hari ada ratusan ribu pengguna yang ingin
melakukan verifikasi dan mengunggah identitasnya. Jika dibalik layar ada
seseorang atau beberapa orang yang harus melakukan verifikasi dan
mencocokan data yang terdaftar dengan data identitas tersebut, bayangkan
berapa man-hour yang dibutuhkan untuk menuntaskan semua verifikasi tersebut? Bisakah kita mengautomasi pekerjaan ini?
Tulisan ini adalah ringkasan demo yang saya lakukan di acara Google DevFest 2018 di Jakarta dan Semarang. Demo yang dilakukan adalah bagaimana cara mengekstrak informasi e-KTP seperti Nomor Induk Kependudukan (NIK), nama, alamat, nama provinsi dan kabupaten atau kota, dari gambar e-KTP yang diunggah ke sebuah sistem.
Slide presentasi bisa diunduh dari Slideshare. Presentasi bisa ditonton di Youtube.
Dalam demonstrasi ini dua teknologi utama yang saya gunakan adalah serverless dengan Google Cloud Function dan Optical Character Recognition dengan Google Cloud Vision API. Mari kita bahas satu persatu.
Serverless & Cloud Function
Berdasarkan definisi Martin Fowler,
Serverless architectures are application designs that incorporate third-party “Backend as a Service” (BaaS) services, and/or that include custom code run in managed, ephemeral containers on a “Functions as a Service” (FaaS) platform. By using these ideas, and related ones like single-page applications, such architectures remove much of the need for a traditional always-on server component
Dari definisi diatas, kita bisa mengambil intisari bahwa arsitektur serverless
pada dasarnya memungkinkan kita untuk dapat menjalankan baris kode
tanpa harus peduli dengan kebutuhan akan sebuah server. Jika sebelumnya,
sebuah aplikasi berbasis web-server harus dijalankan di sebuah server yang dikelola oleh seorang system administrator, kini dengan teknologi serverless, seorang pengembang piranti lunak dapat melakukan deployment
secara langsung tanpa harus menyewa sebuah server di salah satu
penyedia layanan cloud. Yang perlu dilakukan hanyalah membuat sebuah
fungsi dan menjalankan sebuah perintah untuk menjalankan fungsi tersebut
di cloud (Functions as a Service).
Sementara
itu, Cloud Function merupakan salah satu layanan FaaS yang disediakan
oleh Google Cloud Platform. Saat ini Google Cloud Function baru
mendukung bahasa pemograman Javascript (Node.JS) dan Python (versi
beta). Disamping itu, Cloud Function juga dapat diintegrasikan dengan
berbagai macam layanan lain milik GCP seperti Google Cloud Storage, Cloud Pub/Sub, dan lain-lain. Pada demonstrasi kali ini, kita akan menggunakan Google Cloud Function untuk membuat beberapa fungsi, antara lain:
- Fungsi untuk mengunggah foto e-KTP (Node.JS)
- Fungsi untuk melakukan pemrosesan terhadap e-KTP yang telah diunggah (Node.JS) dengan Cloud Vision API
- Fungsi untuk mengekstrak informasi e-KTP berdasarkan hasil bacaan Cloud Vision API.
Percayalah
bahwa sebenarnya hal-hal tersebut dapat dilakukan hanya dengan
menggunakan satu fungsi. Tapi untuk membatasi cakupan dan tanggung jawab
dari masing-masing fungsi, maka TS berpikir akan lebih baik jika
fungsi-fungsi tersebut dibuat terpisah.
OCR & Cloud Vision
Optical Character Recognition
atau OCR merupakan salah satu teknik pengolahan citra digital yang
sudah umum digunakan untuk mendapatkan teks yang terkandung dalam sebuah
citra atau gambar. Namun, sayangnya OCR bukanlah sebuah teknik atau
algoritma yang dapat dipahami dalam satu malam.
Namun,
beruntunglah kita karena GCP memiliki Cloud Vision API yang memiliki
fitur untuk melakukan OCR. Selain OCR, Google Cloud Vision API juga
memiliki fitur lain seperti Label Detection, Multiple Object Detection, dan lain-lain. 😊
Implementasi
Berikut adalah diagram rancangan sistem yang digunakan untuk mengekstrak informasi e-KTP:
Dalam
rancangan diatas, ada beberapa komponen dengan peran yang beerbeda-beda
seperti Cloud Function, Cloud Storage dan Cloud Pub/Sub.
Fungsi Unggah e-KTP
Fungsi
untuk mengunggah e-KTP ini adalah satu-satunya tatap muka yang
digunakan langsung oleh pengguna. Fungsi ini menggunakan sistem http-trigger yang berarti bahwa eksekusi dari fungsi ini akan terjadi jika pengguna melakukan request call ke http endpoint fungsi tersebut.
Fungsi ini memiliki tugas sebagai berikut:
- Menerima file gambar e-KTP dan
user_id
pengunggah melaluiPOST
request yang dibuat oleh pengguna - Menyimpan file e-KTP yang diunggah ke dalam Google Cloud Storage(GCS). Penyimpanan file di GCS adalah opsional. Tanpa melakukan penyimpanan ke GCS, sebenarnya kita pun bisa langsung menggunakan Vision API untuk melakukan deteksi teks dengan OCR. Namun pada demonstrasi ini TS nantinya ingin memperlihatkan bahwa Cloud Function memiliki fitur cloud storage trigger yang dapat digunakan untuk mengamati perubahan yang terjadi pada infrastruktur cloud di GCP.
Berikut baris kode yang digunakan:
Untuk melakukan deployment fungsi berbasis http-trigger, kita cukup menambahkan argument
--trigger-http
ketika fungsi tersebut di deploy ke google cloud. Sebagai contoh:$gcloud functions deploy uploadFile --entry-point uploadFile --trigger-http
Apabila deployment berhasil, maka Google Cloud Function akan menghasilkan sebuah URL (e.g. “https://REGION-PROJECT_ID.cloudfunctions.net/uploadFile”) yang dapat digunakan untuk mengunggah foto e-KTP.
Fungsi Cloud Vision API
Fungsi kedua sedikit berbeda dibandingkan dengan fungsi sebelumnya. Fungsi ini memiliki dua tugas utama:
- Melakukan pemrosesan gambar dengan Cloud Vision API apabila ada perubahan pada GCS bucket yang digunakan sebagai media penyimpanan. Untuk melakukan hal ini, kita akan menggunakan cloud storage trigger sebagai trigger utama dari fungsi ini. Cloud storage trigger akan mengirimkan event atau sinyal ketika terjadi perubahan pada GCS bucket. Perubahaan ini bisa dalam bentuk penambahan files, perubahan files dan atau penghapusan files.
- Mempublikasikan hasil pemrosesan dari Cloud Vision API ke Cloud Pub/Sub supaya hasil pemrosesan dapat digunakan oleh berbagai sistem berbeda, jika dibutuhkan.
Berikut baris kode yang digunakan:
Fungsi diatas dapat di deploy dengan menggunakan perintah berikut:
$gcloud functions deploy processImageFromGCSEvent --trigger-resource uploaded_ektp --trigger-event google.storage.object.finalize
Dengan perintah tersebut, fungsi ini akan dieksekusi ketika ada penambahan berkas baru di dalam GCS (event
google.storage.object.finalize
). Jika kita tertarik dengan event-event lain, berikut beberapa opsi lain yang bisa digunakan:google.storage.object.finalize
dikirimkan ketika penambahan file barugoogle.storage.object.delete
dikirimkan ketika penghapusan filegoogle.storage.object.archive
dikirimkan ketika terjadi perubahan versi pada GCS bucketgoogle.storage.object.metadataUpdate
dikirimkan ketika ada perubahan pada metadata object di GCS bucket.
Untuk lebih detail, silahkan baca disini.
Fungsi Ekstraksi Informasi e-KTP
Sayangnya
hasil pemrosesan dari Cloud Vision API belum bisa menentukan teks mana
yang merupakan data penting dari e-KTP. Berikut hasil pemrosesan yang
dilakukan oleh Cloud Vision API:
{"results":[{"locations":[],"properties":[],"mid":"","locale":"id","description":"PROVINSI DKI JAKARTA\nJAKARTA PUSAT\nNIK\n3171082910720002\nSYAHRIAL AFFANDY\nNama\nTempat/Tgl Lah…...
Dari hasil diatas, bisa dilihat bahwa hasil ekstraksi hanyalah berupa sebuah string dengan separator tertentu seperti line break.
Oleh karena itu, fungsi ini memiliki tugas utama untuk mengambil
informasi seperti nama, tempat tanggal lahir, NIK dll dari hasil
pemrosesan Cloud Vision API yang dikirim melalui Google Cloud Pub/Sub.
Pada fungsi diatas, ekstraksi informasi dilakukan dengan cara membuang semua label e-KTP dengan regular expression. Setelah
label dihapus, maka nama provinsi, kota, NIK, nama dan tanggal ulang
tahun akan berada pada posisi yang berututan. Simpel?
Deploy fungsi dengan perintah berikut:
$gcloud functions deploy extract_identity --runtime python37 --trigger-topic ektp-text-extracted
Hasil
Sample e-KTP yang kita gunakan 😂
Hasil pemrosesan:
Information extracted:{'province': 'PROVINSI JAWA TIMUR', 'city': 'KABUPATEN BANYUWANGI', 'id': '351024300b730004', 'name': 'TUHAN', 'birthdate': 'BANYUWANGI, 30-06-1973'}
TIL:
Sumber :https://medium.com/@imrenagi/ekstraksi-informasi-e-ktp-dengan-google-cloud-function-dan-cloud-vision-api-4655db21d084?fbclid=IwAR0vIi0DfVQ9i4MPzFLmR9nFjizBzVAr1wGKG6FCdK7yerCzE7hLbUcXBqc
Tidak ada komentar:
Posting Komentar