Dynamic Blinkie Text Generator at TextSpace.net

Feedburner

I heart FeedBurner

Rabu, 02 Januari 2019

Ekstraksi Informasi e-KTP dengan Google Cloud Function dan Cloud Vision API

Semenjak satu atau dua tahun terakhir, alat pembayaran digital seperti seperti Go-pay, OVO, Traveloka PayLater, Kredivo dan lain-lain mulai digandrungi oleh banyak pengguna smartphone di Indonesia. Alasannya jelas karena lebih simple <coret> dan banyak promo-promo menarik </coret>. Namun sayangnya untuk mendapatkan fitur-fitur premium dari metode pembayaran ini pengguna harus melakukan verifikasi dengan cara mengunggah identitas diri mereka ke layanan-layanan tersebut.
Verifikasi ini pada umumnya dilakukan dengan menguggah identitias diri seperi foto Kartu Tanda Penduduk Elektronik (e-KTP), Surat Izin Mengemudi (SIM), atau passport. Jika seorang pengguna ingin melakukan verifikasi, tentu perusahaan pembayaran digital tersebut harus memastikan apakah data yang diunggah benar atau salah. Jika benar, maka pengguna akan mendapatkan fitur premium dan jika salah, mohon maaf Anda belum beruntung dan silahkan coba lagi. :p
Kini bayangkan bahwa dalam satu hari ada ratusan ribu pengguna yang ingin melakukan verifikasi dan mengunggah identitasnya. Jika dibalik layar ada seseorang atau beberapa orang yang harus melakukan verifikasi dan mencocokan data yang terdaftar dengan data identitas tersebut, bayangkan berapa man-hour yang dibutuhkan untuk menuntaskan semua verifikasi tersebut? Bisakah kita mengautomasi pekerjaan ini?
Tulisan ini adalah ringkasan demo yang saya lakukan di acara Google DevFest 2018 di Jakarta dan Semarang. Demo yang dilakukan adalah bagaimana cara mengekstrak informasi e-KTP seperti Nomor Induk Kependudukan (NIK), nama, alamat, nama provinsi dan kabupaten atau kota, dari gambar e-KTP yang diunggah ke sebuah sistem.
Slide presentasi bisa diunduh dari Slideshare. Presentasi bisa ditonton di Youtube.
Dalam demonstrasi ini dua teknologi utama yang saya gunakan adalah serverless dengan Google Cloud Function dan Optical Character Recognition dengan Google Cloud Vision API. Mari kita bahas satu persatu.

Serverless & Cloud Function

Berdasarkan definisi Martin Fowler,
Serverless architectures are application designs that incorporate third-party “Backend as a Service” (BaaS) services, and/or that include custom code run in managed, ephemeral containers on a “Functions as a Service” (FaaS) platform. By using these ideas, and related ones like single-page applications, such architectures remove much of the need for a traditional always-on server component
Dari definisi diatas, kita bisa mengambil intisari bahwa arsitektur serverless pada dasarnya memungkinkan kita untuk dapat menjalankan baris kode tanpa harus peduli dengan kebutuhan akan sebuah server. Jika sebelumnya, sebuah aplikasi berbasis web-server harus dijalankan di sebuah server yang dikelola oleh seorang system administrator, kini dengan teknologi serverless, seorang pengembang piranti lunak dapat melakukan deployment secara langsung tanpa harus menyewa sebuah server di salah satu penyedia layanan cloud. Yang perlu dilakukan hanyalah membuat sebuah fungsi dan menjalankan sebuah perintah untuk menjalankan fungsi tersebut di cloud (Functions as a Service).
(kiri) Implementasi sistem dengan Virtual Machine, (kanan) Implementasi sistem dengan FaaS
Sementara itu, Cloud Function merupakan salah satu layanan FaaS yang disediakan oleh Google Cloud Platform. Saat ini Google Cloud Function baru mendukung bahasa pemograman Javascript (Node.JS) dan Python (versi beta). Disamping itu, Cloud Function juga dapat diintegrasikan dengan berbagai macam layanan lain milik GCP seperti Google Cloud Storage, Cloud Pub/Sub, dan lain-lain. Pada demonstrasi kali ini, kita akan menggunakan Google Cloud Function untuk membuat beberapa fungsi, antara lain:
  • Fungsi untuk mengunggah foto e-KTP (Node.JS)
  • Fungsi untuk melakukan pemrosesan terhadap e-KTP yang telah diunggah (Node.JS) dengan Cloud Vision API
  • Fungsi untuk mengekstrak informasi e-KTP berdasarkan hasil bacaan Cloud Vision API.
Percayalah bahwa sebenarnya hal-hal tersebut dapat dilakukan hanya dengan menggunakan satu fungsi. Tapi untuk membatasi cakupan dan tanggung jawab dari masing-masing fungsi, maka TS berpikir akan lebih baik jika fungsi-fungsi tersebut dibuat terpisah.

OCR & Cloud Vision

Optical Character Recognition atau OCR merupakan salah satu teknik pengolahan citra digital yang sudah umum digunakan untuk mendapatkan teks yang terkandung dalam sebuah citra atau gambar. Namun, sayangnya OCR bukanlah sebuah teknik atau algoritma yang dapat dipahami dalam satu malam.
Namun, beruntunglah kita karena GCP memiliki Cloud Vision API yang memiliki fitur untuk melakukan OCR. Selain OCR, Google Cloud Vision API juga memiliki fitur lain seperti Label Detection, Multiple Object Detection, dan lain-lain. 😊
OCR dengan Cloud Vision API (source: https://cloud.google.com/vision/docs/ocr)

Implementasi

Berikut adalah diagram rancangan sistem yang digunakan untuk mengekstrak informasi e-KTP:
Rancangan Sistem Ekstraktor Data e-KTP dengan Cloud Vision API & Cloud Function
Dalam rancangan diatas, ada beberapa komponen dengan peran yang beerbeda-beda seperti Cloud Function, Cloud Storage dan Cloud Pub/Sub.

Fungsi Unggah e-KTP

Fungsi untuk mengunggah e-KTP ini adalah satu-satunya tatap muka yang digunakan langsung oleh pengguna. Fungsi ini menggunakan sistem http-trigger yang berarti bahwa eksekusi dari fungsi ini akan terjadi jika pengguna melakukan request call ke http endpoint fungsi tersebut.
Fungsi ini memiliki tugas sebagai berikut:
  • Menerima file gambar e-KTP dan user_id pengunggah melaluiPOST request yang dibuat oleh pengguna
  • Menyimpan file e-KTP yang diunggah ke dalam Google Cloud Storage(GCS). Penyimpanan file di GCS adalah opsional. Tanpa melakukan penyimpanan ke GCS, sebenarnya kita pun bisa langsung menggunakan Vision API untuk melakukan deteksi teks dengan OCR. Namun pada demonstrasi ini TS nantinya ingin memperlihatkan bahwa Cloud Function memiliki fitur cloud storage trigger yang dapat digunakan untuk mengamati perubahan yang terjadi pada infrastruktur cloud di GCP.
Berikut baris kode yang digunakan:
Fungsi untuk mengunggah gambar e-KTP dan menyimpannya ke Cloud Storage
Untuk melakukan deployment fungsi berbasis http-trigger, kita cukup menambahkan argument --trigger-http ketika fungsi tersebut di deploy ke google cloud. Sebagai contoh:
$gcloud functions deploy uploadFile --entry-point uploadFile --trigger-http
Apabila deployment berhasil, maka Google Cloud Function akan menghasilkan sebuah URL (e.g. “https://REGION-PROJECT_ID.cloudfunctions.net/uploadFile”) yang dapat digunakan untuk mengunggah foto e-KTP.

Fungsi Cloud Vision API

Fungsi kedua sedikit berbeda dibandingkan dengan fungsi sebelumnya. Fungsi ini memiliki dua tugas utama:
  • Melakukan pemrosesan gambar dengan Cloud Vision API apabila ada perubahan pada GCS bucket yang digunakan sebagai media penyimpanan. Untuk melakukan hal ini, kita akan menggunakan cloud storage trigger sebagai trigger utama dari fungsi ini. Cloud storage trigger akan mengirimkan event atau sinyal ketika terjadi perubahan pada GCS bucket. Perubahaan ini bisa dalam bentuk penambahan files, perubahan files dan atau penghapusan files.
  • Mempublikasikan hasil pemrosesan dari Cloud Vision API ke Cloud Pub/Sub supaya hasil pemrosesan dapat digunakan oleh berbagai sistem berbeda, jika dibutuhkan.
Berikut baris kode yang digunakan:
Fungsi diatas dapat di deploy dengan menggunakan perintah berikut:
$gcloud functions deploy processImageFromGCSEvent --trigger-resource uploaded_ektp --trigger-event google.storage.object.finalize
Dengan perintah tersebut, fungsi ini akan dieksekusi ketika ada penambahan berkas baru di dalam GCS (event google.storage.object.finalize). Jika kita tertarik dengan event-event lain, berikut beberapa opsi lain yang bisa digunakan:
  • google.storage.object.finalize dikirimkan ketika penambahan file baru
  • google.storage.object.delete dikirimkan ketika penghapusan file
  • google.storage.object.archive dikirimkan ketika terjadi perubahan versi pada GCS bucket
  • google.storage.object.metadataUpdate dikirimkan ketika ada perubahan pada metadata object di GCS bucket.
Untuk lebih detail, silahkan baca disini.

Fungsi Ekstraksi Informasi e-KTP

Sayangnya hasil pemrosesan dari Cloud Vision API belum bisa menentukan teks mana yang merupakan data penting dari e-KTP. Berikut hasil pemrosesan yang dilakukan oleh Cloud Vision API:
{"results":[{"locations":[],"properties":[],"mid":"","locale":"id","description":"PROVINSI DKI JAKARTA\nJAKARTA PUSAT\nNIK\n3171082910720002\nSYAHRIAL AFFANDY\nNama\nTempat/Tgl Lah…...
Dari hasil diatas, bisa dilihat bahwa hasil ekstraksi hanyalah berupa sebuah string dengan separator tertentu seperti line break. Oleh karena itu, fungsi ini memiliki tugas utama untuk mengambil informasi seperti nama, tempat tanggal lahir, NIK dll dari hasil pemrosesan Cloud Vision API yang dikirim melalui Google Cloud Pub/Sub.
Pada fungsi diatas, ekstraksi informasi dilakukan dengan cara membuang semua label e-KTP dengan regular expression. Setelah label dihapus, maka nama provinsi, kota, NIK, nama dan tanggal ulang tahun akan berada pada posisi yang berututan. Simpel?
Deploy fungsi dengan perintah berikut:
$gcloud functions deploy extract_identity --runtime python37 --trigger-topic ektp-text-extracted

Hasil

Sample e-KTP yang kita gunakan 😂
Hasil pemrosesan:
Information extracted:{'province': 'PROVINSI JAWA TIMUR', 'city': 'KABUPATEN BANYUWANGI', 'id': '351024300b730004', 'name': 'TUHAN', 'birthdate': 'BANYUWANGI, 30-06-1973'}
TIL:
Sumber :https://medium.com/@imrenagi/ekstraksi-informasi-e-ktp-dengan-google-cloud-function-dan-cloud-vision-api-4655db21d084?fbclid=IwAR0vIi0DfVQ9i4MPzFLmR9nFjizBzVAr1wGKG6FCdK7yerCzE7hLbUcXBqc

Tidak ada komentar:

Posting Komentar