Context
Free usage OCR vendor lama berakhir di Sep 2025. Mulai Okt 2025 dibutuhkan alternatif agar KYC tetap berjalan. Vertex AI jadi opsi, tapi ada biaya, jadi harus efektif dan efisien.
Prinsip utama: output harus “contractable”
Kalau OCR-nya pinter tapi output-nya random, ujungnya tetap chaos di UI alias di form data diri.
Makanya prompt wajib menghasilkan:
- strict JSON
- tanpa markdown, kode, atau penjelasan
- schema output disamain dengan response lama biar migrasi seamless
Tambahan yang gue dorong:
documentType(KTP/SIM/PASSPORT/UNKNOWN)matchRate(0–100) sebagai indikator akurasi Image→Text
“OCR yang bagus itu bukan yang bisa baca doang tapi yang bikin user nggak perlu benerin.”
Cost estimation
Dokumen membandingkan beberapa model dan menghitung token → USD → IDR. Contoh perhitungan: total 0.00102135 USD (~Rp 16.34) untuk satu skenario model tertentu.
Outcome
Kontribusi ke AI OCR KYC yang bikin capture KTP lebih akurat dan membuka flow SIM sebagai dokumen alternatif, dengan estimasi penurunan edit rate user ~10%.
