Studi Kasus Klien

Studi kasus: 432 anotator Indonesia untuk jaringan ritel 100+ hypermarket di Prancis

9 menit bacaCase study21 April 2026

Studi kasus ini mendokumentasikan program produksi Zipang multi-tahun di computer-vision annotation untuk jaringan ritel hypermarket 100+ di Prancis. Klien tidak publik, jadi program dideskripsikan secara operasional bukan dengan nama. Angka-angka di bawah, 432 di-deploy, 208 di produksi aktif, 3,4 juta task produksi per bulan, akurasi sustained 90%+, tracking KPI granularitas mikrodetik: adalah data first-party dari operasi Zipang dan konsisten dengan yang buyer dapat verifikasi saat panggilan due diligence vendor. Program ini dirujuk di peringkat BPO Zipang dan walkthrough screening 5-gate; artikel ini adalah versi long-form tentang cara program sebenarnya berjalan.

Read in English →

Data singkat

432

Profesional Zipang di-deploy (AI ritel Prancis)

[Zipang Research]

3,4 juta

Task produksi per bulan (AI ritel Prancis)

[Zipang Research]

90%+

Akurasi produksi sustained

[Zipang Research]

~48%

Konversi onboard ke produksi

[Zipang Research]

208

Produksi aktif setiap saat

[Zipang Research]

6 bulan

Ramp-up ke steady-state

[Zipang Research]

Apa itu …?

Apa itu anotasi computer vision shelf-edge?

Anotasi computer vision shelf-edge adalah pekerjaan pelabelan manusia di balik AI ritel dalam toko. Anotator meninjau gambar dan klip video pendek rak supermarket, mengidentifikasi SKU di level SKU-pack, menggambar bounding box atau poligon, mengklasifikasi promosi dan price tag, dan menandai kasus ambigu kembali ke antrian kualitas. Output berlabel melatih dan mengevaluasi model yang mendukung compliance rak, adherence planogram, deteksi out-of-stock, dan pengenalan price tag dinamis. Untuk jaringan 100+ hypermarket, universe SKU ratusan ribu, price tag berubah harian, dan ambiguitas OCR adalah aturan bukan pengecualian, itulah kenapa pekerjaan pelabelan itu sendiri yang menjadi bottleneck, bukan modelnya.

Situasi klien

Klien adalah grup ritel Prancis yang mengoperasikan 100+ hypermarket di Prancis daratan dan wilayah seberang. Tim computer vision internal mereka sudah membangun model CV shelf-edge secara in-house; bottleneck bukan model, melainkan data training dan evaluasi berlabel yang memberi makan model. Dengan 300.000+ SKU aktif lintas private label dan barang bermerek, dan price tag disegarkan harian di ribuan toko, dataset butuh tinjauan manusia volume tinggi akurasi tinggi yang kontinu.

Klien sudah mencoba tim pelabelan internal dan dua vendor eksternal sebelumnya. Tim internal tidak bisa scale ke volume harian tanpa ekspansi headcount yang melebihi budget. Vendor eksternal pertama delivering akurasi yang dapat diterima di kasus sederhana tapi miss edge case price tag dan promosi yang paling penting. Vendor kedua lebih murah tapi akurasi turun di bawah 85% saat ramp, memicu klien re-bid program.

Zipang adalah vendor ketiga yang dibawa masuk, di 2022, dan program sudah berjalan kontinu sejak saat itu. Studi kasus ini mendokumentasikan bentuk operasional, metodologi, dan hasil jujur, termasuk yang tidak berhasil.

Masalah pelabelan: 300rb+ SKU, churn price tag harian, OCR ambigu

Anotasi CV rak ritel sangat sulit karena tiga alasan. Pertama, universe SKU sangat besar, katalog klien berjalan ke 300.000+ kombinasi produk-pack unik, dan model harus membedakan antara, misalnya, dua ukuran produk yang sama dengan stiker promosi berbeda. Kedua, price tag berubah setiap hari: tim harga hypermarket dapat memperbarui 20.000+ price tag di seluruh jaringan pada satu hari Selasa, dan antrian pelabelan harus menyerap churn harian itu. Ketiga, OCR pada price tag dalam kondisi hypermarket betul-betul ambigu: silau, oklusi parsial, tag melengkung, dan banyak promosi tumpang tindih memaksa manusia membuat judgement call yang tidak bisa dibuat model.

Subset yang paling sulit, berdasarkan error rate, adalah stiker promosi dan bundle, pengurangan harga temporer, penawaran multi-beli, dan harga spesifik kartu loyalitas. 60 hari pertama program menghabiskan bagian waktu QA reviewer yang tidak proporsional pada kasus-kasus ini. Pada bulan keempat, tim membangun gold set 2.000+ label edge case promosi yang menjadi tulang punggung siklus kalibrasi mingguan.

Mengapa Indonesia: English, familiaritas French, B2 CEFR, zona waktu, skala

Tiga faktor mendorong keputusan lokasi. Pertama, kemahiran English di B2 CEFR adalah bahasa operasional dominan untuk SOP dan komunikasi klien; penempatan EF EPI 2025 Indonesia di B2 (Moderate) menempatkan pool produksi di dalam band B2, dan funnel 5-gate Zipang menyaring kandidat yang lulus tes reading English dan pemahaman SOP internal. Kedua, familiaritas French di level kerja ada di subset talent pool Indonesia, program French universitas, eksposur media francophone, dan komunitas kecil tapi tahan lama lulusan Indonesia dari institusi berbahasa Prancis. Ketiga, tumpang tindih zona waktu dengan Paris (UTC+1 / UTC+2 di musim panas) parsial tapi workable: shift pagi Indonesia (07:00–14:00 WIB) mendarat di sore Eropa, dan handoff follow-the-sun ke shift malam Jakarta memberikan klien 12+ jam tumpang tindih efektif per hari.

Faktor skala adalah alasan keempat. Ramp 432 operator membutuhkan absorpsi 4–5× kohort anotasi Indonesia tipikal dalam 6 bulan, dan populasi 280 juta+ Indonesia (BPS 2024) membuat ramp itu feasible tanpa menjenuhkan pasar tenaga kerja metro manapun. Kohort didistribusikan lintas Jakarta, Bandung, Yogyakarta, Surabaya, dan Medan.

Mirror funnel 5-gate diterapkan ke program ini

Funnel 5-gate Zipang, scan relevansi CV, async English dan screening pemahaman SOP, kuis spesifik peran, wawancara video terstruktur, trial task berbayar, diterapkan dengan satu modifikasi: gate 3 (kuis spesifik peran) adalah kuis pelabelan ritel Prancis yang dibangun dari 200+ gambar rak dan kasus price tag representatif, dinilai terhadap rubrik yang mirror gold set klien itu sendiri.

Pass rate agregat: gate 1 mempertahankan 22% pelamar, gate 2 mempertahankan 41% survivor gate 1, gate 3 mempertahankan 58% survivor gate 2, gate 4 mempertahankan 67% survivor gate 3, gate 5 mempertahankan 78% survivor gate 4. End-to-end, kira-kira 6% pelamar mencapai kohort trial; 48% trialler ber-konversi ke produksi berbayar. Funnel yang sama yang menghasilkan program kualitas Zipang lain (Transperfect–Dataforce di akurasi sustained 90%+) dipakai ulang di sini, rubrik yang berubah, funnel tidak.

Gate 1: Relevansi CV (B2 English, kerja pelabelan/data sebelumnya), 22% lulus
Gate 2: Tes async English + pemahaman SOP, 41% lulus dari survivor
Gate 3: Kuis pelabelan ritel Prancis pada 200+ gambar, 58% lulus dari survivor
Gate 4: Wawancara video terstruktur, eksposur French di-probe, 67% lulus
Gate 5: Trial task berbayar dinilai terhadap gold set klien, 78% lulus
Konversi end-to-end trialler: 48% ke produksi berbayar

Headcount: 432 di-deploy, 208 di produksi setiap saat

Dari 432 profesional yang di-onboard lintas ramp, 208 duduk di produksi aktif pada momen manapun. Sisanya ada di antrian shadow, kohort training, status trial berbayar, atau rotasi off-shift untuk tumpang tindih follow-the-sun 4-hari dengan tim Paris klien.

Rasio 208 / 432 bukan attrition, itu desain. Anotasi CV rak ritel adalah tugas volume tinggi judegment tinggi, dan kohort produksi sengaja dijaga di bawah 50% total onboarded untuk menyerap rotasi training, sakit, dan 30% waktu off-produksi yang digunakan secara deliberatif untuk loop umpan balik QA, kalibrasi gold set, dan cross-training pada kategori SKU baru.

Volume: 3,4 juta task produksi per bulan

Throughput produksi berjalan di 3,4 juta task per bulan pada steady state, yang berarti kira-kira 16.000 task per operator produksi per bulan, atau sekitar 600–700 per shift. Setiap task adalah satu gambar atau klip pendek dengan rubrik pelabelan terdefinisi dan budget waktu keputusan 8–45 detik. Tracking KPI granularitas mikrodetik berarti setiap label, setiap intervensi reviewer, dan setiap re-anotasi di-cap timestamp dengan cara yang memungkinkan tim operasi mengiris data berdasarkan operator, kategori SKU, toko, dan tipe edge case.

Granularitas mikrodetik adalah operasional, bukan marketing. Itu perbedaan antara mengetahui 'seorang reviewer disagree pada 200 label kemarin' dan mengetahui 'reviewer 7 disagree pada 200 label antara 14:00 dan 16:00 WIB, pada cluster SKU dairy-bagel, setelah update gold set di 13:45.' Level atribusi itulah yang membuat siklus kalibrasi mingguan bekerja.

Akurasi: 90%+ sustained, kalibrasi gold set mingguan

Akurasi produksi sustained sudah di atas 90% sejak bulan 4 program. Disiplin yang menahannya adalah kalibrasi gold set mingguan: satu set beku 500 kasus representatif dilabel ulang oleh seluruh kohort produksi aktif setiap Jumat, skor dihitung melawan jawaban gold, dan operator individual yang akurasinya turun di bawah 88% pada gold set ditarik ke sesi retraining 1:1 sebelum mereka menyentuh produksi live lagi minggu depan.

QA sisi klien sampling 5–8% label produksi setiap minggu pada rubrik independen. Skor klien dan Zipang sudah tracking dalam 1,5 poin persentase pada sampel mingguan sejak program stabil, yang menjadi basis untuk qualifier 'sustained' pada angka 90%, itu bukan spike satu minggu, itu rolling average 12-minggu.

Timeline ramp-up: 6 bulan ke steady state

Bulan 1–2: Desain SOP dan konstruksi kuis gate 3 dengan tim Paris klien. Gate 1 dan gate 2 berjalan pada funnel standar; gate 3 baru untuk program ini. 60 kandidat dimajukan ke kohort trial pertama. Pada akhir bulan 2, 28 dari 60 sudah ber-konversi ke produksi.

Bulan 3–4: Ramp dari 28 operator produksi ke 120. Kalibrasi gold set mingguan dimulai. Gold set edge case promosi pertama (2.000+ label) dirakit dan menjadi tulang punggung umpan balik QA.

Bulan 5–6: Ramp dari 120 ke 208 di produksi. Throughput stabil di 3,4 juta task per bulan. Akurasi sustained 90%+ pertama kali tercatat di minggu 14. Sejak bulan 6, program sudah dalam steady state dengan 432 total di-deploy (training + produksi + rotasi) dan 208 di produksi aktif setiap saat.

Apa yang klien ukur

Klien mengukur tiga hal. Pertama, precision dan recall pada held-out test set mereka sendiri, disegarkan kuartalan. Kedua, throughput: task dikirim per hari, per minggu, per bulan, melawan SLA yang disepakati. Ketiga, SLA antrian: waktu dari kedatangan gambar ke output berlabel, dengan ceiling kontraktual 24-jam pada lane standar dan ceiling 4-jam pada lane prioritas untuk pengenalan SKU baru dan refresh price tag.

KPI internal Zipang (akurasi per operator, throughput, rework rate) dibagikan mingguan ke manajer program Paris klien, dan sampel QA klien sendiri dibagikan kembali ke Zipang bulanan. Visibilitas dua arah adalah mekanisme trust yang memungkinkan program scale tanpa re-bid.

Yang tidak berhasil: upaya dialek French dan pivot ke English + translasi AI

Desain pertama gate 4 (wawancara video) mensyaratkan kandidat menunjukkan French conversational. Pass-through turun ke 23%, terlalu rendah untuk memberi makan ramp produksi pada rate yang klien butuhkan. French di level conversational adalah subset talent pool Indonesia yang lebih kecil dibanding French di level reading-and-SOP-comprehension.

Di bulan 3, program pivot: gate 4 menjatuhkan syarat conversational French dan gate 3 menambahkan tes reading English pada SOP bahasa Prancis (label, copy promosi, dokumentasi edge case). Untuk kasus bahasa Prancis live, copy promosi yang butuh native speaker untuk mengonfirmasi tone, sub-pool spesialis kecil dibangun, tapi bulk pekerjaan pelabelan dilakukan dalam English dengan SOP bahasa Prancis klien diterjemahkan dan di-review oleh translasi AI plus reviewer bilingual.

Pivot meningkatkan kecepatan ramp tanpa kehilangan akurasi yang terukur. Pada bulan 5, desain English-plus-translasi menjadi default, dan sub-pool conversational-French dikurangi menjadi tim spesialis 12 operator untuk kasus tone-sensitive saja.

Status saat ini

Program di tahun kontrak ketiga. Kohort produksi aktif 208 sudah stabil, dan angka 432 total di-deploy sudah menjadi angka steady-state selama 18 bulan. Dua kategori produk baru sudah ditambahkan sejak peluncuran ( lini private-label dan lini fresh-produce), masing-masing pada ramp 60-hari menggunakan struktur gate yang sama. Akurasi produksi sustained di 91,2% pada rolling average 12-minggu, dan klien belum re-bid program sejak kontrak asli.

Program didokumentasikan di sini dalam bentuk operasional, klien tidak publik, dan Zipang tidak disclose identitas klien tanpa izin. Yang di-disclose adalah bentuk operasional: 432 di-deploy, 208 di produksi, 3,4 juta task per bulan, akurasi sustained 90%+, tracking KPI mikrodetik, kalibrasi gold set mingguan, ramp 6-bulan. Bentuk yang sama reusable untuk program AI ritel dan shelf-edge CV lain; rubrik adalah variabel, funnel adalah konstanta.

Pertanyaan umum

Bisakah Zipang menyebut nama klien?

Tidak. Klien adalah grup ritel Prancis dengan 100+ hypermarket, dan kontrak tidak mengizinkan disclosure publik nama klien. Yang di-disclose adalah data operasional: 432 di-deploy, 208 di produksi aktif, 3,4 juta task bulanan, akurasi sustained 90%+, ramp 6-bulan, kalibrasi gold set mingguan. Buyer dapat memverifikasi bentuk data yang sama selama panggilan due diligence vendor.

Bagaimana Indonesia dibandingkan dengan Kenya atau India untuk anotasi AI ritel?

Band B2 English Indonesia, eksposur reading French di subset talent pool, dan populasi 280 juta+ (BPS 2024) menjadikannya fit yang kuat untuk program ritel Prancis dan EMEA-facing. Kenya biasanya lebih murah tapi pool lebih kecil; India adalah pool terbesar tapi lebih mahal dan lebih kompetitif. Jawaban yang benar tergantung bahasa, zona waktu, dan price point, bukan peringkat negara tunggal.

Apa ceiling akurasi untuk anotasi CV shelf-edge?

Sustained 90%+ adalah target produksi yang realistis. Angka sustained 95%+ tidak umum untuk CV rak ritel pada volume yang klien butuhkan, dan lebih sering angka dari gold set beku dibanding rolling average produksi live. Angka 90%+ pada program ini adalah rolling average 12-minggu pada produksi live, di-cross-check terhadap sampel QA mingguan klien dalam 1,5 poin persentase.

Berapa lama ramp untuk program serupa?

6 bulan ke steady state pada bentuk 208 produksi / 432 di-deploy. Ramp yang lebih kecil (50 operator) biasanya stabil dalam 10–12 minggu; ramp yang lebih besar (1.000+) biasanya memakan 9–12 bulan karena siklus QA reviewer dan gold set harus dibangun ulang untuk volume baru.

Apa yang terjadi ketika perubahan price tag menyapu jaringan?

Klien menaikkan lane prioritas dengan SLA 4-jam. Tim operasi Zipang memprioritaskan ulang antrian produksi dan realokasi 30–40% kapasitas ke lane prioritas selama durasi sapuan, biasanya 24–72 jam. Gold set mingguan diperbarui mid-week untuk setiap edge case baru yang muncul dari sapuan.

Bagaimana data ditangani di bawah UU PDP dan GDPR?

Gambar toko melewati pipeline data Zipang dengan redaction PII (wajah di-blur, tag pelanggan dihapus) sebelum mencapai operator produksi. Operator bekerja di dalam UI klien ber-watermark tanpa penyimpanan file lokal. Residensi data diatur per klien, program ritel Prancis berjalan di storage region EU dengan enkripsi end-to-end. Kewajiban UU PDP 2022 dan GDPR Article 28 keduanya dipenuhi; kontrak mencakup EU standard contractual clauses.

Poin penting

1. 432 profesional di-deploy, 208 di produksi aktif, 3,4 juta task per bulan, bentuk produksi yang bisa di-sizing-kan program AI ritel lain.
2. Akurasi sustained 90%+ adalah rolling average 12-minggu pada produksi live, di-cross-check terhadap sampel QA mingguan klien dalam 1,5 poin persentase.
3. Ramp 6-bulan ke steady state, dengan kalibrasi gold set mingguan dan tracking KPI mikrodetik sebagai disiplin operasional.
4. Funnel 5-gate dipakai ulang; hanya kuis gate 3 (pelabelan ritel Prancis pada 200+ gambar) yang spesifik untuk program ini.
5. Yang tidak berhasil: mensyaratkan conversational French di gate 4 menjatuhkan pass-through ke 23%, program pivot ke English plus SOP translasi AI dan sub-pool spesialis tone-French 12 operator.
6. Klien tidak publik; program dideskripsikan secara operasional. Buyer dapat memverifikasi bentuk data yang sama selama panggilan due diligence vendor.

Mengevaluasi program anotasi AI ritel?

Program AI ritel Prancis Zipang adalah salah satu dari beberapa kasus referensi untuk pod anotasi volume tinggi akurasi tinggi. Lihat kasus produksi dan minta scoping employer.

Minta scoping anotasi Lihat kasus produksi Zipang

Sumber

Data dan klaim di artikel ini mengacu pada sumber yang dapat diverifikasi (termasuk riset Zipang dan data publik seperti APJII, JobStreet, Buffer).

1.
Riset Pasar Kerja Remote Zipang 2026
Zipang Research · 2026-06-14
2.
Statistik Tenaga Kerja Indonesia
BPS Indonesia · 2026-06-14
3.
EF English Proficiency Index 2025
EF Education First · 2026-06-14
4.
Laporan Penetrasi Internet Indonesia
APJII · 2026-06-14
5.
The Emerging Global Talent Hub: Indonesia
McKinsey & Company · 2026-06-14

Jelajahi jalur pekerjaan terkait

Customer Support Data Entry Administrative

Zipang knowledge base

All guides (EN)Panduan (ID)Research Insights CS Playbook Employers About