Studi Kasus Klien

Studi kasus: akurasi 90%+ berkelanjutan pada program anotasi interpolasi Transperfect Dataforce

9 menit bacaCase study21 April 2026

Transperfect Dataforce adalah salah satu vendor anotasi data bernama di pasar global data training AI, dan Zipang menjalankan program anotasi interpolasi untuk mereka sejak 2023. Program mencakup anotasi interpolasi frame video lintas motion olahraga, motion training, dan dataset machine learning otomotif. Target akurasi yang ditetapkan klien adalah 90%; akurasi sustained aktual Zipang sudah di atas target itu sejak minggu 12, menutup 2025 di 92,1% pada rolling average 12-minggu. Studi kasus ini mencakup metodologi, kurva akurasi, apa yang klien dapat dan tidak dapat, dan syarat kontrak. Berbeda dengan program ritel Prancis, Transperfect Dataforce dinamai karena mereka adalah vendor publik dan program dirujuk di halaman studi kasus publik mereka.

Read in English

Data singkat

60 → 20

Program Transperfect Dataforce: trainee → full-time

[Zipang Research]

92,1%

Akurasi produksi sustained (rolling 12-minggu)

[Zipang Research]

78%

Akurasi produksi minggu 1

[Zipang Research]

92%

Akurasi produksi minggu 12 (capai 90%+ pertama)

[Zipang Research]

20

Agen produksi full-time

[Zipang Research]

200 kasus

Ukuran kalibrasi gold set mingguan

[Zipang Research]

Apa itu …?

Apa itu anotasi interpolasi?

Anotasi interpolasi adalah tugas pelabelan frame video yang digunakan untuk melatih model computer vision pada motion dan continuity antara frame berurutan. Untuk setiap klip video, anotator mengidentifikasi state objek di frame N, memprediksi state di frame N+24 (atau interval tetap lain), menggambar bounding box, poligon, atau keypoint, dan menandai motion-blur, oklusi, atau transisi scene apapun. Output berlabel adalah ground truth yang digunakan model untuk belajar object tracking, action recognition, dan kontinuitas temporal. Pekerjaan ini lebih sulit dari object detection single-frame karena anotator harus memegang state objek konsisten lintas frame, dan disagree antara dua anotator pada klip yang sama adalah sinyal QA yang berguna.

Klien: Transperfect Dataforce

Transperfect Dataforce adalah divisi anotasi data dari Transperfect, perusahaan layanan bahasa dan konten global yang dikenal publik. Divisi Dataforce menjalankan program anotasi, evaluasi, dan koleksi data untuk training foundation model dan AI vertikal, dan beroperasi di 20+ negara. Vendor dinamai dalam studi kasus ini karena program dirujuk di material publik mereka dan data operasional di bawah konsisten dengan yang mereka publikasikan.

Program ini adalah kaki Indonesia dari kohort anotasi multi-region yang mencakup motion olahraga (basket, football, senam), motion training (yoga, strength training, tari), dan motion otomotif (pedestrian tracking, in-cabin driver monitoring). Pod Indonesia menangani work shift Asia-region dan EU-prime-time; SOP dan gold set yang sama digunakan oleh pod paralel di region lain.

Tugas: anotasi interpolasi lintas frame video

Untuk setiap klip video, anotator menerima 24–48 frame, menandai state objek di frame N, memprediksi state di frame N+24, menggambar bounding box, poligon, atau keypoint yang sesuai, dan menandai edge case: motion blur, oklusi, transisi scene, beberapa objek dari kelas yang sama, visibilitas parsial. Output adalah JSON manifest per klip dengan koordinat level frame plus confidence dan motion-class tag per objek.

Tiga sub-stream memberi makan program. Motion olahraga mencakup kira-kira 45% volume, motion training 35%, dan motion otomotif 20%. Stream olahraga adalah volume tertinggi tapi error rate terendah; stream otomotif adalah volume terendah tapi error rate tertinggi karena deteksi small-object (pedestrian di jarak, refleksi dashboard).

Target akurasi: 90% wajib, 90%+ sustained

Lantai akurasi kontraktual Transperfect adalah 90% pada sampel QA mingguan sisi klien. Di bawah 90% selama dua minggu berturut-turut memicu rencana remediasi; di bawah 88% selama satu minggu memicu eskalasi langsung. Target 90% adalah garis di mana data berlabel berguna untuk training model downstream klien; di bawah 90%, label noise terlalu tinggi untuk dilatih.

Akurasi sustained aktual Zipang pada program sudah di atas 90% sejak minggu 12. Rolling average 12-minggu sudah antara 91% dan 93% lintas 2024 dan 2025, menutup 2025 di 92,1%. Kurva akurasi dari minggu 1 (78%) ke minggu 12 (92%) adalah cerita operasional program dan didokumentasikan di bawah.

Mirror funnel 5-gate dengan kuis gate 3 spesifik interpolasi

Funnel 5-gate Zipang diterapkan dengan kuis gate 3 spesifik anotasi interpolasi: 100 klip video pendek (olahraga, training, otomotif) yang kandidat harus menghasilkan label frame-N dan frame-N+24 per SOP klien. Kuis dinilai terhadap set jawaban beku; ambang lulus adalah 80% akurasi kuis, yang mendekati akurasi produksi minggu 1 78% plus headroom kecil untuk ramp.

Pass rate agregat untuk program ini: gate 1 mempertahankan 26% pelamar, gate 2 mempertahankan 47%, gate 3 mempertahankan 54%, gate 4 mempertahankan 71%, gate 5 mempertahankan 81%. End-to-end, 60 dari kira-kira 1.800 pelamar (3,3%) mencapai kohort trial berbayar. Dari 60, 20 ber-konversi ke full-time produksi (33% konversi trialler-ke-full-time). Konversi yang lebih rendah versus program ritel Prancis mencerminkan tugas yang lebih sulit; program butuh lebih sedikit operator yang lebih tajam, bukan kohort lebih besar.

  • Gate 1: Relevansi CV (English B2, kerja video atau temporal sebelumnya) — 26% lulus
  • Gate 2: Async English + pemahaman SOP — 47% lulus dari survivor
  • Gate 3: Kuis spesifik interpolasi pada 100 klip video — 54% lulus
  • Gate 4: Wawancara video terstruktur + latihan frame-thinking — 71% lulus
  • Gate 5: Trial task berbayar dinilai terhadap gold set beku — 81% lulus
  • End-to-end: 60 dari ~1.800 pelamar mencapai trial; 20 ber-konversi ke full-time

Headcount: 20 agen produksi full-time, kalibrasi gold set mingguan

Kohort produksi aktif adalah 20 agen full-time — grup yang sengaja kecil. Program Transperfect memberi reward pada akurasi sustained dan klien memilih lebih sedikit operator yang lebih tajam di atas kohort lebih besar, sebagian karena tugas tidak scale secara linear: siklus QA reviewer dan gold set adalah bottleneck, dan kohort 50-operator akan butuh dua QA reviewer full-time, sedangkan kohort 20-operator butuh satu.

20 agen didistribusikan lintas Jakarta, Bandung, dan Yogyakarta. Kalibrasi gold set mingguan berjalan pada set beku 200 kasus: setiap Jumat, kohort penuh melabel ulang 200 kasus, skor dihitung melawan jawaban gold, dan operator manapun yang akurasinya turun di bawah 89% pada gold set ditarik ke sesi retraining 1:1 sebelum produksi live minggu depan.

Tracking KPI mikrodetik dan review tiga-lapis

Tiga lapis review berjalan pada setiap klip. Pertama, peer review di frame N: operator kedua melabel frame N secara independen, dan disagree lebih dari 5% pada IoU bounding box memicu re-anotasi. Kedua, supervisor review di frame N+24: QA supervisor meninjau setiap prediksi N+24 melawan video sumber, menilai motion-continuity dan tagging edge case. Ketiga, kalibrasi gold set mingguan pada set beku 200 kasus, dinilai oleh kohort penuh dan dibandingkan ke minggu sebelumnya.

Tracking KPI granularitas mikrodetik berarti setiap label, setiap disagree, setiap re-anotasi di-cap timestamp dan attributable. Tim operasi dapat menjawab pertanyaan seperti 'operator mana yang drift pada sub-stream otomotif setelah gold set diperbarui di minggu 18' dalam satu query dashboard. Tanpa granularitas timestamp, siklus kalibrasi mingguan akan berjalan buta.

Kurva akurasi: 78% di minggu 1, 92% di minggu 12

Akurasi produksi minggu 1 mendarat di 78% pada batch 2.000-klip pertama — jauh di bawah target 90%. Analisis error menunjukkan tiga cluster: edge case motion-blur (operator menggambar box terlalu ketat, kehilangan objek ketika melewati batas frame), deteksi small-object otomotif (pedestrian di jarak terlewat sepenuhnya), dan frame transisi scene (operator melabel frame post-transition alih-alih transition itu sendiri).

Minggu 2–4: retraining tertarget pada tiga cluster error, menggunakan gold set sebagai rubrik pengajaran. Akurasi produksi naik ke 82% pada minggu 4. Minggu 5–8: introduksi lapis peer-review-at-frame-N, yang menangkap disagree sebelum mereka mencapai klien. Akurasi naik ke 88% pada minggu 8. Minggu 9–12: introduksi penuh supervisor review di frame N+24, ditambah gold set mingguan 200-kasus. Akurasi melewati 90% di minggu 11 dan mendarat di 92% di minggu 12.

Kurva sudah stabil sejak minggu 12, berosilasi antara 91% dan 93% pada rolling average 12-minggu. Angka 92,1% untuk akhir-2025 ada di dalam band itu.

Apa yang klien dapat, dan yang klien tidak dapat

Yang klien dapat: 20 agen produksi full-time Indonesia yang mempertahankan akurasi sustained 90%+ pada anotasi interpolasi lintas stream olahraga, training, dan otomotif. Dashboard KPI mingguan. Attribusi mikrodetik dari setiap label, disagree, dan re-anotasi. Laporan kalibrasi bulanan yang menunjukkan skor gold set, drift, dan sesi retraining. Kurva akurasi dari 78% ke 92% lintas 12 minggu pertama, dengan metodologi yang memproduksinya.

Yang klien tidak dapat: penamaan publik operator atau trainer individual pada program. Agen adalah pekerja remote Indonesia yang identitas individunya tidak dipublikasikan. Trainer dan QA supervisor adalah staf Zipang dan juga tidak dinamai individual. Program dirujuk dalam agregat (432 di-deploy, 90%+ sustained, konversi 60 → 20), bukan berdasarkan nama.

Syarat kontrak: tahunan, garansi replacement 30-hari

Program berjalan pada kontrak tahunan, auto-renew dalam termin 12-bulan kecuali salah satu pihak memberikan pemberitahuan 60-hari. Pricing adalah per-task-delivered dengan bonus kualitas yang trigger ketika akurasi rolling 12-minggu bertahan di atas 91%. Garansi replacement 30-hari mencakup agen manapun yang jatuh di bawah ambang gold set selama dua minggu berturut-turut atau yang memicu event eskalasi. Window 90-hari mencakup issue non-performa yang muncul belakangan (throughput konsisten lambat, flag QA berulang, atau kegagalan mempertahankan coverage shift).

Replacement adalah tanggung jawab operator, bukan klien. Klien tidak menjalankan ulang hiring; Zipang menarik dari pool shortlist aktif (diberi makan oleh funnel 5-gate yang sama) dan onboard replacement dalam 5 hari kerja. Lintas hidup program, 7 dari 20 agen full-time asli sudah di-replace; 20 saat ini adalah campuran operator asli dan replacement, dengan operator terlama tenure di 28 bulan.

Hasil

Program di tahun kontrak ketiga. Akurasi sustained di 92,1% pada rolling average 12-minggu. Kohort 20 full-time stabil. Replacement berfungsi. Klien belum re-bid program sejak kontrak asli, dan pod paralel di region lain dikalibrasi terhadap gold set pod Indonesia sebagai baseline.

Angka 90% adalah lantai kontraktual; 92,1% adalah apa yang sebenarnya program deliver. Keduanya defensible. Kurva akurasi dari 78% di minggu 1 ke 92% di minggu 12 adalah cerita operasional tentang bagaimana funnel 5-gate, gold set beku, review tiga-lapis, dan kalibrasi mingguan kombinasi untuk mendarat di angka yang bisa klien gunakan untuk melatih model.

Pertanyaan umum

Mengapa Transperfect Dataforce dinamai tapi klien ritel Prancis tidak?

Transperfect Dataforce adalah vendor publik dan merujuk program di material studi kasus publik mereka. Klien ritel Prancis adalah grup ritel Prancis privat yang belum memberikan persetujuan untuk disclosure publik. Studi kasus mendeskripsikan program ritel Prancis secara operasional — bentuk operasional yang sama, tanpa nama — karena kontrak tidak mengizinkan penamaan.

Bagaimana akurasi bisa dari 78% di minggu 1 ke 92% di minggu 12?

Arc retraining tiga-langkah. Minggu 2–4: retraining tertarget pada tiga cluster error yang diidentifikasi dalam analisis error minggu 1 (motion blur, deteksi small-object, transisi scene), menggunakan gold set sebagai rubrik. Minggu 5–8: introduksi peer review di frame N, yang menangkap disagree sebelum mereka mencapai klien. Minggu 9–12: tambahkan supervisor review di frame N+24 plus gold set mingguan 200-kasus. Ambang 90% pertama kali dilewati di minggu 11.

Apa ambang untuk gagal program?

Di bawah 90% selama dua minggu berturut-turut memicu rencana remediasi. Di bawah 88% selama satu minggu memicu eskalasi langsung. Di bawah 89% pada gold set mingguan selama dua minggu berturut-turut mengeluarkan operator dari produksi live ke retraining 1:1.

Bisakah klien meminta agen tambahan di luar 20?

Ya, dengan ramp 60-hari pada metodologi yang sama. Bottleneck adalah QA reviewer dan siklus gold set, bukan pool operator, jadi ekspansi headcount di-pacing ke kapasitas QA. Ramp 40-operator butuh 90 hari; ramp 100-operator butuh 6 bulan.

Apakah SOP yang sama digunakan lintas region?

Ya. Pod Indonesia dan pod paralel di region lain bekerja dari SOP yang sama, gold set yang sama, dan rubrik yang sama. Skor kalibrasi pod Indonesia adalah baseline terhadap mana region lain dibandingkan, dan kalibrasi cross-region mingguan dijalankan oleh Transperfect untuk menandai drift.

Apa yang dicakup garansi replacement 30-hari?

Agen manapun yang jatuh di bawah ambang gold set selama dua minggu berturut-turut, atau yang memicu event eskalasi, di-replace dalam 30 hari. Window 90-hari mencakup issue non-performa yang muncul belakangan: throughput konsisten lambat, flag QA berulang, atau kegagalan mempertahankan coverage shift. Replacement adalah tanggung jawab operator, bukan klien.

Poin penting

  • 1. Transperfect Dataforce adalah vendor publik; program dinamai. Target akurasi adalah 90%; akurasi sustained Zipang adalah 92,1% pada rolling average 12-minggu.
  • 2. 60 dari kira-kira 1.800 pelamar (3,3%) mencapai kohort trial; 20 dari mereka (33%) ber-konversi ke full-time produksi. Kohort sengaja kecil.
  • 3. Review tiga-lapis: peer review di frame N, supervisor review di frame N+24, gold set mingguan 200-kasus. Disagree lebih dari 5% IoU memicu re-anotasi.
  • 4. Kurva akurasi: 78% minggu 1, 82% minggu 4, 88% minggu 8, 90% minggu 11, 92% minggu 12, berosilasi 91–93% sejak saat itu.
  • 5. Kontrak tahunan, pricing per-task dengan bonus kualitas di atas 91%, garansi replacement 30-hari, window non-performa 90-hari. Replacement adalah tanggung jawab operator.
  • 6. Yang klien tidak dapat: penamaan publik operator atau trainer individual. Program dirujuk dalam agregat, bukan berdasarkan nama.

Mengevaluasi program anotasi interpolasi atau frame video?

Zipang menjalankan anotasi frame video di akurasi sustained 92,1% dengan review tiga-lapis dan kalibrasi gold set mingguan. Lihat kasus produksi dan minta scoping employer.

Sumber

Data dan klaim di artikel ini mengacu pada sumber yang dapat diverifikasi (termasuk riset Zipang dan data publik seperti APJII, JobStreet, Buffer).

  1. 1.
    Riset Pasar Kerja Remote Zipang 2026

    Zipang Research · 2026-06-14

  2. 2.
  3. 3.
    Statistik Tenaga Kerja Indonesia

    BPS Indonesia · 2026-06-14

  4. 4.
    EF English Proficiency Index 2025

    EF Education First · 2026-06-14

  5. 5.
    Indonesia: The Next Big Talent Story

    McKinsey & Company · 2026-06-14

Jelajahi jalur pekerjaan terkait