Penyimpanan Dokumen

Dashboard Ingest — memuat…
Refresh: —
Memuat data…

Penyimpanan Dokumen

URL: /ingest/simpan

Tujuan

Menampilkan inventaris dokumen instansi yang sudah ter-embed ke basis data AI (RAG) — apa saja yang tersimpan di vector DB — lengkap dengan chat per-dokumen. Halaman ini memungkinkan operator dan asesor menjelajahi isi satu dokumen tertentu secara mendalam tanpa membuka berkas aslinya.

Eksplorasi tematik lintas dokumen (kata kunci, konsep, jenis, tahun) bukan di sini — ada di Penelusuran. Halaman ini fokus pada daftar dokumen + chat per dokumen.


Cara Kerja

Halaman ini menampilkan tabel dokumen ter-ingestion. Setiap baris adalah satu dokumen logis yang sudah masuk basis data vektor (multipart digabung via dokumen_id), dengan tombol Chat Dokumen di kolom aksi.

Saat tombol chat diklik, panel samping membuka antarmuka chat yang retrieval-nya dibatasi ke dokumen itu saja (filter_mode=document). Pengguna mengetik pertanyaan dengan bahasa alami; AI agent menjawab berdasarkan isi dokumen tersebut menggunakan semantic search (pencarian berdasarkan makna, bukan kecocokan kata per kata).

Pertanyaan yang disarankan (suggested queries) menyesuaikan jenis dokumen — misalnya RPJMD memunculkan pertanyaan seputar visi-misi & indikator makro, sedangkan LAKIP memunculkan pertanyaan seputar realisasi vs target.


Batas Keahlian AI Agent di Halaman Ini

Penting. AI agent yang melayani chat di halaman ini belum dibekali persona asesor — agent belum memahami kriteria penilaian SAKIP.

Keahlian agent murni terbatas pada eksplorasi isi dokumen terhadap pertanyaan yang diajukan. Agent tidak memberikan penilaian SAKIP, tidak menyimpulkan tingkat kepatuhan, dan tidak merekomendasikan skor.

Cocok untuk pertanyaan eksploratif single-document, seperti:

  • "Ringkas isi utama dokumen ini."
  • "Apa indikator atau target yang disebut?"
  • "Bagian mana yang membahas evaluasi/capaian?"

Penilaian terhadap kualitas SAKIP berdasarkan kriteria PermenPANRB dilakukan pada tahap Evaluasi (di luar halaman ini), lengkap dengan coverage per kriteria dan chat berpersona asesor.


Yang Ditampilkan

  • Ringkasan — total dokumen ter-embed + total chunks di basis data vektor.
  • Toolbar — kotak pencarian nama dokumen + filter jenis dokumen (RPJMD, LAKIP, PK, dst).
  • Tabel Daftar Dokumen — kolom: Nama Dokumen (+ penanda multipart bila ada), Jenis, Tahun, Format, jumlah Chunks, waktu Ingested, dan tombol Chat.
  • Chat Dokumen (panel samping) — caption "Chat Dokumen — {nama dokumen}", retrieval terkunci ke dokumen yang dipilih, dengan riwayat percakapan + sitasi sumber per jawaban.

Perbedaan dengan Chat di Halaman Lain

Aspek Chat Dokumen (halaman ini) Chat Facet (/ingest/telusur) Chat Kriteria (/aisakip/evaluasi)
Caption Chat Dokumen Chat Facet Chat Kriteria
Scope retrieval 1 dokumen (baris yang diklik) Kelompok dokumen per facet (jenis/tahun/format/kata kunci/konsep) Chunks ter-tag ke 1 kriteria LKE
Persona Tanpa persona asesor Tanpa persona asesor Berpersona asesor SAKIP
Cocok untuk "Apa isi spesifik dokumen ini?" "Dokumen apa saja yang membahas X?" "Bagaimana kriteria X tergambar di dokumen?"

Engine retrieval & AI agent identik (BGE-M3 + sakip-chat) — pembedaannya pada pre-filter scope yang dikirim ke endpoint chat.


Data

Daftar dokumen di-query live dari gajah RAG (rag_documents + rag_chunks, group per dokumen_id multipart-aware) via endpoint /ingest/simpan/dokumen. Tidak ada snapshot statis — selalu mencerminkan kondisi vector DB terkini.


Bila Belum Ada Dokumen Tersimpan

Apabila belum ada dokumen yang berhasil masuk basis data vektor pada tahap Pembacaan → penyimpanan, tabel menampilkan pesan singkat. Chat per-dokumen tidak dapat dimulai sebelum minimal satu dokumen ter-embed.