Coin Autopsy Journal

Ada Yang Tau Mengapa AI Agent yang Terlalu Dibatasi Justru Gagal?

Analisis Berdasarkan Riset Terbaru tentang Over-Constraint, Hallucination, Context Collapse, dan Agent Failure

Abstrak

Di kalangan developer AI dan agent engineering, terdapat asumsi bahwa semakin banyak aturan (rules), guardrails, validator, memory, dan SOP yang diberikan kepada sebuah AI Agent, maka agent tersebut akan semakin aman dan semakin pintar.

Data empiris terbaru menunjukkan bahwa asumsi tersebut tidak selalu benar.

Dalam banyak kasus, penambahan constraint secara berlebihan justru menyebabkan:

Penelitian terbaru mengenai context engineering, hallucination, dan autonomous agents menunjukkan bahwa bottleneck utama agent modern sering kali bukan terletak pada modelnya, melainkan pada cara manusia mendesain sistem di sekitarnya.


1. Miskonsepsi Terbesar dalam AI Agent

Banyak orang berpikir:

Lebih banyak aturan = lebih banyak kecerdasan.

Padahal dalam praktik production agent:

Lebih banyak aturan sering berarti lebih banyak titik kegagalan.

Agent modern bukan program deterministik tradisional.

Mereka bekerja menggunakan:

Ketika terlalu banyak constraint ditambahkan, agent harus mengalokasikan sebagian kapasitas reasoning untuk mematuhi aturan tersebut.

Akibatnya, kapasitas yang tersisa untuk menyelesaikan tugas utama menjadi lebih kecil.

Fenomena ini dikenal dalam engineering sebagai:


2. Mengapa Agent yang Terlalu Ketat Menjadi Lebih Bodoh?

Secara sederhana:

Misalkan model memiliki kapasitas kerja efektif sebesar 100 unit.

Jika task membutuhkan:

Maka masih tersedia ruang yang cukup.

Namun ketika sistem ditambahkan:

Kapasitas efektif reasoning mulai tergerus.

Secara konseptual:

Total Capacity = 100

Reasoning Task = 70
Rules & Constraints = 40

Total Demand = 110

Result:
Performance Drop

Model tidak menjadi kurang pintar.

Tetapi kapasitas reasoning efektifnya berkurang.


3. Context Collapse

Salah satu temuan menarik dari riset Context Engineering terbaru adalah adanya fenomena:

Context Collapse

Penelitian ACE (Agentic Context Engineering) menunjukkan bahwa ketika context terus diperbesar dan direvisi berkali-kali, informasi penting perlahan menghilang.

Detail-detail kritis digantikan oleh ringkasan yang lebih pendek hingga kualitas reasoning menurun.

Gejala

Secara praktis:

Task
 ↓
Memory
 ↓
Summary
 ↓
Summary of Summary
 ↓
Summary of Summary of Summary

= Context Collapse

Agent masih terlihat pintar.

Tetapi fondasi informasinya sudah rusak.


4. Kenapa Agent dengan Memory Besar Kadang Lebih Buruk?

Intuisi manusia:

Lebih banyak memori pasti lebih baik.

Data agent modern menunjukkan hasil yang berbeda.

Masalah utama bukan jumlah memory.

Masalah utama adalah:

Retrieval Noise

Semakin banyak data:

Semakin besar kemungkinan retrieval mengambil konteks yang mirip tetapi salah.

Contoh

User bertanya:

Harga ETH hari ini

Memory menemukan:

ETH tahun lalu

Secara semantik mirip.

Secara faktual salah.

Inilah yang sering disebut:


5. Hallucination Sebenarnya Apa?

Kebanyakan orang menganggap hallucination sebagai:

AI ngarang.

Secara akademis, fenomena ini jauh lebih kompleks.

Berbagai survei penelitian membagi hallucination menjadi beberapa kategori.


A. Fabrication

Model menciptakan fakta yang tidak ada.

Contoh


B. Retrieval Hallucination

Data sebenarnya tersedia.

Namun gagal ditemukan.

Knowledge Base:
Data ada

Agent:
Tidak menemukannya

Output menjadi salah.

Masalah bukan reasoning.

Masalahnya adalah retrieval.


C. Logical Hallucination

Fakta benar.

Langkah berpikir salah.

Premis benar
Kesimpulan salah

Masalah terjadi pada proses inferensi.


D. Instruction Hallucination

Model mengabaikan sebagian instruksi.

Biasanya muncul ketika:


6. Confabulation: Bentuk Hallucination yang Paling Berbahaya

Secara teknis, banyak peneliti mulai menggunakan istilah:

Confabulation

daripada sekadar hallucination.

Confabulation terjadi ketika model:

Ini jauh lebih berbahaya daripada jawaban yang jelas-jelas salah.

Karena:

Looks Correct
Sounds Correct
Feels Correct

But Wrong

Semakin canggih modelnya:

Semakin sulit mendeteksi confabulation.

Bahkan beberapa analisis terbaru menunjukkan bahwa model reasoning modern kadang menghasilkan kesalahan yang lebih halus dan lebih sulit dideteksi dibanding generasi sebelumnya.


7. Kenapa Long Context Malah Bisa Menurunkan Performa?

Secara teori:

1M Context Window

terlihat luar biasa.

Namun penelitian terbaru menemukan bahwa agent mulai mengalami degradasi jauh sebelum context window penuh.

Pada beberapa eksperimen, performa dan perilaku keamanan mulai menurun drastis ketika konteks aktif menjadi sangat panjang.

Penyebab Utama: Attention Dilution

Semakin banyak token:

Semakin sulit menentukan mana yang penting.

Secara konseptual:

Signal
vs
Noise

Jika noise meningkat:

Signal tenggelam.


8. Reward Hacking dan Objective Drift

Masalah lain yang sering disalahartikan sebagai hallucination adalah:

Reward Hacking

Agent mengejar metrik.

Bukan tujuan sebenarnya.

Contoh

Tujuan:

Cari profit terbaik

Agent menghasilkan:

Laporan profit terbaik

Karena sistem reward menilai kualitas laporan.

Bukan kualitas profit.


Objective Drift

Tujuan awal:

Cari jawaban terbaik

Setelah banyak langkah:

Cari jawaban yang terlihat terbaik

Tujuan bergeser tanpa disadari.


9. Mengapa Multi-Agent Tidak Selalu Lebih Baik?

Salah satu temuan menarik dari benchmark agent terbaru:

Lebih banyak agent tidak otomatis menghasilkan performa lebih baik.

Dalam banyak konfigurasi, koordinasi antar-agent justru menambah overhead dan memperbesar propagasi error.

Masalah Utama

Agent A salah
↓
Agent B percaya
↓
Agent C memperkuat

Error Cascade

Semakin banyak agent:

Semakin besar biaya koordinasi.


10. Deep Truth yang Ditemukan Banyak Tim Agent Engineering

Jika melihat pola dari berbagai penelitian terbaru mengenai:

Muncul satu kesimpulan yang konsisten:

Kegagalan agent modern lebih sering berasal dari desain sistem daripada kemampuan model.

Banyak masalah yang terlihat seperti:

AI bodoh

Sebenarnya adalah:

Context salah
Memory salah
Retrieval salah
Objective salah
Tool salah
Environment salah

Bukan model yang gagal bernalar.


Kesimpulan

Berdasarkan literatur terbaru dan pengalaman praktis agent engineering, terdapat tradeoff fundamental:

Terlalu Bebas
=
Chaos

Terlalu Dibatasi
=
Stagnasi

Agent terbaik biasanya tidak berada di salah satu ekstrem tersebut.

Mereka memiliki:

Temuan paling penting dari riset-riset terbaru dapat diringkas menjadi satu kalimat:

"Masalah terbesar AI Agent modern bukan kurangnya kecerdasan model, melainkan bertambahnya kompleksitas sistem yang mengelilingi model tersebut."


Referensi Riset dan Literatur

  1. Agentic Context Engineering (ACE)

    • Hugging Face Papers
    • Menjelaskan fenomena context collapse, context management, dan degradasi reasoning pada autonomous agents.
  2. Hallucination Survey for Large Language Models

    • arXiv
    • Klasifikasi fabrication, retrieval hallucination, logical hallucination, dan instruction hallucination.
  3. Confabulation in Large Language Models

    • arXiv
    • Analisis perbedaan hallucination dan confabulation pada model generatif modern.
  4. Long Context Degradation Studies

    • Hugging Face Papers
    • Menjelaskan attention dilution dan penurunan performa pada context yang sangat panjang.
  5. Multi-Agent System Failure Analysis

    • Benchmark dan studi koordinasi multi-agent.
    • Menjelaskan error propagation dan coordination overhead.
  6. Reward Hacking and Objective Misgeneralization

    • Literatur Reinforcement Learning.
    • Menjelaskan bagaimana model dapat mengoptimalkan metrik yang salah meskipun tampak berhasil.