Tokens vs. Humans: Dilema Baru Alokasi Modal Korporasi di Era Generative AI

(Credit: CNBC)

Perkembangan kecerdasan buatan (Artificial Intelligence/AI) dalam lanskap bisnis global kini tengah menemui titik balik yang krusial. Realitas di lapangan menunjukkan bahwa implementasi Generative AI ternyata jauh lebih mahal daripada yang diperkirakan oleh banyak pihak. Situasi ini memaksa para Chief Financial Officer (CFO) di berbagai perusahaan besar, termasuk jajaran Fortune 500, menghadapi dilema alokasi modal (trade-off) yang brutal: memilih token atau manusia.

Dua CEO AI enterprise yang berada di pusat pertumbuhan teknologi ini memaparkan potret tajam mengenai bagaimana lonjakan biaya operasional menjadi ancaman nyata bagi keberlanjutan bisnis berbasis AI. Risiko fiskal ini tampaknya belum sepenuhnya disadari oleh pasar saham global, yang saat ini masih terus mencetak rekor tertinggi dan melahirkan raksasa-raksasa baru bernilai triliunan dolar seperti Micron.

Fenomena Anggaran AI yang Habis dalam Hitungan Minggu

Saat ini, topik utama yang mendominasi ruang rapat direksi di hampir setiap korporasi besar adalah pembengkakan anggaran AI yang tidak terkendali (overblown AI budgets). Arvind Jain, CEO Glean—perusahaan AI enterprise terkemuka—mengungkapkan sebuah realitas yang mengejutkan.

"Perusahaan-perusahaan melaporkan kepada kami bahwa anggaran tahunan yang mereka alokasikan untuk AI habis hanya dalam waktu satu atau dua bulan," ujar Jain kepada CNBC.

Penyebab utamanya adalah biaya komputasi AI (inference costs) yang tidak kunjung turun seperti yang diekspektasikan oleh para pembeli. Sebaliknya, biaya tersebut justru meroket. Setiap kali laboratorium riset AI frontier merilis model terbaru, biaya per tokennya rata-rata dua kali lebih mahal dibandingkan model yang digantikannya. Jain menilai tren ini menempatkan adopsi AI korporasi pada jalur yang tidak berkelanjutan (unsustainable path).

Secara historis, biaya teknologi hanyalah sebagian kecil dari keseluruhan biaya operasional (operating expenses) sebuah bisnis. Namun saat ini, untuk pertama kalinya dalam sejarah modern, biaya teknologi setara dengan biaya tenaga kerja manusia. Konsekuensinya, pertumbuhan anggaran AI yang membengkak ini mulai mengorbankan dan merebut porsi alokasi dana yang semula disiapkan untuk pertumbuhan jumlah karyawan (future headcount growth).

Tiga Fase Transisi Korporasi: Dari "Tokenmaxxing" Menuju Rasionalitas

Matan Grinberg, CEO Factory AI—sebuah perusahaan yang bergerak di bidang otomatisasi perutean beban kerja rekayasa (engineering work) ke berbagai model AI—melihat fenomena ini sebagai masalah alokasi sumber daya (resource allocation problem) yang sangat definitif di tingkat manajemen puncak.

Menurut Grinberg, dalam kurun waktu sekitar satu tahun terakhir, korporasi telah melewati tiga fase transisi yang dinamis:

Fase Pertama (Tuntutan Regulasi Internal): Dewan komisaris (board of directors) mendesak para CEO untuk segera mengintegrasikan AI ke dalam lini bisnis demi gengsi dan inovasi.
Fase Kedua (Tokenmaxxing): Perusahaan menggunakan AI secara masif melalui segala cara yang memungkinkan tanpa memedulikan efisiensi biaya.
Fase Ketiga (Penilaian Ulang): Tim kepemimpinan perusahaan mulai bersikap kritis dan menilai kembali kebutuhan riil mereka terhadap penggunaan model-model premium yang sangat mahal.

"Apakah kita benar-benar perlu menggunakan kecerdasan setingkat Claude Opus untuk setiap tugas operasional yang sederhana? Jawabannya adalah tidak," tegas Grinberg.

Tingginya Biaya yang Belum Sebanding dengan Hasil (Paying More Than It Pays Back)

Akar dari tekanan finansial ini terletak pada fakta bahwa teknologi AI saat ini memang bekerja dengan sangat baik, namun secara ekonomi belum mampu membiayai dirinya sendiri (doesn't yet pay for itself).

AI yang ada sekarang sangat kuat (powerful), tetapi sangat tidak efisien dari segi konsumsi daya dan biaya. Nilai tambah (value) nyata yang dihasilkan bagi bisnis masih tertinggal di belakang biaya infrastruktur yang harus dikeluarkan oleh perusahaan.

Masalah ini diperparah oleh inefisiensi internal dalam pemilihan model. Sekitar 95% penggunaan AI di tingkat perusahaan saat ini masih berjalan di atas model frontier yang paling premium dan mahal, bahkan untuk tugas-tugas administratif ringan yang sebenarnya bisa ditangani oleh alternatif model yang jauh lebih murah.

Solusi Strategis: Efisiensi 10x Lipat Melalui Model Routing

Sebenarnya, ada solusi sederhana untuk mengatasi kebocoran anggaran ini, yaitu dengan menerapkan mekanisme Model Routing (perutean model). Tugas-tugas yang mendasar dan mudah harus dialihkan ke model AI dengan tingkatan (tier) yang lebih murah. Menurut Arvind Jain, ini adalah langkah efisiensi yang paling mudah dicapai (lowest-hanging fruit). Dengan manajemen perutean model yang tepat di lini depan, perusahaan dapat menghemat biaya hingga 10 kali lipat.

Pendekatan inilah yang mendasari layanan Factory AI, yang secara otomatis mengirimkan setiap tugas spesifik ke model yang paling sesuai dan efisien. Grinberg memberikan analogi menarik mengenai perbedaan antara model frontier terbaru saat ini:

"Perbandingan antara model tingkat Opus 4.7 dengan Opus 4.8 itu seperti perbedaan antara seorang profesor yang sudah mengajar selama 13 tahun dengan profesor yang sudah mengajar selama 15 tahun. Bagi orang awam, sangat sulit untuk membedakan hasil kerjanya."

Oleh karena itu, memaksakan penggunaan model tertinggi untuk setiap pekerjaan adalah sebuah pemborosan struktural.

Kesimpulan: Ujian Sensitivitas Harga di Pasar AI

Seluruh ekosistem investasi AI saat ini berdiri di atas asumsi bahwa permintaan historis akan tetap tinggi dan para pembeli tidak akan sensitif terhadap harga (price-insensitive). Namun, realitas dari dalam korporasi Fortune 500 menunjukkan hal sebaliknya: permintaan pasar ternyata sangat sensitif terhadap harga.

Sinyal koreksi biaya ini menjadi peringatan keras, khususnya bagi valuasi perusahaan penyedia model premium seperti OpenAI dan Anthropic yang model bisnisnya sangat bergantung pada strategi harga premium. Bagi para pemimpin strategi bisnis, tata kelola AI (AI governance) ke depan tidak lagi sekadar tentang bagaimana mengadopsi teknologi, melainkan bagaimana mengoptimalkan setiap token komputasi agar memberikan return yang sebanding dengan investasi yang dikeluarkan.

SetyoBudianto.com

Search This Blog