Мій простий погляд на агентські речі — вся продуктивність над моделями походить із контексту, тому потрібно надати доступ до всіх ваших даних, найбільш чутливих даних, більше, ніж ви коли-небудь думали, що можна ділитися раніше, і це означає, що ви захочете самостійно хостити у великому масштабі
Спочатку ви самостійно хостите віртуальну машину / секретну інфраструктуру, для більших завдань переходите до «голого металу», а потім, коли почнете відчувати дискомфорт щодо великих моделей, купите кластер GPU і самостійно хостите тонко налаштовані моделі, які підходять для 90% завдань
Коли все піде шкереберть, потрібні журнали аудиту, сповіщення, обмеження радіусу вибуху — все таке
Отже, це не проблема «AI інженерії», це дуже-дуже традиційна проблема корпоративної / zerotrust інфраструктури!
121