본문 바로가기

AI

AI 에이전트 시대의 안전한 대규모 시스템 관리: OpenKedge의 의도 기반 거버넌스와 실행 증거 사슬 혁신

안녕하세요, 여러분! 오늘은 ‘OpenKedge: Governing Agentic Mutation with Execution-Bound Safety and Evidence Chains’라는 논문을 소개해드리고자 합니다. 이 논문은 자율 AI 에이전트가 시스템 상태를 변경(mutation)하는 방식을 근본적으로 재정의해, AI 에이전트가 운영하는 대규모 시스템에서의 ‘안전’과 ‘신뢰성’을 기술적 관점에서 새롭게 접근했습니다.


전통 API 기반 시스템의 한계와 OpenKedge의 혁신

기존 시스템은 API 호출이 곧바로 시스템 상태 변화를 일으키는 구조입니다. 이때 API는 호출자가 항상 정확하고, 상황을 완벽히 이해하며, 상호 충돌 없이 동작한다는 가정을 깔고 있죠. 사람의 명령이라면 어느 정도 맞을 수 있지만, AI 에이전트처럼 확률적 판단을 하는 주체에게 이런 가정은 폭발적인 실패 가능성을 안고 있습니다.

 

논문에서도 이를 ‘Contextual Blindness(상황 인식 부재), Multi-Agent Conflict(다중 주체 충돌), Unsafe Mutation(위험한 상태 변경), Temporal Inconsistency(시간적 일관성 없음), Unbounded Authority(무한 권한 남용)’이라는 다섯 가지 치명적 실패 모드로 제시합니다.


OpenKedge가 제안하는 기술적 가치

가장 핵심적인 기술 혁신은 '상태 변경을 API 호출의 즉시 실행이 아닌, 의도(intent)를 기반으로 한 엄격한 거버넌스(governance)를 통해 처리하는 것'입니다. 이를 구체적으로 살펴볼게요.

  • 의도 기반 프로토콜(Intent-Governed Mutation Protocol):
    AI 에이전트가 단순히 API를 호출하는 대신 ‘내가 원하는 상태 변화’라는 의도 제안서를 제출합니다. OpenKedge는 현재 시스템 상태와 정책을 바탕으로 이 제안을 검증하고 승인된 경우에만 변화를 허용합니다. 이 전환은 기존 시스템이 ‘누가’ ‘언제’ ‘무엇을’ 요청했는지에 대한 문맥을 무시하고 무조건 실행하는 방식과 극명한 차이죠.
  • 계약 기반 실행 안전성(Execution-Bound Safety via Contracts):
    승인된 의도는 ‘실행 계약’으로 컴파일 되고, 이 계약은 ‘무엇을’, ‘어디를’, ‘언제까지’ 변경할 수 있는지 명확히 제한합니다. 실제 실행은 짧은 시간 동안, 제한된 권한만 가진 임시 ID를 사용하는 형태로 이루어져서, AI 에이전트가 ‘과도한 권한’이나 ‘잘못된 명령’을 실행할 위험을 근본적으로 봉쇄합니다.
  • 의도-실행 증거 사슬(Intent-to-Execution Evidence Chain, IEEC):
    모든 과정(의도 접수→정책 평가→계약 구현→실행→결과)은 암호학적으로 연결된 불변의 로그에 기록됩니다. 이 증거 사슬 덕분에, ‘왜’ ‘어떻게’ 특정 상태 변경이 일어났는지 추적과 감사(traceability)가 가능해집니다.

기존 연구와의 차별점

많은 기존 연구들은 LLM 에이전트가 API를 호출하는 과정에서 발생하는 문제점들을 런타임 필터링, 권한 검증, 혹은 에이전트 간의 협업 방식 개선 수준에서 접근했습니다.

예를 들어:

  • AARM (Autonomous Action Runtime Management): 에이전트가 생성한 행동을 실행 시점에서 통제하려는 시스템.
  • Claude Code (Anthropic): API 호출 전후를 필터링하며 위험한 명령을 걸러냄.

이런 기술들은 ‘실행 후 안전 필터링’을 시도하지만, OpenKedge는 ‘실행 전에 의도를 평가하고 안전을 계약(contract)으로 보장하는’ 근본적 변화를 제시합니다. 즉, ‘사후 대응’이 아닌 ‘사전 예방’ 방식으로 AI 에이전트의 행동을 관리하니, 더 높은 수준의 안정성과 신뢰성을 확보할 수 있습니다.


또한, 다중 에이전트 간 충돌 문제를 정량적 신뢰 점수, 권한 계층, 그리고 시간 정보를 조합해 ‘우선순위’로 해소하는 점도 차별적입니다. 기존 논문들은 보통 협업 프로토콜이나 단순 충돌 회피에 그쳤다면, OpenKedge는 ‘정책에 기초한 공식적 조정체계’를 도입해 모호한 상황에 대해서도 일관된 결정을 내립니다.


실제 적용 사례와 성능

논문에서는 Amazon AWS 클라우드 인프라에서 OpenKedge를 시뮬레이션 및 프로토타입 구현으로 검증했습니다.

  • 고위험 시나리오 방어:
    예를 들어, 에이전트가 ‘사용하지 않는 인스턴스 삭제’ 같은 명령을 내렸을 때도, 실제 종속된 서비스가 있다면 정책이 이를 거부해 서비스 중단 사고를 예방합니다.
  • 성능:
    분산된 다중 에이전트가 동시다발적으로 1만 건의 제안을 제출할 때도, OpenKedge는 3,200건/초의 처리량을 유지하며 결정 절차의 일관성을 보장합니다. 이는 대규모 클라우드 환경에서 실시간 제어가 가능하다는 뜻입니다.

정리: 왜 OpenKedge에 주목해야 할까요?

  1. AI 에이전트가 운영 주체가 된 현시대, 전통적 API 모델은 이제 한계에 부딪쳤습니다.
    불완전하고 불안정한 AI 모델이 직접 실행하는 명령들은 예측 불가능한 오류와 사고를 일으키죠.
  2. OpenKedge는 ‘의도 기반’이라는 새로운 틀을 제시해, AI가 내놓는 행위의 ‘의미’와 ‘안전성’을 시스템이 스스로 평가하고 관리합니다.
    이는 자동화에 내재된 위험을 기술적·구조적으로 해소하는 방법입니다.
  3. 암호학적 증명과 계약 기반 실행 제어를 결합하여, 시스템 전체의 신뢰성과 감사 가능성을 확보합니다.
    단순 로그가 아니라 ‘행동의 이유와 경위’를 증명 가능한 데이터 사슬로 관리하니, 추적과 문제 해결이 훨씬 용이해집니다.

최근 AI 기반 자동화가 급격히 확대되는 상황에서, 이 논문은 ‘대규모 AI 운영시스템의 신규 아키텍처 표준’으로 자리잡기 충분한 기술적 가치를 갖추고 있습니다.


마무리하며

이처럼 OpenKedge는 AI 에이전트 운영 시 발생할 수 있는 위험을 근본부터 봉쇄하는 ‘의도 중심’, ‘계약 보장’, ‘증거 사슬’ 아키텍처로, AI와 시스템의 안전 공존을 꿈꿉니다. 만약 여러분이 AI 운영 안전성, 분산 시스템 거버넌스, 또는 클라우드 인프라 자동화에 관심 있다면 꼭 살펴보시길 추천드립니다.


더 자세한 기술과 코드 구현은 OpenKedge GitHub에서 확인할 수 있으니, 직접 체험해보시는 것도 좋을 것 같습니다!

감사합니다🙌


참고 논문: Jun He, Deying Yu, OpenKedge: Governing Agentic Mutation with Execution-Bound Safety and Evidence Chains, arXiv:2604.08601 (2026)