발행일: 2026년 4월 19일작성: AI 뉴스팀분류: 보안 · AI 모델


■ 핵심 요약

2026년 4월, AI 업계에 새로운 전쟁터가 생겼습니다. 사이버보안입니다. 앤스로픽이 4월 7일 프론티어 보안 모델 **'미토스(Mythos)'**를 제한적으로 공개한 데 이어, 오픈AI가 4월 14일 GPT-5.4-Cyber를 출시하며 맞불을 놓았습니다. 두 기업 모두 AI의 보안 활용에 대한 제한을 완화하면서도, 오남용을 막기 위해 신원 기반 접근 제어를 도입하는 등 새로운 보안 패러다임을 제시하고 있습니다.


■ 앤스로픽 '미토스': 보안 전문가 10시간 작업을 자율 수행

프로젝트 글래스윙: 통제된 환경에서의 검증

앤스로픽이 4월 7일, 프론티어 AI 모델인 **'미토스(Mythos)'**를 발표하고, '프로젝트 글래스윙(Project Glasswing)'이라는 통제된 이니셔티브를 통해 약 40개 선정 기관에 미토스 프리뷰를 공개했습니다.


미토스의 핵심 성능:

  • 사이버짐(CyberGym) 평가: 83.1% 달성

  • 인간 보안 전문가가 10시간 이상 걸리는 작업을 자율적으로 수행

  • 운영체제, 웹 브라우저 등에서 "수천 건"의 주요 취약점 발견

  • 제로데이 취약점 탐지, 공격 체인 분석, 자동 패치 제안 등 수행

앤스로픽은 미토스를 일반에 공개하지 않고, 엄격한 통제 하에 선정된 방어적 보안 목적으로만 사용하도록 제한했습니다. 이는 AI의 보안 오남용 위험을 인식하면서도, 방어적 보안에는 AI가 필수적이라는 판단에 따른 균형 있는 접근입니다.


미국 재무부는 월스트리트 은행들에 미토스 활용을 권고하며, AI 보안 역량이 금융·IT 업계의 필수 요건으로 부상했음을 시사했습니다.


■ 오픈AI 'GPT-5.4-Cyber': "사이버 퍼미시브" 설계로 방어 전선 확대

바이너리 리버스 엔지니어링까지 지원

미토스 발표 일주일 만에, 오픈AI가 4월 14일 사이버보안 특화 모델 GPT-5.4-Cyber를 공개했습니다. 자사 최신 플래그십 GPT-5.4를 보안 작업에 맞게 파인튜닝한 변형 모델입니다.


GPT-5.4-Cyber의 핵심 기능:

  • "사이버 퍼미시브(Cyber-Permissive)" 설계: 합법적 보안 작업에 대한 거부율 낮춤

  • 바이너리 리버스 엔지니어링: 컴파일된 소프트웨어의 악성코드 잠재력 분석

  • 취약점 스캐닝: 대규모 코드베이스에서 보안 취약점 자동 탐지

  • 멀웨어 분석: 악성코드 동작 분석 및 대응 방안 제안

TAC 프로그램 대폭 확대

오픈AI는 GPT-5.4-Cyber 출시와 함께 Trusted Access for Cyber (TAC) 프로그램을 대폭 확대했습니다.

구분

기존

확대

대상

제한적

수천 명 개인 연구원 + 수백 개 보안 팀

검증 수준

단일 티어

다중 티어 (높은 검증 → 더 강력한 기능 접근)

접근 방식

초대형

KYC + 자동화 신원 확인 기반 개방

최고 티어 혜택

-

GPT-5.4-Cyber 접근 + 제한 완화

CTF 벤치마크: 27% → 76% 이상

오픈AI에 따르면, 보안 관련 Capture-the-Flag(CTF) 벤치마크 성능은 꾸준히 향상되었습니다:

  • GPT-5 (2025년 8월): 27%

  • GPT-5.1-Codex-Max (2025년 11월): 76%

  • GPT-5.4-Cyber (2026년 4월): 추가 향상 (구체적 수치 미공개)

오픈AI는 "향후 더 강력한 모델이 출시되면 더 폭넓은 방어가 필요할 것"이라며, "미래 모델의 안전 장치로 현재 버전의 보호장치가 충분할 것으로 예상한다"고 밝혔습니다.


■ 두 모델 비교 분석

항목

앤스로픽 미토스

오픈AI GPT-5.4-Cyber

발표일

2026년 4월 7일

2026년 4월 14일

기반 모델

Claude (프론티어 미공개)

GPT-5.4 파인튜닝

접근 방식

~40개 기관 제한적 공개

수천 명 대상 확대 롤아웃

검증 방식

엄격한 심사 + 계약

다중 티어 KYC

주요 벤치마크

사이버짐 83.1%

CTF 76%+ (GPT-5.1 기준)

핵심 차별화

"수천 건" 취약점 발견 실적

바이너리 리버스 엔지니어링

철학

제한적·통제적

민주적·확장적

접근 철학의 차이

두 기업의 근본적인 차이는 보안 AI의 확산 방식에 있습니다.


앤스로픽은 "제한적이지만 깊이 있는" 접근을 취합니다. 소수의 검증된 기관에만 강력한 도구를 제공하며, 실제 취약점 발견 실적을 통해 효과를 입증하는 전략입니다.


오픈AI는 "넓게 그러나 지능적으로" 접근합니다. 수천 명에게 접근을 제공하되, 다중 티어 검증과 자동화 모니터링으로 오남용을 방어합니다. "가능한 한 광범위하게 방어 도구를 제공하면서 오남용을 방지하는 것"이 목표라고 밝혔습니다.


■ 왜 AI 보안 모델이 갑자기 중요해졌는가

1. AI 자체가 보안 위협의 대상이자 도구

AI 시스템 자체가 사이버공격의 대상이 되면서, AI로 AI를 방어해야 하는 숙환적 상황이 되었습니다. 프롬프트 인젝션, 데이터 탈취, AI 모델 조작 등 새로운 공격 벡터가 등장했습니다.

2. 공격의 자동화·지능화

AI가 악용되면 공격의 속도와 정교함이 기하급수적으로 증가합니다. State of AI 뉴스레터에 따르면, 영국에서는 AI 지원 네트워크 침투 비용이 **약 65파운드(약 11만 원)**에 불과한 것으로 나타났습니다. AI를 통한 방어 없이는 이러한 저비용·고효율 공격에 대응할 수 없습니다.

3. 규제 환경 변화

미국 정부는 AI 공급업체를 국가 안보 대상으로 취급하기 시작했습니다. 앤스로픽은 미국 정부 블랙리스트에 오른 바 있으며, 이란의 AWS 데이터센터 폭격 등 지정학적 갈등이 AI 보안에 직접적 영향을 미치고 있습니다.

4. 엔터프라이즈 수요 폭발

앤스로픽의 연간 매출은 2025년 말 90억 달러에서 2026년 초 190억 달러를 거쳐 현재 300억 달러 이상으로 급증했으며, 1,000개 이상의 기업 고객이 연간 100만 달러 이상을 Claude에 지출하고 있습니다. 이 중 상당 부분이 보안 및 규제 준수 관련 수요입니다.


■ 한국 기업에 대한 시사점

금융·공공 부문: AI 보안 도입 시급

한국의 금융 기관과 공공 기관은 AI 보안 모델 도입을 검토해야 합니다. 미국 재무부가 월스트리트 은행들에 미토스 활용을 권고한 것처럼, 한국에서도 금융감독원과 과기정통부 차원의 AI 보안 가이드라인이 나올 가능성이 높습니다.

국내 보안 기업의 기회

코드센스, 이노웨이브, AhnLab 등 국내 보안 기업들은 글로벌 AI 보안 모델과의 통합을 통해 새로운 비즈니스 기회를 찾을 수 있습니다. 특히 한국어 환경에 특화된 AI 보안 솔루션은 글로벌 모델만으로는 커버하기 어려운 영역입니다.

AI 기본법과의 정합성

한국의 AI 기본법이 시행된 지 3개월이 지난 상황에서, AI 보안 모델의 활용도 규제 프레임워크 내에서 이루어져야 합니다. 특히 AI를 통한 취약점 탐지 과정에서 수집되는 데이터의 보안 처리 등이 새로운 과제가 됩니다.


■ 전망: AI 보안의 미래

AI 보안 모델 경쟁은 앞으로 더 가속화될 전망입니다. 오픈AI의 CTO 프랭크 첸은 "현재 세대의 안전 장치로 향후 더 강력한 모델을 방어할 수 있을 것"이라고 밝혔지만, AI 능력이 빠르게 발전하는 만큼 보안도 지속적으로 진화해야 합니다.


핵심 트렌드는 **"능력 제한에서 신원 기반 접근 제어로"**의 전환입니다. AI 모델 자체의 기능을 제한하는 대신, 신원 확인과 모니터링을 통해 신뢰할 수 있는 사용자에게만 강력한 도구를 제공하는 방식입니다. 이는 오픈AI의 TAC 프로그램과 앤스로픽의 프로젝트 글래스윙 모두에서 공통적으로 관찰되는 패턴입니다.


본 기사는 다음 출처를 종합하여 작성되었습니다: Reuters, SiliconANGLE, CyberSecurityNews, State of AI Newsletter, 서울경제