APISIX로 펀드 관리 거대 기업의 변신

Yilia Lin

Yilia Lin

March 27, 2023

Case Study

개요

인베스코 그레이트 월 소개

인베스코 그레이트 월 펀드 매니지먼트 주식회사("IGW")는 중국-미국 합작 펀드 매니지먼트 회사로, 다중 자산 투자 능력과 선도적인 주식 전문성을 보유하고 있습니다. 회사의 주요 사업은 양적 투자, 능동적 수익, 그리고 고정 수익을 포함합니다. IGW의 관리 자산은 8,500억 달러를 초과하며, 6천만 명 이상의 투자자에게 서비스를 제공하고 있습니다.

IGW는 자산 관리에 주력하며, 주식, 고정 수익, 양적 전략 등 다양한 자산 클래스에 걸친 다양한 투자 전략을 제공합니다.

도전 과제

  • 다양한 비즈니스 시스템 간의 표준화된 게이트웨이 부재로 인해 게이트웨이와 관련된 수많은 서비스가 독립적으로 운영되어 유지 보수 비용이 증가했습니다.
  • IGW의 기존 게이트웨이는 부하 분산, 카나리 릴리스 등의 기능과 용량이 제한적이어서 구현이 복잡하고 시간이 많이 소요되어 운영 병목 현상을 초래할 수 있었습니다.
  • 이전 설정에서는 인증 기능이 없어 다양한 시스템 인터페이스에 직접 접근할 수 있어 비즈니스 시스템에 큰 보안 위험을 초래했습니다.

결과

  • APISIX를 도입함으로써 IGW는 통합 API 게이트웨이를 구축하여 중복 개발 노력과 기능 품질 불일치 문제를 해결했습니다.
  • DevOps와 파이프라인의 통합은 라우팅 및 서비스 배포의 안정성을 크게 향상시켜 라우팅 및 서비스 릴리스 효율성을 개선했습니다.
  • APISIX의 핫 리로딩은 서비스 재시작 필요성을 크게 줄여 시스템 리소스 부담을 완화하고 다운타임을 줄였습니다.

배경

먼저, IGW의 비즈니스 시스템 아키텍처 진화를 살펴보겠습니다. 초기에 IGW는 모놀리식 서비스 접근 방식을 채택하여 물리적 머신에 서비스 애플리케이션을 배포했습니다. 그러나 서비스와 비즈니스가 성장함에 따라 운영 및 개발 비용이 증가하기 시작했습니다. 이로 인해 가상 머신 단계로 전환하게 되었습니다.

가상 머신 단계에서는 다양한 비즈니스 시스템이 사용하는 게이트웨이가 통일되지 않았습니다. 각 비즈니스가 독립적으로 운영되어 게이트웨이와 관련된 수많은 서비스가 발생하고 높은 유지 보수 비용이 발생했습니다.

펀드 및 증권 부문에서는 네트워크 존에 대한 규제 요구 사항이 있습니다. 각 네트워크 존은 정보 보안 수준에 따라 물리적으로 격리된 보안 존 또는 논리적 보안 존으로 나뉘며, 이 과정에서 방화벽이 사용됩니다.

금융 기술 및 디지털 전환의 클라우드 전략에 부합하여 IGW는 클라우드 마이그레이션 프로젝트를 시작했습니다.

IGW가 APISIX를 선택한 이유

금융 부문은 다른 산업에 비해 서비스 안정성에 더 큰 중점을 두기 때문에 안정성이 우선시됩니다. 가상 머신 환경에서 게이트웨이 서비스가 급증함에 따라 다양한 비즈니스 요구 사항을 충족시키는 것이 중요해졌습니다. 따라서 게이트웨이의 확장성이 매우 중요합니다. 또한, 관측 가능성이 중요한 역할을 하며, 비즈니스 시스템의 로깅, 추적 및 모니터링에 대한 강력한 요구가 있습니다. 마지막으로, 핫 리로딩 기능도 필수적입니다.

IGW가 API 게이트웨이를 선택한 주요 포인트

NGINX는 동적 구성 업데이트에 제한이 있어 구성 변경 시 리로드가 필요합니다. 게다가, 지속적 연결 시나리오에서는 이 과정이 비즈니스 시스템 내에서 트래픽 변동을 초래하여 사용자 경험에 영향을 미칠 수 있습니다.

따라서 이 네 가지 포인트를 고려하여 IGW의 기술 팀은 시장에서 인기 있고 널리 알려진 두 API 게이트웨이인 APISIX와 Kong을 종합적으로 비교했습니다:

  • 기술 프레임워크: APISIX와 Kong은 모두 OpenResty를 기반으로 개발되었습니다. 구성 센터에 대해 APISIX는 etcd를 채택한 반면, Kong은 PostgreSQL을 선택했습니다. APISIX는 etcd와 APISIX의 상태 특성 덕분에 클라우드 네이티브 분산 게이트웨이로 두드러집니다. 그러나 Kong의 구성 센터 선택은 잠재적인 단일 장애점 문제를 초래할 수 있으며, 고가용성을 위해 추가 인프라 지원이 필요합니다.

  • 커뮤니티 활동: APISIX와 Kong 모두 활발한 커뮤니티를 보유하고 있으며, 저장소에서 하루 평균 20번의 커밋이 이루어집니다.

  • 플러그인: APISIX는 80개 이상의 플러그인을 보유하고 있으며, 각 플러그인에 대해 하나의 문서만 제공합니다. Kong은 30개 이상의 플러그인을 보유하고 있으며, 각 플러그인에 대해 4-5개의 문서를 제공합니다. APISIX 플러그인은 각각 100개 이상의 코드를, Kong은 300개 이상의 코드를 보유하고 있습니다.

  • 확장성: APISIX는 많은 프로그래밍 언어를 지원하며, WebAssembly도 지원합니다. Kong은 Lua만을 사용하여 플러그인을 작성할 수 있습니다.

  • 핫 리로딩: 이는 팀이 중점을 두는 부분입니다. APISIX는 플러그인 활성화 또는 비활성화, 새로운 플러그인 추가(예: 사용자 정의 플러그인) 시 밀리초 단위의 핫 리로딩을 지원합니다. 또한, APISIX는 게이트웨이 매개변수의 동적 수정도 지원합니다. 그러나 IGW가 기술 선택을 진행할 당시 Kong은 이 기능을 지원하지 않았습니다.

  • 관측 가능성: APISIX와 Kong 모두 OpenTelemetry를 지원하지만, APISIX는 Elasticsearch, Prometheus, SkyWalking에도 연결할 수 있습니다. IGW가 기술 선택을 진행할 당시 Kong은 SkyWalking을 지원하지 않았습니다.

위의 고려 사항과 비교 포인트를 바탕으로 IGW 기술 팀은 최종적으로 APISIX를 API 게이트웨이로 선택했습니다.

IGW의 사용 시나리오 및 솔루션

IGW의 시스템 아키텍처 소개

IGW의 비즈니스 시스템은 크게 거래 영역, 생산 영역, 관리 영역으로 나뉘며, 각각 다른 API 게이트웨이를 사용했습니다. 원래 IGW는 웹 서버 및 리버스 프록시로 NGINX를 사용했습니다. 동일한 네트워크 분류 내의 비즈니스는 모두 동일한 NGINX를 사용했습니다. 결과적으로 각 서비스 변경 또는 라우팅 업데이트 시 NGINX에서 수동으로 업데이트 및 리로드가 필요했습니다.

인베스코 그레이트 월의 시스템 아키텍처

위 다이어그램은 IGW의 시스템 아키텍처를 보여줍니다. 게이트웨이 보안 클러스터 계층은 Zuul, Spring Cloud Gateway, Kong, NGINX와 같은 다양한 프레임워크를 사용합니다. 아키텍처 관리가 통일되지 않았고 관리가 상대적으로 번거로웠습니다.

솔루션

이러한 도전 과제를 해결하기 위해 IGW는 게이트웨이 클러스터를 APISIX로 전환하는 데 중점을 두었습니다. APISIX는 Kubernetes 클러스터에 배포되므로 YAML을 통해 API를 선언적 방식으로 통합 관리할 수 있습니다. 또한, APISIX Ingress Controller는 Kubernetes 리소스의 변경 사항을 자동으로 감시하여 ApisixRoute, SSL 등을 포함한 APISIX 구성의 실시간 동기화를 가능하게 합니다.

APISIX 사용 후 인베스코 그레이트 월의 아키텍처

아래는 APISIX 사용 후 IGW의 라우팅 동기화 시퀀스 다이어그램입니다.

APISIX 사용 후 IGW의 라우팅 동기화 시퀀스 다이어그램

사용 시나리오

APISIX 사용 후 IGW는 많은 이점을 얻었으며, 그 중 IGW 팀은 비즈니스 관점에서 라우팅, 인증, 관측 가능성, 트래픽 제어에 더 관심을 두고 있습니다.

효율적인 지능형 라우팅

인베스코 그레이트 월의 효율적인 지능형 라우팅

지능형 라우팅은 주로 4계층 및 7계층의 부하 분산에서 나타납니다. 다이어그램에서 보듯이, APISIX Ingress Controller를 통해 동기화된 라우팅 정보는 특정 레이블과 함께 제공되어 실수로 인한 삭제 작업을 효과적으로 방지합니다.

환경에서 테스트한 결과, 데이터가 삭제되더라도 Kubernetes는 APISIX와 빠르게 자동 동기화할 수 있어 데이터 손실 문제를 해결했습니다.

또한, APISIX의 라우팅 업데이트는 밀리초 단위의 응답 속도를 제공하며, 구성 동기화 지연이 거의 느껴지지 않아 우수한 사용자 경험을 제공합니다.

강화된 인증

통합 게이트웨이 도입 전, 각 비즈니스 단위는 데이터 인터페이스의 보안을 보장하기 위해 개별적으로 인증 관련 컴포넌트를 개발해야 했습니다. 비즈니스 측면에서 각 시스템은 중복된 인증 기능을 개발해야 했기 때문에 개발 비용이 높아지고 구현된 기능의 품질이 다양했습니다. 따라서 보안 검증을 위해 IGW는 통합 인증 및 HTTPS 리디렉션 플러그인을 도입했습니다.

통합 게이트웨이 도입 전, 서비스의 HTTPS 인증서는 고가용성(HA) 엔드포인트에서 복호화되었으며, 이는 복잡성, 운영 오버헤드 및 보안 위험을 증가시켰습니다.

강화된 인증의 인베스코 그레이트 월

이러한 도전 과제를 인식한 IGW 기술 팀은 게이트웨이 내에서 인증 기능을 중앙 집중화하여 앞서 언급한 문제를 해결할 계획을 세웠습니다. 이 접근 방식은 비즈니스 시스템의 연구 및 개발 효율성을 크게 향상시켜 개발자들이 핵심 비즈니스 개발에 더 집중할 수 있게 합니다.

APISIX로 전환함으로써 이러한 단점을 완화할 수 있습니다. APISIX는 HTTPS 종료를 처리하고 SSL 인증서를 동적으로 로드하며 보안 관련 작업을 중앙에서 안전하게 관리하여 전반적인 시스템 성능과 유연성을 개선합니다.

모니터링 이상

이전에는 IGW의 원래 비즈니스 시스템에서 관측 가능성에 대한 약한 지원이 시스템 문제 해결, 성능 최적화, 신뢰성 및 사전 모니터링에 부정적인 영향을 미쳤습니다.

따라서 IGW 기술 팀은 APISIX가 제공하는 로그 모니터링 및 추적과 같은 여러 플러그인을 신속하게 통합하여 관측 가능성 능력을 향상시키고자 했습니다.

또한, 팀은 Apache SkyWalking을 분산 추적, Prometheus를 모니터링 목적, ELK를 효율적인 로그 수집을 위해 적극적으로 연구하고 활용했습니다. 놀랍게도 APISIX는 이러한 모든 플러그인을 지원하므로 IGW 기술 팀의 기대와 요구 사항을 완전히 충족하는 이상적인 솔루션으로 입증되어 선호되는 선택이 되었습니다.

IGW의 서비스 토폴로지

위 다이어그램은 기술 팀이 SkyWalking을 생산에 통합한 후 IGW의 서비스 토폴로지를 보여줍니다. 이 포괄적인 다이어그램은 게이트웨이를 통한 트래픽 방향 및 성공률과 같은 중요한 정보를 포함한 서비스 간 호출 관계를 명확하고 간결하게 시각화합니다. 이 토폴로지 다이어그램을 활용하여 IGW 팀은 서비스 체인 내에서 오류 또는 문제의 정확한 위치를 신속하게 파악할 수 있습니다.

트래픽 제어 마스터하기

APISIX는 IGW에 다양한 트래픽 제어 메커니즘을 원활하게 제공하는 효과적인 솔루션으로 입증되었습니다. APISIX를 도입함으로써 IGW 기술 팀은 카나리 릴리스 및 가중치 기반 전략을 통해 트래픽 제어를 원활하게 달성했습니다. 이 강력한 기능은 트래픽 분배를 효율적으로 관리할 수 있게 하여 팀이 필요에 따라 카나리 릴리스를 쉽게 구현하고 트래픽 가중치를 조정할 수 있게 합니다.

카나리 릴리스 기반 시나리오에서 게이트웨이는 HTTP 요청을 통해 다운스트림 인터페이스를 호출하여 특정 데이터를 얻고, 반환된 결과를 기반으로 요청이 카나리 릴리스 환경으로 전송되어야 하는지 여부를 판단해야 합니다.

가중치 정책에 기반하여 가상 머신 및 컨테이너의 서비스가 외부에 병렬로 제공됩니다. 예를 들어, 90%의 트래픽은 가상 머신 서비스에, 10%의 트래픽은 클라우드 서비스에 전달되어 클라우드 서비스의 안정성을 검증합니다. 현재 IGW의 생산 환경은 가중치 기반 카나리 릴리스로 구성되어 있습니다.

APISIX 사용 후 성과

통합 API 게이트웨이 구축

APISIX를 구현함으로써 IGW 기술 팀은 부하 분산, 동적 업스트림, 카나리 릴리스, 서킷 브레이커, 인증, 관측 가능성과 같은 풍부한 트래픽 관리 기능을 제공하는 API 게이트웨이 프레임워크의 표준화를 달성했습니다.

IGW는 게이트웨이에서 통합 인증 기능을 구현하여 중복 개발 노력과 기능 품질 불일치 문제를 해결했습니다. 이를 통해 개발자들이 개발에 더 집중할 수 있게 되었으며, 비즈니스 시스템의 연구 및 개발 효율성을 크게 향상시켰습니다.

라우팅 및 서비스 배포 안정성 향상

APISIX의 라우팅 업데이트는 밀리초 단위의 응답 속도를 제공하며, 구성 동기화는 거의 즉각적으로 이루어져 사용자 경험이 향상되었습니다.

또한, DevOps와 파이프라인의 통합은 라우팅 및 서비스 배포의 안정성을 크게 향상시켰습니다. 이 간소화된 접근 방식은 라우팅 및 서비스 릴리스의 효율성을 개선하여 더 안정적이고 일관된 결과를 보장했습니다.

핫 리로딩으로 성능 및 가동 시간 향상

IGW 기술 팀은 핫 리로딩의 힘을 높이 평가합니다. APISIX는 플러그인 활성화 또는 비활성화, 사용자 정의 플러그인 추가, 게이트웨이 매개변수의 동적 업데이트를 위한 원활한 핫 배포 프로세스를 제공합니다.

결과적으로, 플러그인 구성 및 게이트웨이 설정 수정은 시스템 재시작 또는 중단 없이 즉시 적용될 수 있습니다. 이 놀라운 핫 리로딩 기능은 APISIX 플랫폼의 유연성과 민첩성을 크게 향상시켜 개발자들이 실시간으로 구성을 조정하고 게이트웨이를 특정 요구 사항에 맞게 사용자 정의할 수 있게 합니다.

APISIX의 핫 리로딩 기능은 서비스 재시작의 부담을 크게 완화했습니다. 이 기능은 서비스에 대한 업데이트 및 수정을 완전한 재시작 없이 적용할 수 있게 하여 시스템 성능을 개선하고 다운타임을 줄였습니다.

요약

IGW 기술 팀은 향후 원활한 운영을 위해 APISIX의 기능, 신뢰성 및 성능을 더욱 향상시키는 데 대한 기대를 제시했습니다.

인베스코 그레이트 월에서 APISIX의 성공적인 구현은 상당한 이점과 긍정적인 결과를 가져왔습니다. APISIX를 통해 IGW 팀은 통합 API 게이트웨이 프레임워크를 달성하여 운영을 간소화하고 비용을 절감했습니다. 이 통합은 또한 라우팅 및 서비스의 안정성을 향상시켜 성능을 개선하고 중단을 최소화했습니다.

인베스코 그레이트 월의 놀라운 결과를 고려할 때, APISIX는 펀드 및 증권 부문을 포함한 금융 서비스 산업에 적합한 매우 효과적인 API 게이트웨이 솔루션임이 입증되었습니다. 이 성공 사례는 금융 산업에서 APISIX 도입의 이점을 강력히 증명하며, 해당 산업의 다른 조직들에게도 이를 구현할 것을 강력히 권장합니다.

Tags: