안녕하세요.
이전 시대의 경제에는 없었던 암호화폐
최근 암호화폐 현물 ETF 관련 뉴스들이 나오면서
암호화폐들이 자산으로 인정될지,
인정된다면 기존의 자산들과는 어떤 상관관계를 가질지 시장참여자들의 결정이 필요할 것 같습니다.
한때 암호화폐가 나스닥과 커플링이 있었지만
요 근래에는 미국 10년 금리와 커플링이 있는 듯합니다.
새로운 자산도 그렇고, 기존 자산들도 그리고 주식이라는 자산 안의 여러 섹터들 간에도 상관도가 지속적으로 변화합니다.
낮은 상관관계가 주는 의미
자산간의 낮은 상관관계는 포트폴리오 관리와 투자에 중요한 의미를 가집니다.
자산에서 상관관계는 두자산간의 상승과 하락에 대한 연관성의 정도를 의미합니다.
낮은 상관관계의 자산은 두 자산의 가격 움직임이 서로 크게 연관되어있지 않음을 의미합니다.
자산배분의 기본은 낮은 상관관계이고 설정한 최적의 비율 안에서 리밸런싱을 진행한다면
경제 이벤트마다 우세한 자산군의 수익을 실현하고 저평가된 자산들을 자연스럽게 매집하게 됩니다.
이런 상관관계를 파악하기 위해 자산들의 차트를 보고 분석해도 좋지만
저는 벡터라는 것을 이용하곤 합니다.
벡터
vector는 수학과 물리학, 컴퓨터 과학 등의 분야에서 중요한 개념입니다.
벡터는 자체가 방향을 가지고 있기도 하고 벡터의 크기는 방향을 가진 양으로 정의됩니다.
벡터는 크기와 방향을 가지고 있는데 벡터로 풀고자 하는 것들이 2차원이던 n차원이던 특징을 공간적 위치로 표현해 줍니다.
요즘 벡터 데이터베이스(Vector DB)는 기술과 데이터 과학 분야에서 매우 중요한 관심사로 떠오르고 있습니다.
이 혁신적인 데이터베이스 유형은 특정 이미지나 데이터셋의 특징들을 고차원의 데이터로 매핑하고,
이를 벡터 형태로 저장하여 효율적으로 관리합니다. 벡터 데이터베이스의 가장 큰 장점은
대량의 복잡한 데이터를 효율적으로 처리하고 검색할 수 있다는 점입니다.
벡터 데이터베이스는 제목으로만 검색 가능하던 이미지나 동영상 검색을 가능하게 하고
텍스트 데이터를 벡터로 변환하여 글이 담고있는 감정이나 주제 혹은 유사한 문서들의 검색이 가능하기도 합니다.
추천시스템에서도 사용자의 선호도나 행동 패턴등을 벡터로 표현하고 이를 기반으로 활용하기도 합니다.
코사인 유사도
이런 벡터를 활용해서 데이터간 유사도를 검증하는 방법이 코사인 유사도 방법입니다.
코사인유사도는 벡터간 이루는 각도의 코사인 값을 이용하여 두 벡터 사이의 유사성을 측정하는 방법입니다.
어떤 차원의 양수 공간에서도 적용가능해서 고차원 데이터에서 유사도 측정을 위해 사용되곤 합니다.
이런 코사인 유사도를 자산군들의 상관성을 계산하는 데 사용하려고 합니다.
일별 수익률을 수집하고 벡터로 만든 후, 각 자산군의 코사인 유사도를 계산하여 파악하려고 합니다.
서두에 이야기했던 암호화폐와 주식, 채권의 커플링이 바뀌는것 같다고 했는데
실제로 그런 현상이 일어났는지 확인해보도록 하겠습니다.
암호화폐의 커플링 변화
첫 차트는 암호화폐, 나스닥, 미국채권 10년 IEF의 차트입니다.
2022년부터 현재까지의 기간으로 나타내었습니다.
아래 차트가 각 자산군간 상관도를 나타내고 있습니다.
각 집계시점에서 최근 한 달간의 자산 간 상관도를 나타내었으며 1에 가까울수록 양의 상관
0일수록 상관성이 없고 -1일에 가까울수록 음의상관관계를 가집니다.
서두에 이야기한 것처럼 과거 암호화폐와 나스닥이 강한 상관관계를 가진 시절이 있었습니다.
아래 주황색 라인이 비트코인과 QQQ의 상관성인데 2022년에는 큰 상관성을 보이다가 요 근래 낮은 상관성으로 변화했습니다.
그리고 초록색 라인이 비트코인과 IEF의 상관성인데 과거에도 비슷하게 음의 상관관계였고
한때 상관성이 낮아졌다가 다시금 음의 상관관계가 강해지고 있습니다.
채권가격과 강한 음의 상관관계라면 금리와는 강한 양의 상관관계입니다. 경험적으로 느꼈던 것들이 실제 데이터로 검증되었습니다.
자산배분 자산군 상관성
현재 자산배분 알고리즘으로 운용하고있는 크게 4개의 자산군들을 가져와서
상관성의 추이를 확인하려고합니다.
자산배분의 핵심은 낮은 상관성을 가진 자산, 설정한 비율대로 리밸런싱 하는 것입니다.
그리고 다양한 자산으로 포진된 포트폴리오는 더 안정적인 MDD를 가질 수 있습니다.
자산배분 자체로 수익을 포기한다고 느낄 수 있지만 안정적으로 MDD를 제어하게 된다면
투자에 드는 자산의 규모 자체가 달라질 수 있을것이고, 적은 돈으로 큰 수익을 얻는 것보다 더 안정적이고
후에 레버리지를 통해 오히려 더 많은 초과 수익을 노릴 수 있습니다.
이렇게 자산배분을 해두어도 MDD가 생기는 이유는 자산군간의 유사도, 커플링이 생겨서
모든 자산들이 상승/하락하는 양상을 띌 때 큰 고점, 저점을 형성할 수 있고 이럴 때 MDD의 변화가 크게 생기게 됩니다.
결론은 상관성이 낮은 더 다양한 자산들을 모아나가면 목적으로 하는 MDD를 통제할 수 있습니다.
위 차트는 최근 자산배분에 쓰이는 자산들(주식, 채권, 에너지 섹터:원자재 대체, 금)의 수익률과,
코사인 유사도에 대한 추이를 나타내었습니다.
아래 차트에서는 절댓값 0.2를 기준으로 빨간 점선으로 낮은 상관성의 기준을 나름대로 표시해 보았습니다.
자산들이 7월경 같이 상승해서 상관성이 대부분 높은편이고
9월 중순 ~ 10월 초 사이에도 일제히 하락하면서 상관성이 높았습니다.
실제 자산배분전략의 MDD 저점도 저 구간에서 발생했음을 기억하실 겁니다.
자산배분의 이점을 잘 살릴 수 있는 구간은
상관성이 빨간 점선의 영역 안에 많은 선들이 수렴되어야 리밸런싱에 따른 안정적인 수익을 얻을 수 있을 것 같습니다.
활용
이제 자산들 간의 상관성을 시각적으로 분석해 보았습니다.
나름 자산배분을 했다고 하더라도 위와 같은 시기에 상관성이 높아지게 된다면
전략의 장점인 통제된 MDD를 잃게 됩니다.
그렇기에 더 다양한 자산들을 찾아야 하고 그 과정에 위에서 진행했던 코사인유사도 방법이 좋은 방안이 될 수 있습니다.
해당 기간에 유사도가 자산들에 비해 적었던 것들을 찾아서 자산배분 포트폴리오에 추가될 수 있는지 확인해 보면 좋을 것 같습니다.
자산의 추가는 물론 여유자금의 추가 투자도 자산이 일제히 하락하며 상관성이 높아지는 구간을 파악한다면
더욱 유리하게 진입할 수 있을 것입니다. 그러려면 지속적으로 모니터링할 수 있어야겠죠.
그래서 저는 여러분들께 지속적으로 이런 유익한 지표들을 관찰할 수 있는 사이트를 준비 중입니다.
차트에 매겨지는 기술적 지표가 아니라 진정한 의미의 "기술적" 지표와 정보들을 제공할 수 있도록 노력 중입니다.
누구나 찾아보기만 하면 얻을 수 있는 귀찮은 데이터만 있는 게 아니라
데이터 특성들을 관찰하고 연구하여 계산된 정보들
최신 딥러닝 논문들을 읽고 활용할 수 있는 좋은 알고리즘으로 학습된 AI를 활용한 자산 예측, 시계열 분류
또 원하시는 많은 정보들이 있으면 Youtube 댓글로 알려주시기 바랍니다.
많은 사람들에게 사랑받는, 정말 좋은 데이터가 나오게 된다면 유료화를 진행할 예정이고
아직 많은 것들을 보여주지 못했음에도 흥미와 관심을 주시며 구독해 주신 지금 구독자 여러분들께는
평생 무료로 이용할 수 있도록 이메일로 구독알림이 온 것들은 백업해두고 있습니다.
감사하다는 말씀 외 드릴 수 있는 소소한 보답이랄까요
위의 사이트는 내년에 꼭 출시할 수 있도록 노력하겠습니다.
응용
잠시 이야기가 흘러갔지만 이번 글의 핵심은 자산군들의 상관성입니다.
상관성이 낮은 자산들과 리밸런싱이 주는 수리적인 우위를 응용해 보는 게 저의 목표입니다.
위에서 "자산"이라는 것에 큰 조건이 필요합니다. 자산으로 인정되지 않은 것들은 배분하여 소유할 이유가 없습니다.
자산이라고 인정되었다는 건 경제사이클이 흐르면서 언젠가는 시장에 수요가 있어 상승하고
배제되어 하락할 수 있는 시장참여자들의 약속된 매개체라는 것입니다.
결국 언젠가는 의미 있게 쓰일 수 있기 때문에 분산하여 소유하는 것입니다.
트레이딩에 적용을 해보자면
여러 기술적 지표, 이동평균 매매 방법, 볼린저밴드, 앨리어트파동 등 여러 방법들이 다 의미 있는 구간이 있습니다.
결국 미시적인 관점에서 시장은 여러 가지 방법으로 풀이했을 때 유리한 알고리즘이 있고 그렇지 않은 알고리즘이 있습니다.
크게 나누자면 추세추종, 평균회귀라는 분야는 서로 다른 상반된 성향의 전략이지만
두 전략 모두 어느 시점에선 다수의 시장참여자들의 선택을 받게 됩니다.
이렇게 트레이딩 알고리즘 내에도 상관성이 존재합니다.
알고리즘이 가지는 특성, 알고리즘으로 거래했을 때의 수익률, 이를 벡터화하여 지금까지 했던 것에 응용하여
트레이딩 알고리즘들 간의 상관성을 살펴볼 수 있고
상관성이 낮은 알고리즘들을 만들고 채택하며 MDD를 통제할 수 있습니다.
이론은 완벽하지만 실제론 어려운 과정일 수 있습니다.
의미 있는 알고리즘들은 많지만 수집된 알고리즘들과 상관성이 낮은 알고리즘들을 찾기는 어렵습니다.
예를 들자면 자산배분을 위한 자산을 찾는데 주식처럼 좋은 가치를 주지만 주식과는 다른 것들을 수없이 찾아내야 하기 때문입니다.
계획
저는 시장에 통하는 여러 알고리즘, 그런 트레이딩 알고리즘대로 사고하는 AI를 형성하는 것을 목표로 하고 있습니다.
사실 시장은 계속 변화하기 때문에 위에서 언급한 목표는 어쩌면 자본주의 역사가 끝나는 날까지 이루어지지 못할 수 있습니다.
저라는 인간이 스스로가 데이터를 발굴하면서 찾아나가는 여정보다
데이터 자체에서 의미 있는 알고리즘을 갖는 AI들이 만들어지는 게 더 효과적이라고 생각하고
이를 위한 강화학습의 방법론, 모델들의 구조나 인프라의 구축 계획 등도 살펴봐야 합니다.
누군가 시킨 일이라면 정말 귀찮을 텐데 저는 기대가 되는 것 같습니다.
목표를 향한 과정의 산출물들이 의미 있게 여러분들에게 다가가면 좋겠습니다.
한 해가 거의 마무리되어가는데 연말 잘 보내시기 바라며 인사드리겠습니다.
감사합니다.
'Data & AI' 카테고리의 다른 글
트레이더들을 위한 시계열데이터 처리, Learning Representations for Time Series Clustering (1) | 2023.12.18 |
---|---|
11월 수익 공개, 시장 데이터 리뷰 (1) | 2023.12.01 |
Trading AI를 위한 feature 데이터 생성 (3) | 2023.11.04 |
딥러닝 트레이딩 - Timeseries Forecast (ICLR 2023 Timesnet) (3) | 2023.10.15 |
자산시장 추가매수 타이밍 (1) | 2023.09.24 |