본문 바로가기
systrader79 칼럼/투자의 기초

퀀트 투자에서 확률의 올바른 해석 (116)

by systrader79 2022. 10. 18.
반응형

위 기사는 오늘 한국 경제 신문에서 보도한 미국의 경기 침체 확률에 대한 기사입니다. 블룸버그의 통신에 의한 모델 추정치를 근거로 1년내 미국 경기가 침체할 확률이 100%라는 내용입니다.

 

이 기사 뿐만 아니라, 우리는 투자할 때 확률적인 수치를 아주 많이 접합니다. 확률을 추정할 수 없을 때야 어쩔 수 없지만, 근거 있는 확률 추정치가 있는 경우 당연히 이에 기반을 두고 확률적 우위에 있는 방향으로 투자하여 조금이라도 나은 투자 수익을 창출하려고 하지요. 특히, 모든 투자의 실행을 수치와 확률에 기반을 둔 퀀트 전략은 더더욱 중요하다고 할 수 있는데요, 이번 포스팅에서는 퀀트 투자에서 백테스팅 수치와 확률을 어떻게 올바르게 해석해야 하는지에 대해 다뤄보겠습니다.

 

 

빌와이즈 - 23분간 실제로 다녀온 지옥

빌 와이즈는 크리스천이고 10년 넘게 척 스미스 목사님의 교회에 있었습니다. 어느 날 주님께서는 그에게 실제 지옥을 보여주셨고 30분동안 지옥체험을 한 빌은 주님으로부터 자신이 보았던 지

gospel79.tistory.com

금융 시장의 확률? 반만 믿어라!

정확한 통계 수치와 확률을 전적으로 신뢰하지 말고 반만 믿어라? 이건 또 무슨 자다가 남의 다리 긁던 귀신이 봉창두드리며 쿠팡 퀵배송으로 주문한 씨나락 까먹는 소리입니까? 확률이 높으면 신뢰도 또한 확률에 비례하는 것일텐데 저는 왜 반만 믿으라고 얘기하는 것일까요?

그 이유는, 금융 시장이나 투자에 있어서의 백테스트 수치와 확률은 매우 불확실하기 때문입니다. 위 기사를 예로 들자면, 블룸버그 통신에서 엄청나게 똑똑한 금융공학 박사님들이 만든 자체 개발 모델의 경기 침체 확률이 100% 라고 하더라도, 실제로 우리가 체감하는 확률은 100%가 아니라는 말입니다.

 

금융 시장이나 투자에 있어서의 확률이 실제 현실에서의 체감하는 확률과 괴리가 큰 이유는 크게 두가지가 있습니다.
첫 번째 이유는, 금융 시장에서의 확률은 수학적 확률이 아닌 추정 확률이기 때문에, 매우 큰 불확실성을 내포하고 있기 때문입니다. 수학적 확률은 수학적으로 완전 무오한 이상적인 확률입니다. 예를 들자면, 이런 것이죠.

밀폐된 상자 안에 검은 공과 흰 공이 각각 1개씩 들어 있다. 상자에 손을 넣어 공을 하나 꺼냈더니 검은 공이었다. 만일 손을 다시 넣어 공을 꺼냈을 때 흰 공이 나올 확률은?

이런 경우 흰 공이 나올 확률은 100%가 됩니다. 기적이 발생하지 않는 한, 논리적으로 이런 확률은 완전무오하며, 현실에서 실제로 발생하는 확률을 한 치의 오차도 없이 정확하게 대변합니다.

 

우리가 현실 세계에서 이용하는 확률은 이와 같이 완전 무오한 예측력을 가지는 '수학적 확률' 인 경우도 있지만, 대부분의 경우, 이런 완전 무오한 수학적 확률이 아닌 불완전한 '경험적 확률' 이나 과거 데이터를 통한 추정 확률입니다. 그렇기 때문에, 이런 확률은 자체적으로 불완전성을 내포하고 있습니다.

 

두 번째 이유는, 금융 시장이나 퀀트 백테스트를 통해 얻은 확률은 과거 데이터를 통해 추정한 것인데, 금융 시장에서의 과거의 확률 분포는 절대 미래의 확률 분포와 같다는 보장이 전혀 없기 때문입니다. 우리가 일반적으로 '확률'의 이점을 가장 잘 이용할 수 있는 분야는 '수학적 확률' 로 추정할 수 있거나, 실험한 영역의 데이터가 실제 현실의 데이터의 확률 분포와 크게 다르지 않을 가능성이 높은 '자연 과학' 분야입니다. 하지만, 금융 시장은 그야말로 전세계의 온간 인간 군상들의 욕망이 점철된 혼돈의 카오스와 같기 때문에 절대로 백테스트한 과거의 확률 분포가 미래에 그대로 들어맞는 다는 논리적인 보장이 전혀 없습니다.

 

확률, 수치, 논리를 깨나 좋아한다는 '이성적 지성인'을 자처하는 사람들이 수치와 통계 너무 좋아하다가 시장에서 박살나는 이유는 사실은 그들이 똑똑해서가 아닙니다. 수학과 확률을 좋아한다고 똑똑하다고 착각하면 경기도 오산입니다. 왜냐면, 이들은 완전 무오한 수학적 확률과 결함 투성이인 경험적 확률을 구분하지 못하는 심각한 오류를 저지르고 있기 때문입니다.

 

 

대한민국 축구계의 전설 이영표 선수의 놀라운 이야기

대한민국 최고의 축구 선수 이영표 선수는 대한민국의 前 국가대표 축구선수, 前 KBS 축구 해설위원으로 박지성 선수와 함께 대한민국 축구 국가대표팀의 한 시대를 주름잡았던 레전드 선수입니

gospel79.tistory.com

확률, 무시할 것인가 받아들일 것인가?

문제는 여기에서 끝나지 않습니다. 심각한 문제가 또 하나 있는데, 설령 백테스트나 과거의 데이터로 추정한 확률 분포가 미래에도 정확하게 똑같이 적용된다고 낙관적으로 가정하더라도, 실제로 체감할 때는 완전히 틀린 것처럼 느껴지는 경우도 부지기수라는 것이지요.

 

예를 들어보겠습니다. 백테스트를 통해 A라는 투자 전략의 성과를 검증했더니 승률이 70%로 나왔다고 칩시다. 여러분은 승률이 70%라고 하면 어떤 생각이 드십니까?

10번 중에 7번 정도 수익이 나면 실제로 투자하면 거의 대부분 수익이 나는 것처럼 느껴지겠네

라고 생각하시겠지요? 물론, 장기적으로는 그게 맞지만, 실전 매매에서는 전혀 다르게 느껴질 수도 있습니다. 예를 들면, 여러분이 기대한 것은

승-승-패-승-승-패-승-승-승-패

와 같이 적절한 비율로 승과 패가 7:3으로 나오는 상황을 생각하시겠지만, 현실은 냉혹합니다. 승률은 똑같이 70%라도, 처음 10번 매매했을 때

패-패-패-패-패-패-승-패-승-패

와 같이 승과 패가 오히려 2:8로 나올 수도 있다는 것이지요. 혹시나 여러분이 이게 확률적으로 잘못되었다고 생각하신다면 절대 퀀트를 하시면 안되고, 수학을 다시 공부하셔야 합니다.

 

확률이라는 것은, '아주 많은 경우'의 수를 '평균적'으로 분석하여 낸 수치입니다. 그런데, 우리는 무의식적으로 확률이라는 수치를, 지금 내가 매매하는 한 번의 매매에 적용될 것이라고 착각을 합니다. 즉, 승률이 70%라고 하면, 수익을 낼 가능성이 손실 가능성보다 월등히 높기 때문에, 이번 매매에서는 수익이 나는 것이 수학적으로 당연하다고 생각할 수 있지만, 완전히 틀렸다고 보기도 힘들지만, 맞다고 보기도 어렵습니다. 그 이유는 확률적 수치는, 거듭 강조하지만, 일회성 사건의 결과에 적용되는 것이 아니기 때문입니다.

 

그리고, 금융 시계열에서의 수치는 연속적이고 추세적으로 나타나는 경우도 많습니다. 승률이 70%인 경우, 우리는 일반적으로 10번 매매할 때 3번 정도 손실을 보는 현상이 규칙적으로 반복될 것이라고 생각하지만, 금융시장에서는 전혀 그렇지 않은 경우도 많이 발생합니다. 예를 들자면, 20번 연속으로 수익을 보다가 6번 연속으로 손실을 보는 경우와 같이 나타나는 경우도 아주 흔하다는 것이지요.

 

금융 시장의 데이터들은 추세적인 경우가 많기 때문에, 균질하게 확률이 섞인 경우보다 연속적으로 떨어져 분포하는 경우가 훨씬 더 많습니다. 20번 연속으로 수익이 나다보면, 이 전략의 승률은 70%가 아니라 100%라고 생각할 수도 있고, 6번 연속으로 손실을 보는 구간에 진입하면, 승률이 70%라는 확률이 거짓인 것처럼 느껴질 수도 있겠습니다만, 이런 생각 자체가 논리적 오류라는 것이지요.

 

이런 세부적인 내용은 무의식적으로 간과하기 쉬운데, 이걸 간과하면 안 그래도 안맞는 백테스트 수치나 확률이 더욱 더 안 맞게 느껴지는 것이지요.

금융 시장의 확률 데이터 어떻게 해석할 것인가?

이런 내용을 잘 모르는 사람들은, '체감적인 확률'이 계산된 확률과 조금이라도 다르게 느껴질 경우, 실제로는 전혀 과최적화되어 있지 않은 경우 조차 '과최적화' 라는 말을 너무 쉽게 하면서 확률을 무시하는 오류를 범하거나, 반대로 과거 데이터로 추정한 수치나 데이터를 극단적으로 맹신해서, 이번 한 번의 매매에 절대적인 예측력을 가질 것이라고 목매달게 됩니다.

둘 다 틀린 접근 방법입니다. 사실 과거의 데이터로 추정한 수치가 미래에도 오류 없이 적용될 수 있는지 예측할 수 있는 방법은 존재하지 않습니다. 그건 결국 시간이 지나봐야만 결과론적으로 알 수 있기 때문입니다.

 

그렇다면, 과거의 데이터로 추정한 퀀트 수치와 확률은 무의미한 것일까요? 그렇지 않습니다. 비록 불완전하긴 해도 그것이 미래의 확률 분포와 전혀 무관하지는 않기 때문입니다. 비록 불완전하고, 미래에 틀릴지라도, 우리가 현실적으로 기댈 수 있는 근거는 과거의 데이터에 기반한 수치와 확률 외에는 없기 때문입니다.

 

그렇기 때문에, 우리는 일차적으로 과거 데이터를 통해 추정한 확률과 수치에 기반을 두고 투자하는 것은 일차적으로 아무 개념 없이 뇌동으로 매매하는 것보다는 훨씬 합리적이고, 이성적인 우월한 투자 방법이라고 할 수 있을 것입니다. 다만, 그 수치와 확률에 의해 나타나는 현상은, 지금 당장 나타날 단회적인 케이스에 적용해서 평가하려는 간과하기 쉬운 무의식적인 과오를 범해서는 안될 것입니다. 이것이 바로 험난한 투자 시장에서 올바로 확률을 적용하는 방법입니다.

그래서, 내년에 경기 침체가 온다는 거요 안온다는 거요?

이런 질문을 아직도 하고 있다면, 제 글을 다시 읽어보시기 바랍니다. 블룸버그 추정 모델에서는, 이러이러한 조건을 갖췄을 때 다음 해에 경기 침체가 올 확률이 100%라고 얘기하고 있지요? 일단 여기서 100% 라는 것도 무오한 수치가 아니라는 것을 깨달아야 하고, 꽤 높은 수치로 경기 침체가 올 확률이 있다고 하더라도, 당장 내년의 경기라는 단회적인 사건에 국한해서 확률을 적용하는 것은 무리가 있다는 의미입니다.

 

주식 시장에서 11월 ~ 4월에 주식이 오르는 확률이 높다고 알려져 있지요? 예를 들어, 20년 간의 데이터를 놓고 분석했을 때 11~4월에 오르는 확률이 70% 라고 한다면, 당장 내년 4월까지 주식이 오를지 내릴지는 아무도 모릅니다. 물론 기대값이 더 높으니 기대를 해볼 수는 있겠지만, 내년 뿐만 아니라 후년에도 떨어진다고 해도 11~4의 알파가 없어졌다고 섣불리 얘기해서는 안된다는 의미입니다. 간혹 투자 커뮤니티에서 이런 확률적인 사고를 제대로 이해하지 못하고, 지금 내가 투자하는 시계열에서 당장 확률과 다른 방향으로 사건이 진행되면 '거짓말이네' 라는 어이 없는 논리를 펴는 분들이 상당히 많습니다.

 

금융 시장에서 확률이라는 추정치는 일단 본질적으로 불완전성을 내포하고 있고, 그 확률을 평가할 때도 단회적이거나 몇 건이 되지도 않는 사건에 적용하여 함부로 평가하는 무식한 실수를 저질러서는 안되겠습니다. 이런 기초적인 지식을 갖추고 있지 않는다면, 말로는 퀀트를 한다고 하지만, 사실상 뇌동 매매를 하는 것과 다름이 없기 때문입니다.

 

너무나도 중요한 소식 블로그 (클릭)
너무나도 중요한 소식 ebook (클릭)

 

너무나도 중요한 소식

 

gospel79.netlify.app

 


1. 네이버 카페 '실전주식투자연구소' 로 오시면, 본 블로그의 모든 내용을 카테고리별로 정렬하여 순서대로 확인하실 수 있고, 다양한 실전 투자 정보도 얻을 수 있습니다~

 

2. 자타가 공인하는 주식 단기 시스템 트레이딩의 최고 전략가, '닥터 퀀트의 단기 트레이딩 강좌'가 뉴지스탁에서 진행중입니다. 닥터 퀀트의 강좌에서는 그동안 공개하지 않았던 무려 50개 이상의 실전 트레이딩 전략과 주기적인 업데이트 강의가 제공됩니다~

 

3. 'systrader79의 단기 시스템 트레이딩 강의' 와  '팩터 백과 사전 강의' 가 뉴지스탁에서 진행중입니다~   주식 단기 트레이딩과 자산 배분 전략에 관심이 있으신 분들의 많은 성원 부탁드립니다

4. 여러분의 인생이 걸린 너무나도 중요한 소식 ----> 여기를 클릭하세요!

 

 

반응형

댓글1