본문 바로가기

주식시장별곡

통계의 함정, 부분을 전체로 보는 오류가 잠재되어있기에

통계의 함정, 부분을 전체로 보는 오류가 잠재되어있기에

오늘 오전 미국 대선 개표 현황이 실시간으로 CNN에서 보도되고 있습니다. 선거직전 설문조사에서는 힐러리 클린턴이 이길 것이라는 전망이 지배적이었습니다만, 최종 결과는 열어봐야지 알 것입니다. 종종 이런 설문조사 결과가 실제 결과와 차이가 발생되는 경우가 왕왕 발생됩니다. 그러한 이유를 곰곰히 생각 해 보면 소수의 조사 표본을 전체로 확대 해석하기 때문인데, 주식시장/파생/금융시장 트레이딩에서도 자주 나타나곤 합니다.



ㅇ 한정된 표본은 전체를 반영하지 못할 수 있다.


설문조사나 통계조사를 할 때 나름대로 의미있는 수치를 얻기 위하여 다양한 사람들에게 설문조사하려 하지요. 현실적인 여건상 수천명 정도를 조사하게 되고 이를 전체 결과인 것처럼 반영하곤 합니다.
그런데 이런 소수의 표본 조사는 잠재적인 오류를 내포하고 있습니다.
예를들어 얼마전까지만 하여도 여론 조사시, "집전화번호"에 전화를 하여 설문조사를 하곤 하였습니다. 문제는 집전화를 사용하는 표본의 경우 고령층, 주부라는 한정된 샘플일 가능성이 높은데 이를 전체로 확대 해석하는 것은 문제가 있었던 것이지요.
핸드폰으로 전화 설문조사를 한다하더라도 젊은 층은 "스팸"필터로 처리하여 버리니 자연스럽게 샘플 자체가 전국민을 반영할 수 없게 되지요.

예를들어 지난 4.13총선 때 설문조사 기간 중에는 여당의 압승 가능성이 점쳐졌습니다만, 실제 투표를 하고난 뒤의 결과는 여소야대 정국으로 귀결되었던 것도 하나의 사례일 것입니다.

마치 장님 코끼리 말하듯, 부분을 전체로 확대해석하는 오류에 빠지게 되는 것입니다.


ㅇ 트레이딩의 세계 : 몇번의 매매를 숨겨든 비술로 인식하는 투자자

소위 경제TV전문가라고 하는 이들 중에는 한두번의 매매 케이스를 바탕으로 자신만의 투자 비법이라고 말하는 이들이 있습니다. 이를 묘사하면서 꽃이 터졌다느니, 물고기가 날라간다는 등의 표현을 쓰기도 하더군요.
이런 케이스는 위의 설문조사 케이스보다도 더 극단적인 일반화의 오류에 빠지게 됩니다.

한두번의 케이스를 전체로 해석하니 회차를 거듭할 수록 당연히 틀린 경우가 점점 늘어나게 되지요. 전문가란 자신이 생각 해도 너무 맞지 않는다 생각되면 "예외적케이스"라면서 덕지덕지 필터를 추가하기 시작합니다. 그런데 이런 필터들도 충분한 샘플로 분석한 것이 아니다보니 당연히 또 다른 예외의 케이스가 늘어나게 되고 그저 말로만 설(說)푸는 묘사일 뿐 트레이딩 기준으로는 아무런 효용가치가 없게 되지요.

그런데 이는 일반투자자 또한 경험하는 일들입니다.
우리 한국증시에서는 이상하게도 주식투자 첫 걸음을 "기술적지표/차트"로 시작하는 경우가 거의 대부분입니다. 나름대로 종목 1개에 유명하다는 기술적지표를 넣어보고 매수,매도 신호를 눈으로 맞춰봅니다.

오~~~ 왠지 착착들어 맞는 느낌. 하지만 이는 자신이 보고 싶어하는 부분만 보기 때문에 나타나는 현상입니다. 다른 영역에서는 하나도 맞지 않는 지표인데도 말이죠.


이렇게 극소수의 매매 샘플을 숨겨진 투자 비기라고 생각한다면, 그 매매 방법은 결국 투자자를 "패배"라는 굴레에 몰아넣고 맙니다.


[부분을 전체로 보는 오류는 투자를 망치게 한다. 사진 : pixabay]




ㅇ 통계적인 분석을 의미있게 하였다 하여도 : 블랙스완을 인정해야.


그래도 요즘은 시스템트레이딩 툴이 모든 증권사 HTS에 기본 장착되어있기도 하고, 엑셀VBA, 파이썬 등 다양한 프로그램 랭귀지가 보급되다보니 트레이딩을 체계적으로 연구하는 분들이 크게 늘었습니다.
이런 체계적 분석은 분명 의미있는 통계치를 뽑아내어 장기적인 성과를 의미있게 만들어 갈 수 있습니다.

아무리 논리적이고 통계적으로 잘 만들어진 로직이라 하더라도 이 통계치 또한 미래의 결과까지 모두 반영한 매매 통계가 아니다보니, 예상치 못한 상황이 발생할 수 있습니다.
이를 "블랙스완"이라 설명되어지곤 합니다.

그런데, 자신이 연구한 통계적 분석이 완벽하다고 자신한 나머지 레버리지를 한계치까지 사용하는 경우가 왕왕 있습니다. 퀀터,시스템트레이더들 중에는 리스크를 얼마만큼 노출시켜야할지에 대하여 분석할 때 켈리의 법칙을 사용하곤 합니다.

Kelly's Law = 승률 - (1-승률)/(평균손익비율)


예를들어 매매 통계 분석에서 승률 60%, 평균수익과 평균 손실비율이 2배라 한다면 켈리의 법칙은 40%라는 수치가 나옵니다. 즉, 최대 40%손실을 노출하여도 괜찮다는 의미로 해석해 볼 수 있습니다.

하지만, 오랜 기간 매매를 해온 경험자 입장에서는 이보다 절반수준 이하의 값으로 접근하는 것이 옳다고 생각합니다. 미래 통계치까지 현재 매매 통계에 반영된 것은 아니기 때문이지요.

다른 말로, 블랙스완은 언제 든지 발생할 수 있기 때문입니다.



ㅇ 최대한 샘플을 늘려, 대수의 법칙 의미를 키워야.


매매 분석하는데 있어서 샘플케이스를 늘리는 것은 매우 큰 의미가 있습니다. 빠트렸을 수 있는 통계치를 조금이라도 더 반영할 수 있기 때문이지요. 샘플이 늘어나면 늘어날 수록 조금이라도 더 전체통계에 근접하는 대수의 법칙을 완성 해 갈 수 있습니다.


그래서, 매매 분석을 하시는데 있어서 단편적으로 한국증시에서만 분석할 것이 아니라 해외 다른 국가들에서 자신이 만든 매매로직이 어떤 퍼포먼스를 보였는지 살펴보는 것도 샘플을 늘리는데 큰 도움이 됩니다.

대표적으로 가치투자 중 스타일 방식 매매전략들(PER,PBR,PCR 등등등)은 다양한 국가에서 그리고 오랜 기간에 걸쳐 연구된 자료들이 많이 있습니다. 그러다보니 장기적으로 의미있는 성과를 만들 가능성이 높아지게 됩니다.


이 처럼 다양한 시장 그리고 긴 시간 프레임에서 자신의 매매 방법을 분석하십시요.

이를 실천하신다면 조금이라도 더 안정적인 투자, 트레이딩을 만들어 가실 수 있을 것입니다.


2016년 11월 9일 수요일

lovefund이성수(KCIIA, 국제투자분석사,한국증권분석사회 정회원)