포커에서 위험 - 보상의 개념

혁입니다요 2 9311 0 0 2024.04.19 23:40

이 글에서 배우게 될 내용

포커의 의사결정에서 위험-보상이 하는 역할
뱅크롤 관리를 하는 이유
자신에게 가장 잘 어울리는 포커 스타일을 찾는 방법

이 글에서는 많은 포커 플레이어가 (이미 무의식적으로) 사용하고 있는 개념인 위험-보상에 대해 알아보자. 이것은 단순하지만 매우 강력한 도구다. 이 개념은 성공적인 포커 전략에 대한 기본적인 아이디어를 제공해준다.

위험-보상은 다음과 같은 것을 이해할 수 있게 도와준다.

뱅크롤 관리의 필요성
다양한 플레이 스타일의 장단점
EV와 변동성(variance: 배리언스)의 상관관계

위험-보상은 한 가지 기본적인 아이디어에서 시작한다. 포커 플레이어는 +EV인 상황을 찾고 변동성을 피하고 싶어한다. 포커 플레이어의 잠재적인 수익을 계산하는 식은 다음과 같다.

수익 = EV – a * 변동성

a라는 변수는 변동성이 플레이에 미치는 영향을 뜻한다. 변동성이 클수록 a가 커지게 된다. a의 크기는 자신의 심리적인 강인함과 뱅크롤 관리 같은 여러가지 변수에 따라 달라진다.

이 식의 해석은 간단하다. EV가 늘어나면 자신의 수익이 증가하고, 변동성이 증가하면 자신의 수익이 감소한다. 두 가지 경우를 위험-보상이라는 관점에서 살펴보자.

첫 번째 경우: 뱅크롤 관리

자신의 뱅크롤이 $1,000이라고 가정해보자. 자신은 A 포켓으로 올인을 할 수 있다. 이 경우 상대의 스택이 자신과 같고 그의 핸드가 K 포켓이라면 자신의 승률은 80% 정도다. 이 경우 분명 투자할만한 가치가 있다.

팟사이즈에 승률을 곱하면 EV를 계산할 수 있다.

이 경우 EV는 $1,600(=$2,000 x 80%)이 된다.

변동성을 계산하는 것은 좀더 복잡하다. 변동성은 EV와 개별적 결과 사이의 차이이다. 개별적 결과와 EV의 차이가 클수록 변동성은 높아진다.

계산은 다음과 같다.

알다시피 EV는 1,600$이다.
A 원 페어로 이길 경우 자신의 수익은 $2000이다. A 원 페어로 질 경우의 수익은 0이다.
이길 경우 EV와의 차이는 +$400이다. 질 경우의 차이는 -$1,600이다.
오차를 제곱해서 양수를 만들자. 이길 경우는 $400 x $400 = $160,000$²이고, 질 경우는 (-$1,600) x (– $1,600) = +2,560,000$²이다.
변동성을 구하기 위해 제곱에 각각의 사건이 일어날 확률을 곱하자. 첫 번째 사건이 일어날 확률은 80%고 두 번째 사건이 일어날 확률은 20%다.
첫 번째 경우는 80% x 160,000$²= 128,000$²이고 두 번째 경우는 20% x 2,560,000$² = 512,000$²이다.
두 수를 더하면 변동성이 나온다. 변동성은 128,000$² + 512,000$² = 640,000$²이다.

전체 계산 과정을 한 문장으로 표현하면 다음과 같다.

80% ($2,000-$1,600)² + 20% ($0-$1,600)² = 640,000$²

계산 결과 변동성이 매우 크게 나왔다. 이렇게 큰 값이 나오는 이유는 다음과 같다.

변동성은 금액의 합계가 아니다. 변동성이 커질수록 개별적인 사건의 결과와 EV 사이의 격차가 벌어진다.
변동성은 격차의 제곱이다. 변동성으로부터 실제 금액을 계산하려면 표준편차를 구해야 한다.
표준편차는 변동성의 제곱근이다.
이 경우 변동성(640,000$²)의 제곱근은 $800이고 이것이 표준편차다.
표준편차는 자신의 플레이 결과가 EV와 얼마나 달라질지 알려준다. 이 경우의 변동성은 $800이다.

이제 A 원 페어로 K 원 페어를 상대하는 일이 200번 생기고 여기에 자신의 뱅크롤 $1,000을 사용한다고 가정해보자. 자신은 매번 $50을 투자하게 된다.

EV는 여전히 $100 x 80% x 20번 = $1,600이다.

변동성은 어떻게 달라질까? 이 경우 변동성은 다음과 같이 구할 수 있다.

올인을 하는 경우의 EV($80)를 구한다.
자신이 이기는 경우와 지는 경우, EV와 각각의 결과 사이의 오차를 제곱한다.
제곱한 값에 각각이 사건이 일어날 확률을 곱한다.
두 값을 더해서 변동성을 구한다. 이 경우 변동성은 1,600$²이다.
올인을 20번 했으므로 변동성에 20을 곱해준다. 결과적으로 변동성은 32,000$²이 된다. 32,000$²의 제곱근인 표준편차는 대략 $179가 된다.

전체 계산 과정을 한 줄로 표시하면 다음과 같다.

20 x [80% x ($100$-$80)² + 20% x ($0-$80)²] = 32,000$²

이제 두 가지 경우를 비교해보자.

숫자를 보면 알 수 있듯이 같은 플레이를 20번 반복하면 변동성이 낮아진다. 여러 번 같은 플레이를 할 수록 수익의 변동성이 낮아진다. 이렇게 해서 변동성을 낮추는 것을 다양화라고 한다.

위험-수익의 관점에서 보면 다양화를 하는 것이 하지 않는 것보다 확실히 좋다. 다양화를 하면 EV를 낮추지 않고 변동성을 감소시킬 수 있다. 따라서 뱅크롤 관리를 제대로 하면 수익을 증가시킬 수 있다.

지금까지 위험-수익이라는 개념을 통해 뱅크롤 관리의 이론적인 근거를 알아보았다.

두 번째 경우: 다양한 플레이 스타일

적당한 샘플을 골라서 EV와 변동성에 대해 알아보자. 대부분의 경우 EV를 증가시키기 위해서는 변동성을 증가시켜야 한다. 큰 수익을 내려면 더 큰 위험을 짊어져야 한다. 이것은 주식시장이건 포커 테이블이건 마찬가지다.

세 가지 유형의 포커 플레이어를 비교해 보자. 먼저 가장 상대하기 쉬운 플레이어인 피쉬를 살펴보고, TAG를 살펴본 후 마지막으로 LAG를 살펴보자.

피쉬

피쉬는 대부분의 경우 재미를 위해 감정적인 플레이를 한다. 그는 EV 극대화는 생각도 안 한다. 터무니없는 올인이나 미친 것 같은 콜다운이 피쉬의 전형적인 플레이다. 따라서 장기적으로 피쉬는 손해를 보며, 그의 변동성은 높다.

위험-보상 개념에 따르면 -EV와 높은 변동성은 최악의 조합이다.

TAG

TAG는 타이트한 승리자다. 그는 강한 핸드로 수익을 극대화하고 위험한 상황을 피한다. 그는 확실하지 않은 승부를 피한다. 따라서 그의 EV는 +고 변동성은 낮다.

+EV와 낮은 변동성을 조합하면 장기적으로 수익이 발생한다.

LAG

LAG는 EV가 +기만 하면 플레이를 한다. 따라서 그의 EV는 최대가 된다. 그러나 이런 플레이 스타일 때문에 LAG는 어려운 상황에 많이 처하게 된다. 따라서 변동성이 높아진다.

매우 높은 +EV와 높은 변동성을 조합해도 장기적으로 수익이 발생한다.

세 가지 플레이 스타일에 대한 다음 그래프를 보자. X축은 EV, Y축은 변동성을 뜻한다. 두 가지 변수의 조합에 따라 각각의 플레이 스타일이 결정된다.

피쉬의 EV는 -1이고 변동성은 3이다.
TAG의 EV는 1.5고 변동성은 1이다.
LAG의 EV는 2.5고 변동성은 3이다.

(그래프 사진 짤림. 그냥 설명만 보셈)

이제 그래프를 통해 서로 다른 플레이 스타일을 위험-보상의 관점에서 비교할 수 있다. 피쉬가 LAG와 TAG, 양쪽 모두보다 안 좋은 이유는 다음과 같다.

TAG는 피쉬보다 변동성이 낮고 EV가 높다.
LAG는 피쉬와 변동성이 같지만 EV가 더 높다.

LAG와 TAG 모두 피쉬보다 더 많은 수익을 내기 때문에 분명 피쉬는 최악의 플레이 스타일이다. 피쉬는 -EV 플레이를 하기 때문에 장기적으로 수익을 내지 못한다. 게다가 변동성도 높다.

LAG와 TAG 모두가 피쉬보다 낫다는 것은 분명하다. 그렇다면 TAG와 LAG를 비교하면 어떨까?

TAG는 LAG보다 변동성이 낮지만 EV도 더 작다.
LAG는 TAG보다 EV가 높지만 높은 변동성을 견뎌내야 한다.

두 가지 플레이 스타일 모두 나름대로의 장점과 단점을 갖고 있다. 그렇다면 장기적인 수익은 어떻게 될까?

위험-보상의 식에 변동성과 EV를 대입해서 LAG와 TAG 모두에 대해 계산을 해보자. 변수 a는 0.5라고 가정하자.
TAG의 EV는 1.5, 변동성은 1이다. 수익은 EV – a * 변동성이므로 TAG의 경우 1.5 – 0.5*1 = 1이다.
LAG의 EV는 2.5, 변동성은 3이다. 수익은 2.5 – 3*0.5 = 1이다.

계산 결과 TAG와 LAG 모두 수익이 1로 같다. 이것만 보면 어떤 스타일이 더 많은 수익을 내는지 알 수 없는 것 같다.

계산을 하면서 두 가지 스타일 모두의 a가 0.5라고 가정했다. 변동성이 자신의 수익에 어느 정도의 영향을 미치는지 a라는 변수가 알려준다. 0.5의 a는 평균적인 변동성과 위험을 뜻한다.

어떤 플레이어가 변동성을 싫어한다면 그의 a는 높아진다. 예를 들어 a가 0.75라면 분명 TAG가 답이다. 그가 TAG 플레이를 할 때의 수익은 1.5 – 0.75*1 = 0.75가 된다. 그러나 그가 LAG 플레이를 하면 수익은 2.5 – 0.75*3 = 0.25가 될 것이다.

반대로 어떤 플레이어가 변동성을 잘 관리할 수 있다면 그의 a는 낮아진다. a가 0.25라면 LAG가 답이다. 그가 LAG 플레이를 하면 수익은 2.5 – 0.25*3 = 1.75다. 그러나 TAG 플레이를 하면 수익은 1.5 – 0.25*1 = 1.25가 된다.

a가 큰 플레이어는 TAG로 더 나은 플레이를 한다. a가 작은 플레이어는 LAG로 플레이해야 수익을 극대화할 수 있다.

이 글이 LAG 플레이를 권장하는 글이라고 생각해서는 안 된다. 이 글에서 얘기하지 않았는데 LAG는 TAG보다 훨씬 더 플레이하기 어렵다. 핸드 리딩같은 다양한 분야에서 더 많은 것을 알고 있어야 LAG플레이를 할 수 있다.

Dan Harrington은 그의 저서 "Harrington on Cashgames“에서 흥미 있는 이론을 풀어놓고 있다. 그는 LAG와 TAG가 암묵적인 동의를 하고 있다고 생각한다. TAG는 변동성을 낮추기 위해 LAG가 더 많은 EV를 차지하는 것을 인정한다. LAG의 더 높은 EV는 더 높은 변동성을 짊어지는 것에 따른 대가이다. 물론 어느 플레이 스타일을 사용할 것인지 선택해야 하는 것은 자신이다.

경험에 따르면 a가 정확히 얼마인지 계산하는 것은 불가능하다. 그러나 굳이 계산을 하지 않아도 자신이 자신에 대해 가장 잘 알고 있을 것이다. 자신이 변동성을 얼마나 잘 관리할 수 있는지 솔직하게 생각해보자. 자신은 동전던지기 승부에서 두 번 연속으로 지면 틸트되는 스타일인가? 아니면 배드 비트를 당해도 흥분하지 않는 스타일인가? 이 양 극단의 중간에 위치하는 스타일일까? 어쨌든 위험-보상이라는 개념이 자신에게 어울리는 플레이 스타일을 발견할 수 있게 도와줄 것이다.

결론

위험-보상이라는 개념은 EV와 변동성을 분석할 수 있는 도구이다.

돈을 투자하려면 기본적인 문제를 해결해야 한다. 주식 트레이딩을 하건 사업을 하건 포커 플레이를 하건 마찬가지다. 장기적으로 볼 때 EV를 높이려면 더 높은 변동성을 짊어져야 한다. 변동성을 처리할 수 있는 능력에 따라 돈을 투자할 때 짊어질 수 있는 리스크의 양이 달라진다.

TAG 스타일의 주식 트레이더는 정부 채권과 안전한 주식에 투자할 것이다. 반대로 LAG 스타일의 트레이더는 파생상품과 위험한 주식에 투자할 것이다. 구체적인 수많은 예가 존재한다.

변동성과 EV의 관계를 이해하고, 균형을 맞추는 것이 중요하다. 위험-보상이라는 개념이 그것을 도와줄 것이다. 위험-보상의 개념을 사용하면 수많은 고전적인 논의를 더 분석적인 관점에서, 새롭게 살펴볼 수 있다. 대표적인 질문은 다음과 같다.

왜 뱅크롤 관리를 해야 하는가? 어느 정도까지 뱅크롤 관리를 해야 하는가?
TAG와 LAG중 더 뛰어난 스타일은 무엇인가?

그 밖의 다양한 분야에 위험-보상을 사용할 수 있다. 핸드 분석에도 위험-보상을 사용할 수 있다. 웨이 어헤드 / 웨이 비하인드나 콤보 드로우같은 변동성이 높은 상황을 새로운 관점에서 분석할 수 있다. 변동성을 잘 처리할 수 없는데 겨우 +EV가 되는 상황에서 플레이를 한다면 손실을 볼 수 있다.

실제의 생활에서 플레이를 이론적으로 분석할 때도 위험-보상 개념을 사용할 수 있다. 하루가 끝났을 때 EV와 그날의 수익만이 중요한 것은 아니다. 변동성과 자신이 변동성을 어떻게 관리했는지 역시 중요하다. 모든 변수를 고려할 때만 자신에게 가장 알맞은 게임을 발견할 수 있다. 여기서 위험=보상이라는 개념이 도움이 된다.

0
0