팃 포 탯(Tit for Tat), 가장 단순한 협력 전략의 진화

팃 포 탯(Tit for Tat) 전략은 게임 이론(Game Theory)에서 아주 유명한 전략 중 하나다. 주로 반복 게임과 같은 상황에서 등장하며, 협력과 보복의 균형을 잘 보여주는 대표적인 전략이다.

1. 팃 포 탯 전략의 본질

팃 포 탯은 기본적으로 상호주의(reciprocity)의 원리에 기반한다. 처음에는 무조건 협력으로 시작해 상대에게 우호적인 신호를 보내고, 이후에는 상대방의 행동을 정확히 반영해 대응한다. 만약 상대가 협력하면 계속 협력하고, 배신하면 다음 라운드에서 단호하게 보복한다. 하지만 상대가 다시 협력으로 돌아온다면, 용서하고 다시 협력 모드로 돌아온다.

이 전략은 인간 관계, 국제 정치, 경제 활동 등 반복적으로 만나는 환경에서 매우 유효하다. 단호하지만 앙심을 품지 않고, 협력할 기회를 항상 열어둔다는 점에서 신뢰를 기반으로 한 관계 구축에 적합하다.

2. 수학적 실험과 이론적 배경

1980년대 로버트 액설로드(Robert Axelrod)의 반복 게임 컴퓨터 토너먼트는 팃 포 탯 전략이 유명해진 계기가 됐다. 그는 다양한 전략을 컴퓨터에 프로그래밍한 후, 서로 반복 게임(죄수의 딜레마)을 하도록 했다. 공격적인 전략, 계산적인 전략, 완전 협력 전략 등 여러 가지 전략이 참가했지만, 가장 높은 평균 점수를 얻은 전략이 팃 포 탯이었다.

이 실험은 단지 수학적 모형을 넘어, 협력과 신뢰가 경쟁을 넘어설 수 있음을 보여준 상징적 사건으로 평가받는다. 팃 포 탯은 공격적이지 않고, 상대의 선의에 반응하며, 악의에는 보복하지만, 그것을 오래 끌지 않고 다시 협력할 수 있는 기회를 주는 전략이다. 이러한 신호의 명확함과 반복 가능한 예측 가능성이 핵심이다.

3. 적용 사례

3.1. 제1차 세계 대전의 참호전

팃 포 탯 전략의 가장 유명한 실전 사례는 제1차 세계대전 당시의 서부 전선 참호전이다. 독일군과 영국군은 서로 마주 보고 참호를 파고 장기 대치를 벌였는데, 어느 순간부터 양측이 암묵적으로 협력하는 행동 패턴이 관찰된다. 예를 들어: 1) 한쪽에서 식사하는 시간에는 공격하지 않고, 2) 상대한테 사소한 경고 사격(위로 쏘기)을 하여 본격적인 공격이 아님을 알리고, 3) 심지어는 크리스마스에 양측 병사들이 함께 노래 부르고 축구 경기를 한 사건까지 발생한다. (1914년 크리스마스 휴전)

이러한 행동은 반복 게임 구조에서 상대의 배신에 대응하지만, 협력 의사가 있다면 즉시 회복할 수 있는 팃 포 탯 전략의 핵심을 보여준다. 전쟁이라는 극한 상황 속에서도 인간은 상대의 의도를 읽고, 신뢰할 수 있는 반복적 행동을 통해 ‘협력의 평형’을 구축할 수 있다는 걸 보여준 사례다.

3.2. 냉전 시대의 핵 전략

냉전 시대, 미국과 소련은 서로를 핵무기로 위협하면서도 실제 전면전을 피하는 상호확증파괴(Mutually Assured Destruction, MAD) 전략을 사용했다. 이 구조는 게임 이론의 반복된 죄수의 딜레마와 매우 유사하다.

미국이 핵실험을 하면, 소련도 맞대응하고, 서로의 군비를 증강시킨다. 그러나 어느 순간 상대가 군축에 나서면, 이를 신뢰의 신호로 받아들여 ‘군축 협상’(전략무기 제한협상, 신전략무기 감축협정 등)이 진행되기도 한다.

즉, 팃 포 탯처럼 상대의 행동을 그대로 반영하며 대응하다가, 협력의 기미가 보이면 바로 ‘따라 협력’으로 전환하는 대칭적 반응 구조가 유지된 것이다. 이 전략은 40년이 넘는 냉전 시대를 실질적 전쟁 없이 유지시키는 데 핵심 역할을 했다.

3.3. 시장 경쟁 속 가격 정책

다국적 항공사, 정유사, 혹은 이동통신사처럼 소수 기업이 경쟁하는 시장(과점 구조)에서는 팃 포 탯 전략이 자주 목격된다. 예를 들어: 1) 한 항공사가 비수기 노선을 갑자기 할인하면, 경쟁 항공사도 즉각 유사한 수준으로 가격을 낮춘다. 그러나 2) 성수기나 외부 요인이 종료되면, 다시 원래 가격으로 되돌린다.

이러한 반복적 반응은 ‘네가 협력하면 나도 협력하지만, 배신하면 나도 똑같이 행동하겠다’는 신호를 시장 전체에 주는 것으로, 묵시적 담합이라고도 불린다. 법적으로는 금지되어 있지만, 실제로는 팃 포 탯 기반의 경쟁 균형 상태가 형성되는 경우가 많다.

3.4. 자연계에서의 생존 전략

동물의 세계에서도 팃 포 탯 전략이 발견된다. 대표적 사례가 흡혈박쥐(vampire bats)다. 이 박쥐는 매일 피를 빨아야 살아남는데, 만약 어떤 개체가 피를 구하지 못했을 경우 같은 집단의 다른 개체가 피를 나누어 준다. 이 과정에서 이전에 피를 나누어준 적이 있는 개체일수록 나눔 확률이 높아진다.

이러한 행동은 자연 선택의 압력 아래에서도 팃 포 탯이 진화적으로 유리하다는 것을 보여주는 강력한 증거다. 협력이 생존의 조건이 될 때, 이 전략은 집단 전체의 안정성을 높이는 역할을 한다.

4. 결점

4.1. 실수에 대한 민감성

팃 포 탯은 상대방의 행동을 정확히 반영하는 전략이다. 이 자체는 공정하고 단순하며, 오해의 여지가 적어 장점이 되기도 하지만, 문제는 상대방의 행동을 오직 결과로만 해석한다는 데 있다. 즉, 상대가 실제로 배신하려 한 것인지, 단순한 착오인지 구분하지 않고 ‘배신’이라는 결과만 놓고 대응한다. 현실 세계에서는 통신 오류, 전달 착오, 전략 착각 등으로 인해 비의도적인 배신이 발생할 수 있다. 하지만 팃 포 탯은 그런 실수조차 보복으로 받아들인다. 결과적으로 처음의 단순한 오해가 양측의 지속적 보복으로 이어지고, 결국 협력 관계가 완전히 무너질 수 있다.

이를 보완하기 위한 전략으로는 ‘관대한 팃 포 탯’(Generous Tit for Tat)이나 ‘두 번 참기 전략’(Tit for Two Tats)처럼 실수를 용인하거나 일정 횟수까지는 관용을 베푸는 방식이 제안되었지만, 이런 방식은 원래 팃 포 탯이 가졌던 단순성과 명료성을 희석시킨다. 결국 이 전략은 ‘실수에 관대한 사회’가 아닌 이상, 언제든 협력 실패의 위험을 안고 움직이게 된다.

4.2. 협력 회복의 어려움

팃 포 탯은 협력으로 시작하고, 배신에는 배신으로 대응하지만, 동시에 상대가 다시 협력하면 그 역시 다시 협력으로 반응하는 관용성을 갖고 있다. 이론적으로는 건전한 구조이지만, 실제 적용 과정에서는 이 ‘회복성’이 쉽지 않다. 한 번 보복이 시작되면, 현실에서는 감정적 요인이나 신뢰 상실로 인해 협력으로 돌아가기 어려운 심리적 장벽이 생긴다. 특히 개인이나 국가 간, 또는 기업 간의 갈등 상황에서는 ‘상대가 먼저 진정성 있게 사과하지 않는 한 나는 협력하지 않겠다’는 식의 태도가 형성되기 쉽다.

이 경우, 팃 포 탯의 이상적인 복원 구조는 작동하지 않는다. 협력의 회복은 단순히 전략의 문제를 넘어 감정, 책임, 의도 해석 등 여러 층위의 갈등 조정을 요구하게 된다. 팃 포 탯이 게임 이론에서는 기능하더라도, 실제 인간의 세계에서는 이 회복의 경로가 너무 좁고 약하다.

4.3. 게임 종료 조건

팃 포 탯은 반복 게임에서의 전략이다. 그런데 이 전략이 성립하려면 게임이 반복된다는 조건 자체가 필요하며, 그것이 언제 끝날지 모른다는 불확실성이 전제되어야 한다. 만약 게임이 ‘10회만 반복된다’는 식으로 끝이 정해져 있다면, 마지막 라운드에서는 협력할 유인이 사라지고 배신이 우세한 전략이 된다.

상대가 마지막 라운드에서 배신한다면, 팃 포 탯은 그 이후 대응할 수 있는 기회 자체가 없기 때문에, 보복의 효과도 의미를 잃는다. 따라서 종료 조건이 명확하거나, 반복성이 약한 상황에서는 협력을 유지하기 어렵고, 팃 포 탯의 전략적 효용도 낮아진다.

4.4 전략적 대응

팃 포 탯은 상대의 직전 행동만을 기준으로 자신의 행동을 결정한다. 이는 전략적으로 매우 단순한 구조다. 하지만 상대가 더 복잡하고 교묘한 전략을 쓸 경우, 팃 포 탯은 그런 전략을 예측하거나 대응하는 데 취약하다. 예를 들어, 상대가 처음에는 일부러 협력하다가 중간에 갑자기 배신하면서 교란 전략을 쓰는 경우, 팃 포 탯은 그때마다 그대로 반응하며 끌려다니게 된다. 이른바 ‘전략적 유연성’이 부족한 것이다.

특히 현실에서는 단순한 둘 사이의 게임이 아니라, 복수의 행위자들이 얽힌 다자 관계가 많다. 이 경우, 팃 포 탯은 상대의 진짜 의도를 파악하고, 맥락 속에서 판단하며, 장기적인 이익을 도모하는 데 부족한 점이 많다. 요컨대, 팃 포 탯은 단순한 구조 안에서는 효율적이지만, 복잡한 상호작용 구조에서는 지나치게 기계적이며 수동적인 전략이 될 위험이 있다.

4.5. 역효과

팃 포 탯은 결과만을 보고 보복하므로, 어떤 상황에서는 상대방의 행동을 맥락 없이 해석한 채 무조건적인 응징에 나서는 모습이 될 수 있다. 현실 세계에서는 전략의 ‘도덕성’이나 ‘정당성’이 결과에 큰 영향을 미친다. 만약 한 행위자가 실수나 불가피한 사정으로 협력하지 못했는데, 다른 쪽이 기계적으로 보복을 해버린다면, 그 행동은 정당한 대응이 아니라 오히려 과잉 대응으로 인식될 수 있다. 그러면 팃 포 탯을 따랐던 쪽이 오히려 신뢰를 잃거나, 갈등의 책임을 떠안는 상황도 발생할 수 있다.

즉, 이 전략은 비인격적, 비맥락적, 기계적 대응에 가까워서, 현실에서는 인간관계와 조직 행동의 복잡성을 모두 포용하기 어려울 수 있다.

5. 마무리

팃 포 탯은 단순하면서도 강력한 전략이다. 반복되는 상황에서 상대방과의 신뢰를 구축하고, 협력을 유지하며, 배신을 효과적으로 억제할 수 있다는 점에서, 게임 이론 역사상 가장 성공적인 전략 중 하나로 평가받는다. 특히 ‘먼저 협력하고, 이후에는 상대가 한 대로 반응한다’는 규칙은 직관적이면서도 예측 가능성이 높아, 상호주의와 공정성의 원칙을 자연스럽게 내포하고 있다.

다만, 팃 포 탯 전략이 이상적으로 작동하려면 몇 가지 조건이 충족되어야 한다. 게임이 반복되어야 하고, 실수가 곧바로 의도된 배신으로 해석되지 않아야 하며, 상대의 행동이 단순하고 정직하게 반영되어야 한다. 이와 같은 조건이 약화될 경우, 팃 포 탯은 협력을 촉진하기보다는 오히려 갈등의 악순환을 야기하는 기계적 대응 전략으로 전락할 위험이 있다.

결국 팃 포 탯은 그 자체로 완전한 해법이라기보다는, 협력이 가능한 환경을 설계하고, 신뢰와 보복의 균형을 정교하게 조율하기 위한 출발점이라고 볼 수 있다. 단순한 규칙 속에 담긴 인간 행동의 복잡성과 사회적 맥락을 이해하는 데 유용한 분석 도구이며, 반복성과 상호작용의 중요성을 보여주는 전략적 모델로서 여전히 유효한 가치를 지닌다.

같이 보면 좋은 글
게임 이론이란?, 죄수의 딜레마부터 경매 이론까지

게임 이론의 다학문적 탐험, 전략의 언어로 읽는 세상

댓글 남기기

error: Content is protected !!