[강화학습] 확률과 랜덤 변수(1)

2024. 12. 16. 23:00·수학
728x90

 

 

 

 

 

1. 확률 (Probability)

 

 

확률 실험 (Random Experiment)

 

확률 실험(Random experiment)이란 동일한 조건에서 여러 번 반복할 수 있지만, 각 실험의 결과(Outcome)는 사전에 정확히 예측할 수 없으며, 모든 가능한 결과는 미리 정의할 수 있는 실험을 의미합니다. 

 

 

예를 들어, 주사위 놀이는 매번 어떤 숫자가 나올지 알 수 없지만 주사위를 한 번 던질 때의 결과는 $\{1, 2, 3, 4, 5, 6\}$ 중 하나가 나올 것이라는 것을 알 수 있기 때문에 확률 실험입니다. 또 다른 예로는 동전 던지기가 있습니다. 매번 어떤 면이 나올지 알 수 없지만 동전을 한 번 던질 때의 결과는 $\{ \text{Head}, \text{Tail} \}$ 중 하나가 나올 것이라는 것을 알 수 있기 때문에 확률 실험입니다.

 

 

 

표본 공간 (Sample Space)

 

확률 실험에서 발생할 수 있는 모든 결과를 포함하는 집합을 표본 공간(Sample space)이라고 하며, 표본 공간의 부분집합을 사건(Event)라고 합니다. 표본 공간의 원소(Element)가 유한 개이면 이를 이산(Discrete) 표본 공간이라고 하고, 원소가 무한 개이면 연속(Continuous) 표본 공간이라고 합니다. 

 

 

예를 들어, 주사위 놀이에서 표본 공간은 $\{1, 2, 3, 4, 5, 6\}$이며, 사건은 짝수가 나오는 사건($\{2, 4, 6\}$), 3보다 큰 숫자가 나오는 사건($\{4, 5, 6\}$) 등이 있습니다. 또 다른 예로, 동전 던지기에서 표본 공간은 $\{ \text{Head}, \text{Tail} \}$이며, 사건은 앞면이 나오는 사건($\{ \text{Head}\}$), 뒷면이 나오는 사건($\{ \text{Tail} \}$)이 있습니다. 주사위 놀이와 동전 던지기 모두 표본 공간의 원소가 유한 개이므로 이산 표본 공간입니다.

 

 

 

확률 (Probability)

 

표본 공간 $S$에서 사건 $A$가 발생할 확률(Probability) $P \{ A \}$는 다음 3가지 공리(Axiom)을 만족하는 어떤 수로 정의합니다. 

 

 

공리 1: 확률을 항상 0보다 크거나 같다.

확률은 음수가 될 수 없으며, 항상 0 이상입니다.

 

$$P \{ A \} \geq 0$$

 

공리 2: 표본 공간 전체의 확률은 1이다.

표본 공간 $S$는 실험에서 발생할 수 있는 모든 결과를 포함하며, 그 전체에 대한 확률은 항상 1입니다.

 

$$P \{ S \} = 1$$

 

공리 3: 서로 배타적인 사건 $A$와 $B$의 경우에는 다음 관계식이 성립한다.

두 사건 $A$와 $B$가 서로 배타적(Mutually Exclusive)이라면, 즉 $A \cap B = \varnothing $을 만족한다면, 겹치는 결과가 없으므로 $A$와 $B$의 확률을 더하여 $A \cap B$의 확률을 구할 수 있습니다. 

 

$$P \{ A \cap B \} = P \{ A \} + P \{ B \} $$

 

 

 

위의 3가지 공리로부터 다음 2가지 성질이 파생됩니다.

 

성질 1: 공집합의 사건의 확률은 0이다.

공집합 $\varnothing$은 어떤 결과도 포함하지 않는 집합이므로, 공집합이 발생할 확률은 항상 0입니다.

 

$$P \{ \varnothing \} = 0$$ 

 

성질 2: 사건 $A$의 확률은 (1 - 여집합인 사건의 확률)과 같다.

여집합 $\bar{A}$는 A가 아닌 결과로 구성된 사건입니다. 표본 공간 $S$는 $A$와 $\bar{A}$로 나뉘므로 $P \{ S \} = P \{ A \} + P \{ \bar{A} \}$가 성립합니다. 공리 2에서 $P \{ S \} = 1$이므로 이를 재배치하면 다음과 같이 나타낼 수 있습니다.

 

$$P \{ A \} = 1 - P \{ \bar{A} \}$$

 

 

 

 

 

 

2. 랜덤 변수 (Random Variable)

 

랜덤 변수(Random Variable) $X \equiv X(e)$는 표본 공간을 구성하는 각 원소($e$)에 하나의 실숫값(real number)을 대응(mapping)시키는 함수로 정의됩니다.

 

 

표본 공간의 원소는 확률 실험에서 발생 가능한 모든 결과를 나타내며, 랜덤 변수를 통해 숫자가 아닌 실험 결과도 수치적으로 표현할 수 있습니다. 따라서 랜덤 변수는 확률 실험의 결과를 수치화하여 수학적으로 분석할 수 있도록 도와줍니다.

 

 

랜덤 변수의 정의역(Domain)은 표본 공간이고, 치역(Range)은 실수 집합($\mathbb{R}$)의 부분 집합으로 전체 실수 영역을 포함할 수도 있습니다. 

 

 

랜덤 변수는 대문자로 표기하고 랜덤 변수가 특정 값을 가질 때는 소문자로 표기합니다. 예를 들어, $X(e) = x$ 또는 $X=x$는 확률 실험 결과인 $e$에 대응하는 랜덤 변수가 갖는 실수값은 $x$라는 것을 의미합니다.  

 

 

출처: https://www.geeksforgeeks.org/probability-distribution/

 

 

표본 공간의 부분집합인 사건은 확률 실험 결과 $e$의 집합로 정의됩니다. 또한, 임의의 실수 구간(Interval) $I$에 대해, 이를 만족하는 사건 $A$가 항상 존재합니다. 사건 $A$의 확률을 $P \{ A \}$라고 할 때, 랜덤 변수 $X$가 해당 실수 구간 $I$에 속할 확률 $P \{ X \in I \}$는 사건 $A$의 확률과 동일합니다. 이를 수식으로 표현하면 다음과 같습니다.

 

$$ P \{ X \in I \} = P \{ A \} $$

 

 

랜덤 변수 $X$가 이산적인 값을 가지면 이산(Discrete) 랜덤 변수라고 하고, 연속적인 값을 가지면 연속(Continuous) 랜덤 변수라고 합니다.

 

 

 

728x90

'수학' 카테고리의 다른 글

[강화학습] 확률과 랜덤 변수 (2)  (0) 2024.12.18
'수학' 카테고리의 다른 글
  • [강화학습] 확률과 랜덤 변수 (2)
랑뎁
랑뎁
  • 랑뎁
    RangDev.
    랑뎁
  • 전체
    오늘
    어제
    • 분류 전체보기 (270)
      • 취준 (59)
        • 경제신문스크랩 (59)
      • 파이썬 (2)
      • 코딩테스트 대비 (168)
      • 수학 (2)
      • 머신러닝 (0)
      • 컴퓨터비전 (1)
      • 강화학습 (33)
      • Git (3)
      • 자격증 (1)
        • 한국사 능력 검정 1급 (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
    • 글쓰기
  • 인기 글

  • 최근 댓글

  • hELLO· Designed By정상우.v4.10.2
랑뎁
[강화학습] 확률과 랜덤 변수(1)
상단으로

티스토리툴바