Διακριτές τυχαίες μεταβλητές

Θεωρούμε ένα πείραμα τύχης στο οποίο ρίχνουμε ένα νόμισμα τρείς φορές, με πιθανότητα $p$ να εμφανιστούν γράμματα (Γ) σε κάθε ρίψη (σε ένα ``τίμιο'' νόμισμα η πιθανότητα αυτή θα είναι 1/2). Υποθέστε ότι αν σε μια ρίψη εμφανιστούν Γ κερδίζουμε 1 ευρώ, ενώ αν εμφανιστεί κεφάλι (Κ) χάνουμε 1 ευρώ. Προφανώς η ποσότητα που μας ενδιαφέρει εδώ, και την οποία συμβολίζουμε με $X$, είναι το συνολικό μας κέρδος. Είναι φανερό ότι η $X$ μπορεί να πάρει μόνο μία από τις τιμές: 3, 1, -3, και -1. Το ποια από αυτές θα πάρει εξαρτάται από το αποτέλεσμα του τυχαίου πειράματος. Αν, για παράδειγμα, το αποτέλεσμα είναι ΓΓΓ η $X$ παίρνει την τιμή 3, ενώ αν είναι ΓΚΓ η $X$ παίρνει την τιμή 1. Στον παρακάτω πίνακα καταγράφουμε τις τιμές της $X$ που αντιστοιχούν στα οκτώ δυνατά αποτελέσματα, $\omega$, του τυχαίου πειράματος, καθώς και την πιθανότητα να εμφανιστεί καθένα από τα αποτελέσματα αυτά (σημειώστε ότι ο αριθμός των δυνατών αποτελεσμάτων είναι ο αριθμός των δυνατών τριάδων που μπορούμε να φτιάξουμε από τα δύο στοιχεία, Γ, Κ, οι οποίες, σύμφωνα με τη θεωρία του προηγούμενου κεφαλαίου, είναι $2 \times 2 \times 2$).


$\omega$ $X$ $P(\omega)$
ΓΓΓ 3 $p^3$
ΓΚΓ 1 $p^2 (1-p)$
ΓΓΚ 1 $p^2 (1-p)$
ΚΓΓ 1 $p^2 (1-p)$
ΓΚΚ -1 $p (1-p)^2$
ΚΓΚ -1 $p (1-p)^2$
ΚΚΓ -1 $p (1-p)^2$
ΚΚΚ -3 $(1-p)^3$

(Στον παραπάνω πίνακα, η πιθανότητα του αποτελέσματος ΓΓΓ υπολογίστηκε ως γινόμενο των πιθανοτήτων των τριών ανεξάρτητων ενδεχομένων $Α=$''στην πρώτη ρίψη Γ'', $Β=$``στη δεύτερη ρίψη Γ'', $Δ=$''στην τρίτη ρίψη Γ'', λαμβάνοντας υπόψη ότι η πιθανότητα της τομής ανεξάρτητων ενδεχομένων ισούται με το γινόμενο των πιθανοτήτων τους. Ανάλογα για τα άλλα αποτελέσματα.)

Μπορούμε να σκεφτόμαστε τη $X$ ως μια πραγματική μεταβλητή η οποία για κάθε στοιχειώδες ενδεχόμενο $\omega$ του $\Omega$ παίρνει μια ορισμένη τιμή (εδώ μια από τις τιμές -3,-1,1,3). Η πιθανότητα η $X$ να πάρει μια ορισμένη τιμή, έστω 1, είναι η πιθανότητα του γεγονότος $A=\{\omega: X(\omega) = 1\}$ το οποίο περιλαμβάνει όλα τα στοιχειώδη ενδεχόμενα $\omega$ του $\Omega$ που οδηγούν στην τιμη $X=1$ (στο παράδειγμά μας τα ΓΓΚ, ΓΚΓ και ΚΓΓ). Από τον πίνακα βλέπουμε ότι το $A$ έχει πιθανότητα $P(A) = 3 p^2 (1-p)$ να πραγματοποιηθεί (το $Α$ είναι η ένωση των ανεξάρτητων ενδεχομένων ΓΓΚ, ΓΚΓ και ΚΓΓ). Ανάλογα μπορούμε να χειριστούμε και τις υπόλοιπες τιμές της $X$. Έτσι, για κάθε τιμή που μπορεί να πάρει η $X$, έστω $x_i$ (που εδώ θα είναι κάποιο από τα $-3,-1,1,3$), η πιθανότητα με την οποία παίρνει αυτή την τιμή, $P(X=x_i)$, είναι πλήρως καθορισμένη (π.χ. $P(X=1)=3 p^2 (1-p)$). Θα δούμε ότι η $X$ είναι ένα παράδειγμα διακριτής τυχαίας μεταβλητής (ή στοχαστικής συνάρτησης, όπως επίσης λέγεται).



Ορισμός: Διακριτή τυχαία μεταβλητή $X$ σε ένα δειγματοχώρο $\Omega$ είναι μια μεταβλητή $X$ που ορίζεται για κάθε δυνατό αποτέλεσμα ενός τυχαίου πειράματος και για κάθε τέτοιο αποτέλεσμα παίρνει μια ορισμένη τιμή από ένα πεπερασμένο ή άπειρο αριθμήσιμο υποσύνολο των πραγματικών αριθμών.

Ορισμός: Η πραγματική συνάρτηση $f$ που ορίζεται στους πραγματικούς αριθμούς από την $f(x) = P(X=x)$, λέγεται διακριτή συνάρτηση πυκνότητας ή συνάρτηση πιθανότητας ή κατανομή πιθανότητας της $X$ (Δίνει την πιθανότητα η $X$ να πάρει μια ορισμένη τιμή από το πεδίο τιμών της. Π.χ., για την τυχαία μεταβλητή $X$ που ορίσαμε στην αρχή του κεφαλαίου $f(1)=P(X=1)$ δίνει την πιθανότητα η μεταβλητή $X$ (το κέρδος) να πάρει την τιμή 1 (να είναι 1 ευρώ).)

Ας θεωρήσουμε την τυχαία μεταβλητή $X$ που ορίσαμε στην αρχή του κεφαλαίου, και ας υποθέσουμε ότι $p=0.5$. Τότε η $X$ έχει τη διακριτή συνάρτηση πυκνότητας που ορίζεται από τις

\begin{displaymath}f(-3) =0.125, \ f(-1) = 0.375, \ f(1) = 0.375, \ f(3)=0.125 .
\end{displaymath}

και $f(x)=0$, αν $x \neq -3,-1,1,3$. H συνάρτηση πυκνότητας ή απλά πυκνότητα $f$ μιας διακριτής τυχαίας μεταβλητής έχει τις ακόλουθες ιδιότητες:

(1)
$f(x) \geq 0,~~x \in R$

(2)
To σύνολο $\{ x : f(x) \neq 0 \}$ (δηλαδή το σύνολο των τιμών της $Χ$ που έχουν μη μηδενική πιθανότητα) είναι ένα πεπερασμένο ή άπειρο αριθμήσιμο υποσύνολο του $R$. Έστω $\{x_1,x_2,...,\}$ αυτό το σύνολο. Τότε

(3)
$\sum_i f(x_i) = 1$.
Οι ιδιότητες (1) και (2) προκύπτουν άμεσα από τον ορισμό της $f$. Για να δούμε αν ισχύει η (3) παρατηρούμε ότι τα ενδεχόμενα $\{ \omega : X(\omega) = x_i \}$ (δηλαδή τα ενδεχομενα του $\Omega$ που δίδουν για τη $Χ$ την τιμή $x_i$) είναι ξένα και η ένωσή τους είναι το $\Omega$. Άρα

\begin{displaymath}\sum_i f(x_i) = \sum_i P(X=x_i) = P \left( \bigcup_i \{X=x_i\} \right)
= P(\Omega) =1 .
\end{displaymath}

Έτσι, μπορούμε να ορίσουμε εναλλακτικά την πυκνότητα $f$ ως εξής:

Ορισμός: Μια πραγματική συνάρτηση $f$ ορισμένη στο $R$ λέγεται διακριτή συνάρτηση πυκνότητας ή απλά διακριτή πυκνότητα αν ικανοποιεί τις παραπάνω ιδιότητες (1) - (3).

Παράδειγμα 1: Ρίχνουμε ένα νόμισμα δύο φορές, και ορίζουμε την τυχαία μεταβλητή $X$ ως το πλήθος των Κ που εμφανίστηκαν. Να υπολογιστεί η πυκνότητα $f$ της $X$.

Η αντιστοιχία μεταξύ των δυνατών αποτελεσμάτων του πειράματος και των τιμών της διακριτής τυχαίας μεταβλητής $X$ δίνεται στον παρακάτω πίνακα, μαζί με την πιθανότητα των σημείων του δειγματοχώρου $\Omega$ του πειράματος.

$\omega$ $X$ $P(\omega)$
ΚΚ 2 1/4
ΓΓ 0 1/4
ΚΓ 1 1/4
ΓΚ 1 1/4

Η πυκνότητα που αντιστοιχεί στη $X$ είναι

\begin{displaymath}f(0) = P(X=0) = \frac{1}{4},~f(1) = P(X=1) = \frac{1}{2},~
f(2) = P(X=2) = \frac{1}{4} ,
\end{displaymath}

και $f(x)=0$ για $x \neq 0,1,2$. Προσέξτε ότι $f(0) + f(1) + f(2) = 1$. Η γραφική παράσταση της $f$ δίνεται είτε με ένα ραβδόγραμμα, είτε με ένα ιστόγραμμα. Σε ένα ραβδόγραμμα το άθροισμα των τεταγμένων είναι 1, ενώ σέ ένα ιστόγραμμα το άθροισμα των εμβαδών είναι 1, όπως προκύπτεί από την ιδιότητα (3). Σε ένα ιστόγραμμα μπορούμε να φανταστούμε ότι η τυχαία μεταβλητή $X$ γίνεται συνεχής, λόγου χάρη $X=1$ σημαίνει ότι η $X$ είναι μεταξύ 0.5 και 1.5.
Σημειώστε ότι και άλλες τυχαίες μεταβλητές μπορούν να οριστούν στον ίδιο δειγματοχώρο $\Omega$. Λόγου χάρη, στο προηγούμενο παράδειγμα θα μπορούσαμε να ορίσουμε μια τυχαία μεταβλητή $Y$ ως το πλήθος των Κ που εμφανίζονται μείον το πλήθος των Γ που εμφανίζονται. Τότε, οι δυνατές τιμές της $Y$ θα ήταν -2,0,2, ενώ η αντίστοιχη πυκνότητα θα έπαιρνε τις τιμές $f(-2)=1/4,~f(0)=1/2,~f(2)=1/4$ και $f(x)=0$ για $x\neq -2,0,2$.

Κάθε διακριτή συνάρτηση πυκνότητας, δηλαδή κάθε συνάρτηση που ικανοποιεί τις ιδιότητες (1) - (3), είναι η πυκνότητα κάποιας τυχαίας μεταβλητής $X$. Με άλλα λόγια, αν μας δοθεί η $f$ μπορούμε πάντα να κατασκευάσουμε ένα δειγματοχώρο $\Omega$ και μια τυχαία μεταβλητή ορισμένη στον $\Omega$, της οποίας η διακριτή πυκνότητα να είναι $f$. Έτσι μπορούμε να χρησιμοποιούμε εκφράσεις όπως ``έστω $X$ μια τυχαία μεταβλητή με διακριτή πυκνότητα $f$'' χωρίς να διευκρινίζουμε τον δειγματοχώρο $f$ στον οποίο ορίζεται η $X$. Για παράδειγμα, υποθέστε ότι επιλέγουμε ένα χαρτί από μια δεσμίδα με $n$ χαρτιά, και θέτουμε $X=i$ αν επιλεγεί το $i-$οστο χαρτί. Τότε, $P(X=i) = 1/n$, άρα μπορούμε να περιγράψουμε το πείραμα λέγοντας ότι παρατηρούμε μια τυχαία μεταβλητή $X$ η οποία παίρνει ακέραιες τιμές $1,2,3,...,n$ και έχει πυκνότητα $f(x) = 1/n$ αν $x=1,2,3,...,n$ και $f(x)=0$ αλλιώς.

Γενικά, κάθε τυχαίο πείραμα που έχει πεπερασμένα ή άπειρα αριθμήσιμα το πλήθος δυνατά αποτελέσματα μπορεί να περιγραφεί ως η παρατήρηση της τιμής μιας διακριτής τυχαίας μεταβλητής $X$. Για την ακρίβεια, το πείραμα πολλές φορές μας δίνεται ήδη μ' αυτή τη μορφή.

Στα δύο επόμενα παραδείγματα παρουσιάζονται δύο τυπικές διακριτές πυκνότητες.

Παράδειγμα 2: Η γεωμετρική πυκνότητα.
Έστω $0< p < 1$. Τότε η πραγματική συνάρτηση $f$ που ορίζεται στο $R$ από την

\begin{displaymath}f(x) =
\left\{ \begin{array}{l} p(1-p)^x,~~~x=0,1,2,3,... \\
0,~~~x \ne 0,1,2,3,... , \end{array} \right.
\end{displaymath}

είναι μια διακριτή πυκνότητα και λέγεται γεωμετρική πυκνότητα με παράμετρο $p$.

Για να δούμε αν η $f$ είναι πυκνότητα, το μόνο που χρειάζεται να ελέγξουμε είναι ότι ισχύει η ιδιότητα (3), αφού οι (1) και (2) ικανοποιούνται προφανώς. Όμως,

\begin{displaymath}\sum_{i=0}^\infty f(x_i) = \sum_{i=0}^\infty p(1-p)^i
= p \sum_{i=0}^\infty (1-p)^i = p \cdot \frac{1}{p} =1 ,
\end{displaymath}

αφού το άθροισμα της γεωμετρικής σειράς $\sum_{i=0}^\infty (1-p)^i$ είναι ίσο με $1/p$.

Παράδειγμα 3: Η πυκνότητα Poisson.
Έστω $\lambda$ ένας θετικός αριθμός. Η πυκνότητα Poisson με παράμετρο $\lambda$ ορίζεται από τη σχέση

\begin{displaymath}f(x) =
\left\{ \begin{array}{l}
{\lambda^x e^{-\lambda} \o...
...,~~~x=0,1,2,...\\
0,~~~x \ne 0,1,2,3,... \end{array} \right.
\end{displaymath}

Η συνάρτηση $f$ προφανώς ικανοποιεί τις (1) και (2) του ορισμού της διακριτής συνάρτησης πυκνότητας. Για να δούμε αν ισχύει η (3) θα χρησιμοποιήσουμε το ανάπτυγμα Taylor της εκθετικής συνάρτησης

\begin{displaymath}e^\lambda = \sum_{x=0}^\infty \frac{\lambda^x}{x!} .
\end{displaymath}

Έτσι,

\begin{displaymath}\sum_x f(x) = \sum_{x=0}^\infty \frac{\lambda^x e^{-\lambda}}...
...y \frac{\lambda^x }{x!}
= e^{-\lambda} \cdot e^{\lambda} =1 .
\end{displaymath}

Η εμπειρία δείχνει ότι πολλά τυχαία φαινόμενα που έχουν σχέση με το μέτρημα ακολουθούν κατά προσέγγιση την κατανομή Poisson, όπως για παράδειγμα τα εξής:

(α)
Tο πλήθος των ατόμων μιας ραδιενεργού ουσίας που αποσυντίθενται στη μονάδα του χρόνου.

(β)
Tο πλήθος των κλήσεων που δέχεται ένα τηλεφωνικό κέντρο στη μονάδα του χρόνου. (Δηλαδή η πιθανότητα το πλήθος των κλήσεων που δέχεται το τηλεφωνικό κέντρο να είναι $x=0, 1, 2, 3, ..$ δίνεται από το $f(x)=\lambda^x e^{-\lambda}/x!$.)

(γ)
Το πλήθος των τυπογραφικών λαθών σε μια σελίδα ενός βιβλίου,

κ.τ.λ.

Η αθροιστική συνάρτηση κατανομής ή απλά συνάρτηση κατανομής για μια τυχαία μεταβλητή $X$ ορίζεται από τη σχέση

\begin{displaymath}F(x) = P(X \leq x) ,
\end{displaymath}

όπου $x$ οποιοσδήποτε πραγματικός αριθμός ( $ -\infty < x < \infty $). Η συνάρτηση κατανομής μπορεί να υπολογιστεί από την πυκνότητα $f$, επειδή

\begin{displaymath}F(x) = P(X \leq x) = \sum_{u \leq x} f(u) ,
\end{displaymath}

όπου το άθροισμα στο δεξιό μέλος νοείται ως προς όλα τα $u$ για τα οποία $u \leq x$. Αντίστροφα, η πυκνότητα μπορεί να προκύψει από τη συνάρτηση κατανομής, όπως θα δούμε και στο επόμενο παράδειγμα.

Παράδειγμα 4: Προσδιορίστε τη συνάρτηση κατανομής της τυχαίας μεταβλητής $X$ του παραδείγματος 1, και δώστε τη γραφική της παράσταση.

Η $F(x)$ θα είναι:

\begin{displaymath}F(x) =
\left\{ \begin{array}{l}
0,~~~ -\infty < x < 0 \\ ...
... \leq x < 2 \\
1,~~~2 \leq x < +\infty
\end{array} \right.
\end{displaymath}

Για παράδειγμα, για $1 \leq x < 2$, η $F$ θα είναι $F(x)=f(0) + f(1) = 3/4$. Βλέπουμε ότι η $F$ είναι μη φθίνουσα, κλιμακωτή συνάρτηση, και ότι για κάθε ακέραιο $x$, η $F$ παρουσιάζει άλμα (ασυνέχεια) μεγέθους $f(x)$ στο $x$, ενώ είναι σταθερή στο διάστημα $[x,x+1)$. Έτσι, μπορούμε να προσδιορίσουμε την $f$ από την $F$ και αντιστρόφως.

Παράδειγμα 5: Θεωρήστε τη συνάρτηση πυκνότητας $f(x) = 1/10$ για $x=1,2,...,10$ και $f(x)=0$ για οποιοδήποτε άλλο $x$. Ποιά είναι η συνάρτηση κατανομής $F$ της $f$;

Είναι $F(x) = 0$ αν $x<1$, $F(x)=1$ αν $x> 10$, και $F(x) = \sum_{u \leq x} f(u) = \frac{[x]}{10}$, αν $1 \leq x \leq 10$.

Μπορούμε να υπολογίσουμε την πιθανότητα, λόγου χάρη, $P(3 < x \leq 5)$, είτε με τη βοήθεια της $f$, γράφοντας

\begin{displaymath}P(3 < x \leq 5) = f(4) + f(5) = \frac{1}{10} + \frac{1}{10}=\frac{2}{10},
\end{displaymath}

είτε με τη βοήθεια της $F$:

\begin{displaymath}P(3 < x \leq 5) = F(5) - F(3) = \frac{2}{10} .
\end{displaymath}

Αν θέλω να βρώ την πιθανότητα $P(3 \leq x \leq 5)$ τότε γράφω

\begin{displaymath}P(3 \leq x \leq 5) = P(2 < x \leq 5) = F(5) - F(2) = \frac{3}{10} ,
\end{displaymath}

κ.τ.λ.

Γενικά, ισχύει η σχέση

\begin{displaymath}P( a < X \leq b) = F(b) - F(a) ,
\end{displaymath}

η οποία είναι πολύ χρήσιμη για τον υπολογισμό πιθανοτήτων.

Maria Kafesaki 2007-06-08