[Xác Suất] Biến ngẫu nhiên và phân phối xác suất

Trong phần trước tao đang được đem định nghĩa đặc biệt cơ bạn dạng về luật lệ test, sự khiếu nại, những đặc thù của biến hóa cố và phương pháp tính phần trăm của bọn chúng. Trong phần này, tao tiếp tục triệu tập nhập những biến hóa cố nhận độ quý hiếm tình cờ và quy mô phân phối phần trăm của bọn chúng.

Mục lục

1. Biến ngẫu nhiên

Biến tình cờ (random variables) là những biến hóa nhận 1 độ quý hiếm tình cờ thay mặt đại diện mang lại thành quả của luật lệ test. Mỗi độ quý hiếm sẽ có được $x$ của biến hóa tình cờ $X$ được gọi là một trong những thể hiện tại của $X$, đó cũng là thành quả của luật lệ test hoặc còn được hiểu là một trong những sự khiếu nại.

Bạn đang xem: [Xác Suất] Biến ngẫu nhiên và phân phối xác suất

Gọi thương hiệu là một trong những biến hóa có vẻ như tương đối kì kì một ít vị biến hóa tình cờ thực ra là một trong những hàm ánh xạ kể từ không khí sự khiếu nại không thiếu cho tới một số ít thực: $X: \Omega \mapsto \mathbb{R}$.

Biến tình cờ đem 2 dạng:

  • Rời rộc rạc (discrete): tập dượt độ quý hiếm nó là tách rộc rạc, tức là kiểm điểm được. Ví dụ như mặt mày chấm của con cái xúc xắc.
  • Liên tục (continous): tập dượt độ quý hiếm là liên tiếp tức là lấp giàn giụa 1 khoảng tầm trục số. Ví dụ như giá bán mướn nhà tại Thành Phố Hà Nội.

2. Phân phối xác suất

Là cách thức xác lập phần trăm của biến hóa tình cờ được phân phối đi ra sao. Có 2 phương pháp để xác lập phân bổ này là phụ thuộc vào bảng phân bổ xác xuất và hàm phân phối phần trăm. Tại trên đây, tôi chỉ phát biểu cho tới cách thức hàm phân bổ phần trăm. Hàm phân phối phần trăm của biến hóa tình cờ $X$ được xác lập như sau:

$$F_X(x) = P(X \le x) ~~~, x \in \mathbb{R}$$

Hàm phân phối phần trăm còn mang tên là hàm phân phối tích luỹ (CDF - Cumulative Distribution Function) bởi đặc thù là lấy phần trăm của những biến hóa tình cờ phía trái của một độ quý hiếm $x$ bất kì này cơ. Hàm này còn có Điểm sáng là một trong những hàm ko hạn chế, tức là nếu như $a<b$ thì $F_X(a) \le F_X(b)$ vì thế sự khiếu nại $b$ đang được bao hàm cả sự khiếu nại $a$ rồi.

2.1. Hàm khối phần trăm của biến hóa tách rạc

Với những biến hóa tình cờ tao còn quan hoài coi phần trăm bên trên từng bên trên 1 độ quý hiếm $x$ này cơ nhập miền độ quý hiếm của chính nó là từng nào, hàm phần trăm như thế so với biến hóa tình cờ tách rộc rạc được gọi là hàm khối xác suất (PMF - Probability Mass Function). Giả sử miền xác lập của $X$ là $D$, tức $X: \Omega \mapsto \mathsf D$ thì hàm khối phần trăm được xác lập như sau: $$p(x)=p_X(x)= \begin{cases} P(X=x) &\text{if } x \in \mathsf D \cr 0 &\text{if } x \notin \mathsf D \end{cases} $$

Như vậy tao rất có thể thấy rằng hàm khối phần trăm thực ra cũng là một trong những phần trăm nên nó đem không thiếu toàn bộ những đặc thù của phần trăm như:

  • $0 \le p(x) \le 1 $
  • $\displaystyle\sum_{x_i \in \mathsf D}p(x_i)=1$

Ví dụ, tao đem hàm phân phối phần trăm như sau: $$p(x)= \begin{cases} \frac{x}{36} &\text{if } x \in \mathbb R, 0 \le x \le 6 \cr \frac{12-x}{36} &\text{if } x \in \mathbb R, x \ge 7 \cr 0 &\text{else} \end{cases} $$ thì tao rất có thể trình diễn vị biểu đồ dùng phân phối như sau:

Hàm phân phối tích luỹ $F$ của biến hóa tình cờ tách rộc rạc rất có thể được trình diễn qua chuyện hàm khối phần trăm bằng phương pháp lấy tổng: $$F_X(x) = \sum_{\text{all }x_i \le x}p(x_i) ~~~, x \in \mathbb{R}$$ Lúc này, hàm phân phối tích luỹ sẽ sở hữu được dạng bậc thang ứng với từng bậc là khoảng tầm $(x_i, x_{i+1})$. Ví dụ hàm phân phối tích luỹ của ví dụ bên trên sẽ sở hữu được dạng như sau: $$F(x)=\begin{cases} 0 &\text{if } x < 1 \cr {1}/{36} &\text{if } 1 \le x < 2 \cr {3}/{36} &\text{if } 2 \le x < 3 \cr {6}/{36} &\text{if } 3 \le x < 4 \cr {10}/{36} &\text{if } 4 \le x < 5 \cr {15}/{36} &\text{if } 5 \le x < 6 \cr {21}/{36} &\text{if } 6 \le x < 7 \cr \text{so on… } \end{cases} $$ và biểu đồ dùng ứng là:

2.2. Hàm tỷ lệ phần trăm của biến hóa liên tục

Với những biến hóa tình cờ liên tiếp tao đem định nghĩa hàm tỷ lệ xác suất (PDF - Probability Density Function) nhằm ước tính chừng triệu tập phần trăm bên trên phụ cận điểm này cơ. Hàm tỷ lệ phần trăm $f(x)$ bên trên điểm $x$ được xác lập bằng phương pháp lấy đạo hàm của hàm phân phối tích luỹ $F(x)$ bên trên điểm đó: $$f(x) = F^{\prime}(x)$$

Như vậy thì điểm này $f(x)$ càng rộng lớn thì ở cơ cường độ tập dượt phần trăm càng tốt. Từ trên đây tao cũng rất có thể trình diễn hàm phân phối tích luỹ như sau: $$F(x)=\int_{-\infty}^xf(t)dt$$

Xác suất trong một khoảng tầm $(\alpha,\beta)$ cũng rất có thể được xem vị hàm tỷ lệ xác suất: $$P(\alpha \le X \le \beta)=\int_\alpha^\beta f(x)dx$$

Hàm tỷ lệ phần trăm cũng có thể có 2 đặc thù như phần trăm như sau:

  • Không âm: $f(x) \ge 0 ~~~, \forall x \in \mathbb{R}$
  • Tổng toàn miền vị 1: $\int_{-\infty}^\infty f(x)dx = 1$

Ví dụ, thời hạn tính vị đơn vị chức năng giờ tuy nhiên một PC hoạt động và sinh hoạt trước lúc xẩy ra lỗi được nhìn nhận như 1 biến hóa tình cờ liên tiếp và được xác lập với hàm tỷ lệ phần trăm sau: $$f(x)=\begin{cases} \lambda e^{{-x}/{100}} &\text{if } x \ge 0 \cr 0 &\text{else} \end{cases}$$ Hãy tính phần trăm của:

  • (a) Một PC hoạt động và sinh hoạt kể từ 50 giờ cho tới 150 giờ trước lúc xẩy ra lỗi?
  • (b) Một PC hoạt động và sinh hoạt bên dưới 100 giờ trước lúc xẩy ra lỗi?

Vì tổng phần trăm toàn miền là một trong nên: $$ \begin{aligned} & \int_{-\infty}^\infty f(x)dx = 1 \cr \iff & \int_{-\infty}^\infty \lambda e^{{-x}/{100}} dx = 1 \cr \iff & \lambda\int_{-\infty}^\infty e^{{-x}/{100}} dx = 1 \cr \iff & \lambda\int_0^\infty e^{{-x}/{100}} dx = 1 \cr \iff & -\lambda(100)e^{{-x}/{100}} \Big|_0^\infty = 1 \cr \iff & 100\lambda = 1 \cr \iff & \lambda = \frac{1}{100} \end{aligned} $$

(a) Xác suất nhằm 1 PC hoạt động và sinh hoạt được trong vòng (50, 150) giờ là: $$ \begin{aligned} P(50<X<150) &= \int_{50}^{150}\frac{1}{100}e^{{-x}/{100}}dx \cr & = -e^{{-x}/{100}} \Big|_{50}^{150} \cr & = e^{{-1}/{2}} -e^{{-3}/{2}} \cr & \approx 0.384 \cr \end{aligned} $$ Như vậy, xấp xỉ 38.4 Xác Suất thời hạn một PC tiếp tục hoạt động và sinh hoạt trước lúc lỗi trong vòng 50 cho tới 150 giờ.

(b) Xác suất nhằm 1 PC hoạt động và sinh hoạt được trong tầm 100 trước lúc lỗi là: $$ \begin{aligned} P(X<100) &= \int_0^{100}\frac{1}{100}e^{{-x}/{100}}dx \cr & = -e^{{-x}/{100}} \Big|_0^{100} \cr & = 1 -e^{-1} \cr & \approx 0.633 \cr \end{aligned} $$ Nên xấp xỉ 63.3 Xác Suất thời hạn một PC tiếp tục lỗi sau 100 giờ dùng.

Ta rất có thể trình diễn vị đồ dùng thị như sau:

Nhìn nhập biểu đồ dùng bên trên tao đem thấy phần trăm (a) là phần diện tích S của hình thang cong phủ kể từ $50 < x < 150$, còn phần trăm (b) là phần diện tích S hình thang cong phủ cho tới $x <100$. $x$ càng rộng lớn thì $f(x)$ cũng càng nhỏ bé lên đường nên phần phần diện tích S của chính nó càng hẹp dần dần đồng nghĩa tương quan với tỷ lệ phần trăm cũng hạn chế dần dần nên phần trăm nhằm PC hoạt động và sinh hoạt được càng ngày càng thấp lên đường.

Lưu ý rằng không giống với hàm phần trăm, hàm tỷ lệ phần trăm bên trên 1 điều bất kì luôn luôn vị 0. $$P(X=x)=\int_x^xf(t)dt=0$$

Ngoài đi ra, độ quý hiếm của hàm tỷ lệ phần trăm $f(x)$ rất có thể to hơn 1, miễn sao đáp ứng được rằng tổng phần trăm toàn miền là 1: $\int_{-\infty}^\infty f(x)dx = 1$.

4. Các đặc trưng

Qua những hàm phân phối phần trăm ở vị trí 3 phía bên trên tao rất có thể xác lập được phần trăm của một biến hóa tình cờ và dựng được đồ dùng thị trình diễn nó, tuy nhiên trong thực tiễn tao còn cần quan hoài cho tới những đặc thù của chính nó như địa điểm khoảng và chừng phân nghiền đi ra sao. Trong thực tiễn Lúc lần phần trăm tao thông thường chỉ xác lập những đặc thù này vì thế đặc biệt khó khăn xác lập được hàm phân phối phần trăm như bên trên.

4.1. Kỳ vọng

Kỳ vọng (Expectation) của biến hóa tình cờ là khoảng của biến hóa tình cờ. Kỳ vọng của biến hóa tình cờ $X$ được kí hiệu là $E[X]$: $$E[X]=\begin{cases} \displaystyle\sum_{\forall i} x_ip_i &\text{if x is discrete} \cr \displaystyle\int_{-\infty}^\infty xf(x)dx &\text{if x is continous} \end{cases} $$

Lưu ý là khoảng của biến hóa tình cờ ở đó là khoảng với trọng lượng chứ không cần cần là khoảng nằm trong của phần trăm biến hóa tình cờ.

Kỳ vọng còn được biết cho tới với những tên thường gọi khác ví như giá trị trung bình (Mean), giá trị khoảng đem trọng lượng (Weighted Average),giá hòng đợi (Expected Value) hoặc moment bậc một (first moment).

Xem thêm: Học vẽ căn bản : kỹ thuật vẽ chì

Kỳ vọng đem một trong những đặc thù như sau:

  • $E(c) = c$ với $c$ là hằng số
  • $E(cX) = cE(X)$ với $c$ là hằng số
  • $E[aX+b] = aE[X]+b$ với $a, b$ là những hằng số
  • $E[X+Y] = E[X]+E[Y]$
  • $E[XY] = E[X]E[Y]$ với $X, Y$ là độc lập
  • $E[g(X)] = \begin{cases} \displaystyle\sum_{\forall i} g(x_i)p_X(x_i) &\text{if x is discrete} \cr \displaystyle\int_{-\infty}^\infty g(x)f(x)dx &\text{if x is continous} \end{cases} $

Việc chứng tỏ những đặc thù bên trên ko khó khăn lắm nên tôi ko phát biểu ở trên đây nữa tuy nhiên chỉ lấy một trong những ví dụ đặc thù nhằm bản thân họa.

Ví dụ: mang lại biến hóa tình cờ tách rộc rạc $X$ và một hàm $g(X)=X^n$, hãy lần kì vọng của $g(X)$. $$ \begin{aligned} E[g(x)] &= \sum_{\forall i} g(x_i)p_X(x_i) \cr \implies E[X^n] &= \sum_{\forall i} x_i^np_X(x_i) \end{aligned} $$ $E[X^n]$ phía trên còn được biết cho tới với tên thường gọi moment bậc n (nth moment) của $X$.

4.2. Phương sai

Dựa nhập kì vọng tao sẽ sở hữu được được khoảng của biến hóa tình cờ, song này lại ko mang lại tao vấn đề về cường độ phân nghiền phần trăm nên tao cần thiết 1 cách thức nhằm đo được chừng phân nghiền cơ. Một trong mỗi cách thức này đó là phương sai (variance).

Phương sai $Var(X)$ là khoảng của bình phương khoảng cách kể từ biến hóa tình cờ $X$ cho tới độ quý hiếm trung bình: $$Var(X)=E[(X-E[X])^2]$$

Việc đo lường và tính toán phụ thuộc vào công thức này khá phức tạp, nên nhập thực tiễn người tao thường được sử dụng công thức tương tự sau: $$Var(X)=E[X^2]-E^2[X]$$

Chứng minh: $$ \begin{aligned} Var(X) &= E[(X-E[X])^2] \cr \ &= E[X^2-2XE[X]+E^2[X]] \cr \ &= E[X^2]-E[2XE[X]]+E[E^2[X]] ~~~,\text{E[X] is constant} \cr \ &= E[X^2]-2E[X]E[X]+E^2[X] \cr \ &= E[X^2]-2E^2[X] \end{aligned} $$

Như vậy tao rất có thể thấy rằng phương sai vẫn là một độ quý hiếm ko âm và phương sai càng rộng lớn thì nó thể hiện tại cường độ phân nghiền tài liệu càng rộng lớn hoặc phát biểu cách tiếp theo cường độ ổn định tấp tểnh càng nhỏ.

Phương sai đem một trong những đặc thù sau:

  • $Var(c) = 0$ với $c$ là hằng số
  • $Var(cX) = c^2Var(X)$ với $c$ là hằng số
  • $Var(aX+b) = a^2Var(X)$ với $a, b$ là những hằng số
  • $Var(X+Y) = Var(X)+Var(Y)$ với $X, Y$ là độc lập

4.3. Độ chéo chuẩn

Vì đơn vị chức năng của phương sai là bình phương cho nên việc tính nhằm khớp với đơn vị chức năng của biến hóa tình cờ là bất khả nên người tao tiến hành thêm thắt định nghĩa độ chéo chuẩn (SD-standard deviation) vị căn bậc 2 của phương sai. $$\sigma(X)=\sqrt{Var(X)}$$

Từ trên đây người tao cũng rất có thể dùng $\sigma^2(X)$ nhằm thể hiện tại phương sai của biến hóa tình cờ $X$.

Lưu ý với chừng chéo chuẩn chỉnh tao cần lấy trị vô cùng của hằng số Lúc nhân vì thế chừng chéo chuẩn chỉnh cũng chính là ko âm:

  • $\sigma(cX)=|c|\sigma(X)$

4.4. Điểm chuẩn

Độ chéo chuẩn chỉnh được cho phép tao hiểu rằng cường độ phân nghiền khoảng của toàn cỗ tập dượt tài liệu tuy nhiên lại ko mang lại tao hiểu rằng cường độ phân nghiền của một điểm này cơ. Chính nên là tao thêm 1 thông số kỹ thuật nữa nhằm nhận xét đặc điểm này là điểm chuẩn (SC-Standard Score).

Đặt $\mu$ là kì vọng và $\sigma$ là chừng chéo chuẩn chỉnh thì điểm chuẩn chỉnh được xem như sau: $$z=\dfrac{x-\mu}{\sigma}$$

Từ công thức bên trên tao rất có thể thấy rằng $|z|$ thể hiện tại mang lại khoảng cách từ 1 điểm cho tới điểm khoảng của bám theo đơn vị chức năng là chừng chéo chuẩn chỉnh. Khi $z$ dương tao bảo rằng điểm cơ ở phía bên trên điểm khoảng, còn Lúc $z$ âm thì nó ở bên dưới điểm khoảng. Như vậy phụ thuộc vào điểm chuẩn chỉnh tao rất có thể hiểu rằng rằng 1 điều đem nằm trong vùng phổ cập Hay những ko và nằm tại địa điểm này đối với khoảng của toàn cỗ tập dượt hình mẫu.

Điểm chuẩn chỉnh còn được gọi là giá trị z (z-value), điểm z (z-score). Tôi thì hoặc gọi đặc điểm này là z-score bởi thói thân quen tuy nhiên thôi :)

4.5. Trung vị

Trung vị (median) là vấn đề chia đều cho 2 bên phần trăm trở thành 2 phần như thể nhau, kí hiệu là $med(X)$: $$P(X < med(X)) = P(X \ge med(X)) = 0.5$$

Như vậy trung vị là nghiệm của phương trình hàm thu thập xác suất: $F_X(x) = 0.5$

4.6. Moment (mô-men)

Là định nghĩa tổng quát mắng của kì vọng và phương sai. Một moment bậc $k$ so với $c$ được khái niệm như sau: $$m_k = E[(X-a)^k]$$

Nhận xét rằng:

  • Kỳ vọng là moment bậc 1 với $a=0$
  • Phương sai là moment bậc 2 với $a=E[X]$

Khi $a=E[X]$ người tao thông thường gọi là moment quy tâm, còn $a=0$ gọi là moment gốc. Vậy nên tao rất có thể gọi kỳ vọng là moment gốc bậc 1 và phương sai là moment quy tâm bậc 2.

5. Kết luận

Bài này đang được trình diễn về một định nghĩa đặc biệt cần thiết của phần trăm đo đếm là biến ngẫu nhiên - tương tự động tựa như các biến hóa nhập thiết kế rất có thể nhận một độ quý hiếm bất kì nằm trong ngôi trường số thực.

Cùng với này đó là những hàm phân phối phần trăm người sử dụng mang lại việc xác lập phần trăm của biến hóa tình cờ như:

Xem thêm: Công thức tìm tọa độ giao điểm của hai đường thẳng hay, chi tiết | Toán lớp 9.

  • Hàm phân phối thu thập (CDF): $F_X(x) = P(X \le x)$
  • Hàm khối phần trăm mang lại biến hóa tách rộc rạc (PMF): $p(x) = P(X=x)$
  • Hàm tỷ lệ phần trăm mang lại biến hóa liên tiếp (PDF): $f(x) = F^{\prime}(x)$

Phân phối phần trăm đem 2 đặc thù cần thiết là kỳ vọng (expectation) và phương sai (variance). Trong số đó kỳ vọng đặc thù mang lại điểm khoảng của biến hóa tình cờ, còn phương sai thể hiện tại mang lại cường độ phân nghiền phân phối xung quanh điểm khoảng cơ. Phương sai càng rộng lớn thì cường độ phân nghiền phân phối hoặc chừng cô động của biến hóa tình cờ càng rộng lớn.

Tuy nhiên nhập phần này tao mới mẻ chỉ phát biểu cho tới 1 biến hóa tình cờ một chiều ($X \in \mathbb R$). Nhưng nhập thực tiễn tao thông thường xuyên cần thao tác với tương đối nhiều biến hóa tình cờ đồng thời hoặc rất có thể xem là một biến hóa tình cờ nhiều chiều $X \in \mathbb R^n$. Ví dụ như giá bán căn nhà tùy theo diện tích S, địa điểm và thời hạn kiến tạo. Khi cơ nếu như tao tính phần trăm để sở hữ được một căn căn nhà bên dưới 1 tỉ thì rất cần được dùng cả 3 biến hóa tình cờ đặc thù mang lại diện tích S, địa điểm và thời hạn kiến tạo, hoặc rất có thể là một trong biến hóa tình cờ đem 3 chiều (diện tích; vị trí; thời hạn xây dựng). Việc phối hợp dùng biến hóa tình cờ nhiều chiều như thế sẽ tiến hành phát biểu ở nội dung bài viết cho tới.

Còn lúc này, nếu như đem vướng mắc hoặc gom ý gì thì nhớ rằng nhằm lại comment phía bên dưới cho bản thân nhé!

BÀI VIẾT NỔI BẬT


4 loại hộp số thông dụng trên ô tô người mua xe nên biết

Hộp số là một trong những bộ phận quan trọng nhất trong hệ thống truyền lực của ô tô. Trải qua hàng trăm năm đồng hành cùng sự phát triển của động cơ đốt trong, những loại hộp số mới đã ra đời, tân tiến và hiện đại hơn. Trong bài viết này, DanhgiaXe sẽ mang đến cho độc giả những thông tin cơ bản và hữu ích nhất về 4 loại hộp số đang được sử dụng phổ biến nhất trong ngành công ...

Tự tin giao tiếp tiếng Anh với cấu trúc "suggest"

Cấu trúc “suggest" được dùng nhiều trong văn nói và giao tiếp, dùng để gợi ý hoặc đề xuất cho ai đó làm việc gì. Tuy nhiên, nếu học sâu hơn, cấu trúc này còn có rất nhiều điều thú vị khác nữa.