การกระจายแบบสุ่ม ควบคุมความน่าจะเป็น

การกระจายแบบสุ่ม ควบคุมความน่าจะเป็น

ลักษณะของลอตเตอรีจะสุ่มแจก แต่มีการกระจายอย่างไร? แนะนำแนวคิดของตัวแปรสุ่มก่อน: หมายถึงภายใต้เงื่อนไขชุดเดียวกันหากการทดลองแต่ละครั้งอาจได้ผลลัพธ์ดังกล่าว และแสดงรายการผลลัพธ์ทั้งหมดนั่นคือแสดงรายการค่าที่เป็นไปได้ของ X, X, X2, … , Xn

และค่าที่เป็นไปได้มีความน่าจะเป็น P (X,), P (X2), P (X3) … P (Xn) จากนั้น X เรียกว่าตัวแปรสุ่มของ P (X) และ P (X) เรียกว่าฟังก์ชันแนวความคิดของตัวแปรสุ่ม X

เนื่องจากค่าทั้งหมดของตัวเลขในแต่ละลำดับของลอตเตอรีสามารถแสดงรายการได้ ดังนั้นเราจึงเรียกมันว่าตัวแปรสุ่มแบบไม่ต่อเนื่อง

มันมีรูปแบบการกระจายที่แตกต่างกันมากมาย การแจกแจงที่เกี่ยวข้องกับการเลือกหมายเลขลอตเตอรีมากที่สุดคือการแจกแจงแบบสม่ำเสมอและการแจกแจงแบบทวินาม

  1. กระจายอย่างสม่ำเสมอ

การแจกแจงแบบสม่ำเสมอหมายความว่าสามารถแสดงผลลัพธ์ที่เป็นไปได้ทั้งหมด และความน่าจะเป็นของแต่ละผลลัพธ์จะเท่ากัน การแจกแจงแบบสม่ำเสมอเป็นการกระจายที่สำคัญที่สุดในการวิเคราะห์หมายเลขลอตเตอรี่ มันบอกเราตามความเป็นจริง นั่นคือหากมั่นใจว่ามีขนาดตัวอย่างเพียงพอโอกาสที่ตัวเลขแต่ละตัวจะปรากฏจะเท่ากันโดยประมาณ นั่นคือความน่าจะเป็นของตัวเลขที่แน่นอนที่ปรากฏในแต่ละตำแหน่งของลอตเตอรีแบบดั้งเดิมคือ 1 / W ความน่าจะเป็นของลูกบอลแต่ละลูกที่ปรากฏในชุดรูปแบบคือ 1/36

  1. การแจกแจงทวินาม

การแจกแจงแบบทวินามเป็นหนึ่งในการแจกแจงความน่าจะเป็นที่พบบ่อยที่สุดสำหรับตัวแปรสุ่มแบบไม่ต่อเนื่อง แล้วการแจกแจงทวินามคืออะไร ก่อนอื่นให้ฉันพูดถึงสิ่งต่อไปนี้ที่เรียกว่าการทดสอบ Bernoulli การทดสอบ Bernoulli หมายถึงการทดสอบซ้ำที่เป็นอิสระโดยมีลักษณะดังต่อไปนี้:

(1) การทดสอบประกอบด้วยการทดสอบที่เหมือนกัน n เช่นในการจับสลากกีฬาคอมพิวเตอร์แบบดั้งเดิมตัวเลขที่ปรากฏในแต่ละประเด็นของแต่ละอันดับจะถูกเขย่าทั้งหมดในเครื่องเดียวกัน

(2) มีเพียงสองผลลัพธ์ที่เป็นไปได้สำหรับการทดสอบแต่ละครั้ง: สำเร็จหรือล้มเหลว ความสำเร็จหรือความล้มเหลวในที่นี้เป็นเรื่องกว้าง ๆ ตัวอย่างเช่นการจับสลากกีฬาคอมพิวเตอร์แบบดั้งเดิมประสบความสำเร็จเดาหมายเลขหรือไม่สามารถเดาหมายเลขในแต่ละตำแหน่ง

(3) ความน่าจะเป็นของความสำเร็จ p จะเท่ากันทุกครั้งและความน่าจะเป็นของความล้มเหลว q ก็คงที่เช่นกัน ตัวอย่างเช่นในการจับสลากกีฬาคอมพิวเตอร์แบบดั้งเดิมความน่าจะเป็นที่จะประสบความสำเร็จในแต่ละตำแหน่งคือ 1/10 (1 ใน 10 หมายเลข) ความน่าจะเป็นของความล้มเหลวคือ 9/10 และ p + q = 1

(4) การทดสอบเป็นอิสระจากกันและจำนวนลูกบอลหลังจากการจับสลากแต่ละครั้งจะไม่มีผลต่อผลลัพธ์ของช่วงเวลาถัดไป

(5) สามารถนับความสำเร็จหรือความล้มเหลวของการทดสอบได้นั่นคือผลการทดสอบสอดคล้องกับตัวแปรสุ่มแบบไม่ต่อเนื่อง

ให้ X แทนจำนวนเหตุการณ์ที่เกิดขึ้น A ในการทดลองอิสระซ้ำ ๆ n การได้ P [X = X] – X 2 0, 1, 2 … , n ไม่ใช่เรื่องยาก

เห็นได้ชัดว่า P [X = X] —X = 0, 1,2 …

โปรดสังเกตว่ามันเป็นคำ x + 1 ในการขยายทวินาม (P + q) n ดังนั้นเราจึงเรียกตัวแปรสุ่ม X เพื่อปฏิบัติตามการแจกแจงทวินามและพารามิเตอร์คือ n, p และแสดงเป็น X ~ B (n, p)

ในหมู่พวกเขาแสดงถึงชุดขององค์ประกอบ X ที่สกัดจากองค์ประกอบ n สูตรการคำนวณคือ: C xx สมมติว่าความน่าจะเป็นคือ P (0 <p <l) ดังนั้นความน่าจะเป็นของการเกิด X ครั้งใน n การทดลองคือ:C xx px (1 -P)n-k

ตราบใดที่การสุ่มตัวอย่างของสลากกินแบ่งกีฬาคอมพิวเตอร์แบบเดิมไม่เปลี่ยนแปลงเครื่องแสดงว่าเป็นไปตามข้อกำหนดของการทดสอบ Bernoulli สามารถใช้การแจกแจงแบบทวินามเพื่อวิเคราะห์

แม้ว่าผลการจับฉลากแต่ละครั้งจะไม่มีผลต่อการจับฉลากครั้งต่อไป แต่บอลแรกที่เล่นในช่วงเวลาเดียวกันจะไม่ใส่ลงในเครื่อง จากนั้นจะส่งผลกระทบอย่างหลีกเลี่ยงไม่ได้ต่อการผลิตตัวเลขต่อไปนี้ การสุ่มตัวอย่างโดยไม่มีการแทนที่ด้วยความน่าจะเป็น ขณะนี้เงื่อนไขการทดสอบมีความแตกต่างกันอยู่แล้ว ดังนั้นจึงไม่สามารถใช้การแจกแจงแบบทวินามโดยตรงได้ การแจกแจงนี้ยังเป็นการแจกแจงความน่าจะเป็นที่สำคัญมากเรียกว่าการแจกแจงแบบไฮเปอร์จีโอเมตริก

เราสามารถใช้การตรวจสอบการสุ่มตัวอย่างในผลิตภัณฑ์เพื่อสมมติ สมมติว่ามีผลิตภัณฑ์ที่มีข้อบกพร่อง M ในผลิตภัณฑ์ N นั่นคืออัตราความบกพร่อง p = M / N สุ่มเลือก n ชิ้นจากผลิตภัณฑ์เพื่อตรวจสอบและพบว่า X ชิ้นไม่มีคุณสมบัติ จะเห็นได้ว่าฟังก์ชันความน่าจะเป็นของ x คือ P (X = k) = C (k, M) x C (nk, N- M) / C (n, N), k = maX | 0, n-N + M |, นาที | n, M | ตัวแปรสุ่ม X นี้มักเรียกว่าการแจกแจงแบบไฮเปอร์จีโอเมตริก

เมื่อพิจารณาว่าในสถานการณ์จริงมีการทดลองน้อยมากที่ดำเนินการภายใต้เงื่อนไขเดียวกันทุกประการ สำหรับปัญหาในการสุ่มตัวอย่างตราบใดที่ขนาดของตัวอย่างตรงตามที่กำหนดจะไม่มีการเปลี่ยนทดแทนเช่นเดียวกับการเปลี่ยน การสุ่มตัวอย่างโดยไม่มีการเปลี่ยนจะอยู่ในช่วงเวลาเดียวกันเท่านั้น ระหว่างช่วงเวลาเป็นเหตุการณ์ที่เป็นอิสระโดยยังคงสุ่มตัวอย่างโดยไม่มีการแทนที่ ดังนั้นเราจึงวิเคราะห์หมายเลขที่ชนะลอตเตอรีโดยยังคงใช้การแจกแจงทวินามและการแจกแจงแบบสม่ำเสมอเป็นหลัก

จะใช้การแจกแจงแบบทวินามได้อย่างไร? ยกตัวอย่างงานเลี้ยงวันเกิดแบบคลาสสิก พิจารณาจาก 365 วันต่อปีหากเราแน่ใจว่ามีคนอย่างน้อยสองคนในกลุ่มหนึ่งมีวันเกิดเดียวกัน ต้องการคนกี่คน? ไม่ใช่เรื่องยากสำหรับทุกคนที่จะได้รับผลลัพธ์ 366 คนตราบใดที่มีมากกว่า 365 คนต้องมีคนที่มีวันเกิดเดียวกันแต่ลองคิดดูว่าถ้ามีคน 60 คนในชั้นเรียน ความน่าจะเป็นที่บางคนมีวันเกิดเดียวกันคืออะไร? เราอาจคิดประมาณ 20% ~ 30% ทุกอย่างผิดจริง! เป็นไปได้ 90% ค่าตัวแทนบางส่วนแสดงอยู่ด้านล่าง

จำนวนคน    ความน่าจะเป็นที่คนอย่างน้อยสองคนมีวันเกิดเดียวกัน

10            0. 12

20            0.41

23            0.51

30            0.70

57            0.90

366          1.0

ดังที่เห็นได้จากตารางด้านบน 366 คนจะต้องแน่ใจ 100% ว่ามีคนเกิดวันเดียวกันอย่างน้อย 2 คน และด้วยความมั่นใจ 90% ว่าอย่างน้อยสองคนมีวันเกิดเดียวกันจำเป็นต้องมีเพียง 57 คนเท่านั้น คุณอาจสงสัยว่าจะมีผลเช่นนี้ได้อย่างไร อันที่จริงนี่คือผลกระทบอันทรงพลังที่แสดงโดยการวิเคราะห์ความน่าจะเป็น นำไปใช้ในตลาดลอตเตอรีก็มีผลเช่นกัน

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *