วันพฤหัสบดีที่ 4 กันยายน พ.ศ. 2557

สถิติเชิงบรรยาย

สถิติเชิงบรรยาย (Descriptive statistics) เป็นสถิติที่ใช้ในการนำเสนอข้อมูล ของสิ่งที่เราสนใจ โดยมีการนำมาจัดให้เป็นระบบ เพื่อให้เข้าใจหรือสื่อความหมายได้มากยิ่งขึ้น สถิติประเภทนี้จะไม่มีการสรุปอ้างถิงไปยังกลุ่มประชากร
ตัวอย่างสถิติเชิงบรรยาย ได้แก่
1. การวัดค่าแนวโน้มสู่ศูนย์กลาง เช่น ค่าเฉลี่ย ค่าฐานนิยม และค่ามัธยฐาน
2. การวัดค่าการกระจาย เช่น ค่าพิสัย ค่าความแปรปรวน และค่าส่วนเบี่ยงเบนมาตรฐาน

3. การหารูปทรงของการกระจายของข้อมูล

วันพฤหัสบดีที่ 17 เมษายน พ.ศ. 2557

การเลือกเครื่องมือทางสถิติ สำหรับข้อมูลแบบค่าวัด และมีการแจกแจง แบบปกติ

การตัดสินใจเลือกเครื่องมือทางสถิติที่ใช้ในการวิเคราะห์ข้อมูล โดยข้อมูลได้มาอย่างสุ่ม
สำหรับ
          1. ข้อมูลแบบค่าวัด
          2. ข้อมูลมีการแจกแจง แบบปกติ
จำนวนกลุ่มและตัวแปรต้น
การวิเคราะห์
1) ข้อมูล 1 กลุ่ม ,
    
1 ตัวแปรต้น
1.1) สนใจค่าเฉลี่ยแตกต่างจาก
       ค่าคาดหวังหรือไม่ (
μ=x)
          -ทราบความแปรปรวน
            ใช้
1 sample z-test
          -ไม่ทราบความแปรปรวน
            ใช้
1 sample t-test
1.2) สนใจความแปรปรวน (σ1=x)
       ใช้ Chi-square test

2) ข้อมูล 2 กลุ่ม ,
   1 ตัวแปรต้น
2.1) สนใจค่าเฉลี่ย 2 กลุ่มแตก
       ต่างกันหรือไม่ (
μ1= μ2)
          -กลุ่มตัวอย่างเป็นอิสระต่อ
            กัน ใช้
2 sample t-test
          -กลุ่มตัวอย่างไม่เป็นอิสระ
            ต่อกัน ใช้
Paired T-test
2.2) สนใจความแปรปรวน
        (
σ1=σ2) ใช้ F-test
3) ข้อมูล > 2 กลุ่ม ,
    
1 ตัวแปรต้น
3.1) สนใจค่าเฉลี่ย 3 กลุ่มขึ้นไป
        แตกต่างกันหรือไม่
   
        (
μ1= μ2=…= μi)
        ใช้ 1 way ANOVA
3.2) สนใจความแปรปรวน
       (
σ1=σ2=…=σi)
       ใช้
Bartlett’s Test
4) ข้อมูล > 2 กลุ่ม ,
     ≥
2 ตัวแปรต้น
4.1) สนใจการพยากรณ์
       การหาสมการ
y=a+bx
       ใช้ Regression analysis
4.2) สนใจความสัมพันธ์ (ρ=0)
       ใช้ Correlation analysis
4.3) สนใจค่าเฉลี่ย 2 กลุ่ม และ 2
       ตัวแปรต้นขึ้นไปแตกต่างกัน
       หรือไม่
(μ1= μ2=…= μi)
       ใช้ 2 way ANOVA,
        GLM ANOVA

วันศุกร์ที่ 11 เมษายน พ.ศ. 2557

ทดสอบการกระจายแบบปกติ

วิธีที่ 1    นำข้อมูลที่ได้มาวาดกราฟ Histogram แล้วดูรูปทรงว่ามีลักษณะใกล้เคียงกับรูปทรงของการกระจายแบบปกติ (รูประฆังคว่ำสมมาตร) หรือไม่
วิธีที่ 2    นำข้อมูลที่ได้มาทดสอบการกระจายแบบปกติ (Normality test) โดยตั้งสมมุติฐาน ดังนี้
          H : ข้อมูลมาจากประชากรที่มีการกระจายแบบปกติ
          H1 : ข้อมูลไม่ได้มาจากประชากรที่มีการกระจายแบบปกติ
          ลักษณะของข้อมูล : ข้อมูลแบบระดับการวัดแบบช่วง (Interval data) หรืออัตราส่วน (Ratio data)

          การทดสอบการกระจายแบบปกติโดยการใช้โปรแกรม Minitab สามารถทำได้ 2 วิธี คือ
          วิธีที่ 1 ใช้ Graphical Summary
          วิธีที่ 2 ใช้ Normality test

การกระจายตัวแบบปกติ (Normal distribution)

การกระจายตัวแบบปกติ (Normal distribution) เป็นการกระจายตัวพื้นฐานที่มีการนำไปใช้มากที่สุดเพราะข้อมูลส่วนใหญ่มีการกระจายตัวแบบปกติ มีคุณสมบัติดังนี้

          1. มีลักษณะคล้ายระฆังคว่ำ
          2. โค้งจะเป็นรูปที่สมมาตร (Symmetry) นั้นคือ ถ้าพับตรงเส้นกึ่งกลาง เส้นโค้งจะทับกันพอดี
          3. ตำแหน่งตรงกลาง คือ ค่าเฉลี่ยของข้อมูล (μ)
          4. ปลายโค้งทั้ง 2 ข้างไม่สัมผัสฐานของโค้ง นั่นคือ ปลายโค้งจะมีขอบเขตอนันต์ (- ถึง)
          5. ลักษณะการกระจายของข้อมูลใต้โค้งจะมีพื้นที่ดังนี้
                   μ±1σ = 68.26%
                   μ±2σ = 95.44%
                   μ±3σ = 99.73%

ข้อกำหนดเบื้องต้นของวิธีการทดสอบสถิติ

ข้อกำหนดเบื้องต้นของวิธีการทดสอบสถิติแบบต่างๆ


ข้อกำหนดเบื้องต้น (Assumption)
Z-test
1-sample
t-test
Independent
t-test
Paired
t-test
ANOVA
(without replication)
ANOVA
(with replication)
1. ประชากรมีการกระจายแบบปกติ
2. ข้อมูลมีลักษณะการกระจายอย่างสุ่ม
3. ทราบความแปรปรวนของประชากร





4. ไม่ทราบความแปรปรวนของประชากร




5. ไม่ทราบความแปรปรวนของประชากรแต่ความแปรปรวนของประชากรของแต่ละกลุ่มตัวอย่างต้องไม่แตกต่างกัน




6. ใช้ทดสอบกลุ่มตัวอย่าง 1 หรือ 2 กลุ่ม





7. ใช้ทดสอบ 1 กลุ่มตัวอย่าง





8. ใช้ทดสอบ 2 กลุ่มตัวอย่าง (กรณีกลุ่มตัวอย่างเป็นอิสระกัน)



2 กลุ่มตัวอย่างขึ้นไป
2 กลุ่มตัวอย่างขึ้นไป
9. ใช้ทดสอบ 2 กลุ่มตัวอย่างที่มีความสัมพันธ์กันหรือได้มาจากกลุ่มตัวอย่างเดียวกัน





10. ตัวแปรตามที่มีการวัดซ้ำแต่ละครั้งมีความสัมพันธ์กัน





11. ขนาดของกลุ่มตัวอย่าง
30
<30
<30
<30


12. ระดับการวัดเป็นแบบช่วง (Interval data) หรืออัตราส่วน (Ratio data)

การเลือกเครื่องมือทางสถิติ สำหรับ ข้อมูลจำนวนนับ

สำหรับ
          1. ข้อมูลจำนวนนับ
          2. ข้อมูลได้มาอย่างสุ่ม


ลักษณะ
การนับ
จำนวนกลุ่มตัวอย่าง
การวิเคราะห์
1)นับจำนวน
และคำนวณค่าเป็นสัดส่วนได้
1.1) นับจำนวนต่อ 1 หน่วย
1.1.1) ข้อมูลมี 1 กลุ่ม
สนใจค่าสัดส่วนแตกต่างจากค่าคาดหมายหรือไม่ (p=x) ใช้ 1 Proportion test
1.1.2) ข้อมูลมี 2 กลุ่ม
สนใจค่าสัดส่วนของ 2 กลุ่มตัวอย่างแตกต่างกันหรือไม่ (p1=p2) ใช้ 2 Proportion test
1.2) นับจำนวนต่อหน่วยพื้นที่
1.2.1) ข้อมูลมี 1 กลุ่ม
สนใจอัตราส่วนแตกต่างจากค่าคาดหมายหรือไม่ (rate=x) ใช้ 1 Sample Poisson Rate
1.2.2) ข้อมูลมี 2 กลุ่ม
สนใจอัตราส่วนของ 2 ส่วนตัวอย่างแตกต่างกันหรือไม่ (rate1=rate2) ใช้ 2 Sample Poisson Rate
2)นับจำนวนและสนใจว่าตัวแปรหนึ่งมีผลต่ออีกตัวแปรหนึ่งหรือไม่
-
ข้อมูลตั้งแต่ 2 กลุ่มขึ้นไป
สนใจความสัมพันธ์ หรือทดสอบอัตราส่วนต้องสามารถจัดอยู่ในรูปแบบตาราง (Contingency table) ใช้ Chi-square test

การเลือกเครื่องมือทางสถิติ สำหรับข้อมูลแบบค่าวัดและมีการกระจายแบบอื่นๆ

สำหรับ
          1. ข้อมูลแบบค่าวัด
          2. ข้อมูลมีการกระจายแบบอื่น (ไม่สนใจว่าข้อมูลมีการกระจายแบบใด)

จำนวนกลุ่มและตัวแปรต้น
การวิเคราะห์
1) ข้อมูล 1 กลุ่ม
   , 
1 ตัวแปรต้น
1.1) สนใจค่ากลางแตกต่างจากค่า
       คาดหวังหรือไม่ (
Median=x)
       ใช้ 1 Sample Sign Test,
       1 Sample Wilcoxon Test
1.2) สนใจข้อมูลได้มาอย่างสุ่ม
        หรือไม่ ใช้
run test
2) ข้อมูล 2 กลุ่ม
   , 
1 ตัวแปรต้น
2.1) สนใจค่ากลาง 2 กลุ่มตัวอย่าง
       มีความแตกต่างกันหรือไม่
       (Median1=Median2)
       ใช้ Mann-Whitney Test
2.2) สนใจความแปรปรวน
      (σ1=σ2ใช้ Levene’s test
3) ข้อมูล>2 กลุ่ม
   ,
1 ตัวแปรต้น
3.1) สนใจค่ากลางมากกว่า 2 กลุ่ม
       ตัวอย่างมีความแตกต่างกัน
       หรือไม่
       (
Median1=Median2=…
        =Mediani)
       ใช้ Kruskal-Wallis Test,
       Mood’s Median Test
3.2) สนใจความแปรปรวน
      (σ1=σ2=…=σi)
       ใช้ Levene’s Test
4) ข้อมูล>2 กลุ่ม
   ,2
 ตัวแปรต้น
4.1) สนใจค่ากลางมากกว่า 2 กลุ่ม
       ตัวอย่างมีความแตกต่างกัน
       หรือไม่
       (Median1=Median2=…
       =Mediani)
       ใช้ Friedman Test

ระดับการวัดหรือมาตรวัดของข้อมูล

ระดับการวัดหรือมาตรวัดของข้อมูล แบ่งเป็น 4 ระดับคือ
           1. ระดับนามบัญญัติ (Nominal data)
เป็นการกำหนดลักษณะของข้อมูลออกเป็นกลุ่ม หรือประเภท โดยแต่ละประเภทไม่ได้มีลักษณะว่ามีค่ามากกว่าหรือน้อยกว่ากัน การวัดระดับนี้ถือว่าเป็นการวัดที่มีความละเอียดน้อยสุดเมื่อเทียบกับระดับอื่นๆ
ตัวอย่างข้อมูลระดับนามบัญญัติ เช่น
เพศ : ชาย, หญิง โดยอาจกำหนดให้
                     ชาย
=1 , หญิง =2
เชื้อชาติ : ไทย, จีน, ลาว
การสูบบุหรี่ : สูบ, ไม่สูบ
การจำแนกข้อมูลแบบนี้ไม่สามารถนำค่ามาคำนวณทางคณิตศาสตร์ได้
          2. ระดับเรียงอันดับ (Ordinal data)
          เป็นการกำหนดลักษณะข้อมูล โดยแบ่งออกเป็น กลุ่ม และสามารถบอกความแตกต่างระหว่างกลุ่มได้ ซึ่งลักษณะที่ใช้บอกความแตกต่างใช้หลักมากกว่าหรือน้อยกว่า เช่น การบอกความชอบว่าชอบอันไหนมากกว่ากัน ตัวอย่างเช่น สมศรีชอบสี 3 สีเรียงลำดับจากมากไปหาน้อย คือ สีขาว สีส้ม สีชมพู การแสดงข้อมูลแบบนี้จะไม่สามารถบอกได้ว่าชอบมากกว่า หรือน้อยกว่าแค่ไหน แต่จะใช้บอกลำดับ หรือตำแหน่งของสิ่งที่เราสนใจเท่านั้น
          3. ระดับช่วง (Interval data)
          เป็นการวัดรายละเอียดที่แตกต่างกันของตัวแปร โดยค่าที่ได้ออกมาเป็นตัวเลข และสามารถบอกความแตกต่างได้ว่า มีค่ามากกว่าหรือน้อยกว่าเท่าไร การวัดเป็นระดับช่วงสามารถเอาตัวเลขมาคำนวณทางคณิตศาสตร์ได้ แต่ระดับการวัดแบบระดับช่วงจะมีค่าของเลขศูนย์เป็นค่าที่กำหนดขึ้นเองไม่ได้เป็น ค่าศูนย์ที่แท้จริง หรือเรียกว่าเป็น Relative Zero การที่มีค่าเป็นศูนย์ไม่ได้แทนว่า ไม่มีค่าแต่จะเป็นจุดเริ่มต้นที่เรากำหนดขึ้น ตัวอย่างเช่น อุณหภูมิ ระดับสติปัญญา
          4. ระดับอัตราส่วน (Ratio data)
          เป็นการวัดระดับที่เหมือนกับการวัดระดับช่วง แต่การวัดแบบอัตราส่วนมีค่าศูนย์ที่แท้จริง นั่นคือไม่มีค่า หรือไม่มีสิ่งนั้นอยู่เลย ตัวอย่างเช่น อายุ รายได้

วันพฤหัสบดีที่ 10 เมษายน พ.ศ. 2557

ตัวแปรต้นและตัวแปรตาม

ตัวแปรคือ สิ่งที่เราสนใจจะศึกษา ตัวแปรจะเป็นสิ่งที่สามารถวัดได้นับได้ หรือแจกแจงได้ ตัวแปรแบ่งเป็น 2 ประเภท

          1. ตัวแปรต้น คือ สิ่งที่เป็นสาเหตุให้เกิดผลต่างๆ
              (บางครั้งเรียกว่า ตัวแปรอิสระ หรือ ตัวแปรสาเหตุ)
              “Dependent variable”

          2. ตัวแปรตาม คือ สิ่งที่เป็นผลอันเนื่องมาจาก
              ตัวแปรต้น
              (บางครั้งเรียกว่า ตัวแปรผล หรือ ตัวแปรพยากรณ์)
              “Independent variable”


วันเสาร์ที่ 22 มีนาคม พ.ศ. 2557

วัตถุประสงค์ของการใช้สถิติ

วัตถุประสงค์หลักๆของการใช้สถิติ เพื่อ...
  1. การวิเคราะห์ข้อมูลเบื้องต้น เป็นสถิติเชิงบรรยาย เช่น ค่าเฉลี่ย ค่าสูงสุด ค่าต่ำสุด ค่าพิสัย เป็นต้น
  2. การประมาณค่า (Estimation) เช่นใช้ค่าสถิติ(จากที่เก็บจากกลุ่มตัวอย่าง) ในการประมาณค่าพารามิเตอร์
  3. การทดสอบสมมุติฐาน (Hypothesis testing) เป็นการทดสอบข้อสงสัยอย่างมีความน่าเชื่อถือ
  4. การหาความสัมพันธ์ (Correlation) ใช้อธิบายรูปแบบหรือลักษณะความสัมพันธ์ของข้อมูล
  5. การพยากรณ์ (Prediction or Forecasting) ใช้หารูปแบบความสัมพันธ์จากข้อมูลแล้วนำมาสร้างเป็นตัวแบบหรือสมการที่ใช้ในการทำนายค่า

ค่าพารามิเตอร์และค่าสถิติ

ค่าพารามิเตอร์ (Parameter) คือตัวเลขที่คำนวณได้จากประชากร เพื่ออธิบายลักษณะบางอย่างของประชากร

ค่าสถิติ (Statistics) คือ ตัวเลขที่คำนวณได้จากกลุ่มตัวอย่าง ใช้แสดงลักษณะบางอย่างของกลุ่มตัวอย่างที่เก็บมาได้  ซึ่งค่าสถิติใช้เป็นตัวประมาณค่าพารามิเตอร์

วันอังคารที่ 18 มีนาคม พ.ศ. 2557

ประชากรกับกลุ่มตัวอย่าง

ประชากร (Population) คือ ข้อมูล กลุ่มคน กลุ่มสิ่งของทั้งหมดที่ทำการศึกษา

กลุ่มตัวอย่าง (Sample) คือ ส่วนหนึ่งของประชากรที่ถูกเลือกขึ้นมาเพื่อศึกษา โดยกลุ่มตัวอย่างจะถูกสุ่มจากประชากรที่สนใจ หรือเรียกว่าได้มาจากการสุ่มตัวอย่าง

วันจันทร์ที่ 10 มีนาคม พ.ศ. 2557

สถิติ

รวบรวมสถิติที่ใช้เพื่องานวิจัยด้านการยศาสตร์