Sie sind auf Seite 1von 36

CHỌN MẪU VÀ

TÍNH TOÁN CỠ MẪU

TS. Hà Anh Đức


Mục tiêu bài giảng
 Hiểu các lý do phải chọn mẫu
 Nắm được các phương pháp chọn mẫu
 Phân biệt giữa các phương pháp chọn
mẫu ngẫu nhiên và không ngẫu nhiên
 Nắm được ưu, nhược điểm các phương
pháp chọn mẫu
Mẫu là gì
 Mẫu là tập hợp nhỏ các đối tượng (kỳ vọng
mang tính đại diện) từ quần thể sử dụng để xác
định sự thật của một quần thể (Field 2005);
 Lý do phải chọn mẫu
 Nguồn lực (thời gian, tài chính) và khối lượng công
việc
 Cung cấp kết quả với độ chính xác có thể tính bằng
phương pháp toán học
Lý do phải chọn mẫu?
 Nếu tất cả các cả thể của một quần thể đều
giống nhau, chúng ta có một quần thể thuần
nhất (homogenous). Khi đó, đặc tính của mỗi
cá thể cũng chính là của quần thể. Không có sự
khác nhau/ giao động tính chất giữa các cá thể.
Lý do phải chọn mẫu?
 Nguồn lực (thời gian, tài chính) và khối lượng công việc
 Cung cấp kết quả với độ chính xác có thể tính bằng
phương pháp toán học
 Quần thể hỗn tạp/ không thuần nhất (heterogeneous
 Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát
được tất cả các cá thể, người ta phải chọn một số lượng
cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các
cá thể của quần thể để quan sát.
Chọn mẫu
 Quần thể quan tâm là gì?
 Bạn muốn minh họa kết quả nghiên cứu cho
quần thể nào?
 Sinh viên,
 Bác sỹ;

 Phụ nữ 15-59

 Có thể chọn cả quần thể không?


Minh họa việc chọn mẫu?
Là cái Là cái mà
chúng ta Quần thể chúng ta
muốn biết quan sát

Chọn mẫu
Mẫu

Suy ra

Sử dụng dữ liệu/ thông tin của một số ít


tiếp cận được để nói về số đông mà
không thể tiếp cận hết
Yêu cầu việc chọn mẫu?
 Mẫu của một quần thể phải suy ra được những thông
tin hữu ích về quần thể đó. Do vậy, mẫu phải đảm bảo
có được những biến thiên cơ bản giữa các cá thể như
ở quần thể.
 Một quần thể càng không đồng nhất…
 Thì sác xuất một mẫu khó có thể mô tả quần càng lớn 
Sẽ là một sai lầm nếu suy đặc tính của mẫu thành đặc tính
của quần thể.
 Và…
 Thì số lượng cá thể của mẫu phải càng lớn để có thể mô
tả quần thể tốt  Một mẫu phải có số lượng cá thể đủ lớn
để cho thể suy đặc tính của mẫu thành của quần thể
Định nghĩa và phân loại chọn mẫu

 Chọn mẫu là một quy trình lựa chọn cá thể từ quần


thể cho quan sát, để có thể coi kết quả quan sát mẫu
thành kết quả quan sát quần thể, ở một mức độ chấp
nhận mà xác định được.
 Mẫu là đại diện của một quần thể. Mức độ đại diện phải
được xác định/ đo lường được.

 Có hai cách chọn mẫu:


 Chọn mẫu không ngẫu nhiên
 Chọn mẫu ngẫu nhiên
Các khái niệm cơ bản
 Toàn thể: Là tập hợp lý thuyết của tất cả các cá thể, không xác
định không gian và thời gian
 Quần thể: Là tập hợp lý thuyết của tất cả cá thể theo một đặc
tính, trong một khoảng không gian và thời gian xác định.
 Mẫu/ quần thể quan sát được: Là tập hợp một số lượng cá
thể, lựa chọn từ một quần thể trên một đặc tính mẫu quan tâm.
 Đặc tính mẫu: Là cơ sở để xác định, lựa chọn cá thể của quần
thể vào một mẫu, có số lượng cá thể ít hơn, ví dụ cá thể một
quần thể người có thể là cá thể người, hộ gia đình, làng/ xóm
 Danh sách/ khung mẫu: Là danh sách các cá thể của một
quần thể, giúp hỗ trợ kỹ thuật cho quá trình chọn mẫu
 Cỡ mẫu: Là số lượng cá thể được lựa chọn từ một số lượng
xác định/ không xác định cá thể của quần thể vào một tập hợp
mẫu.
 Sức mạnh mẫu: Là mức độ suy diễn kết quả thống kê trên mẫu
thành kết quả của quần thể
Quy trình chọn mẫu
 Xác định quần thể quan sát
 Xác định khung mẫu;
 Xác định phương pháp lựa chọn mẫu
 Xác định cỡ mẫu
 Triển khai kế hoạch
 Chọn mẫu và thu thập
 Rà soát quá trịnh chọn mẫu
Phân loại phương pháp chọn mẫu

Chọn mẫu

Không ngẫu
Ngẫu nhiên
nhiên

Hệ thống Phân tầng Thuận tiện Ném bóng


tuyết

Ngẫu nhiên
Theo cụm Chủ đích Chỉ tiêu
đơn
Chọn mẫu ngẫu nhiên
 Áp dụng khi quần thể nhỏ, khá thuần nhất
 Đảm bảo mỗi cá thể của quần thể được lựa
chọn với xác suất như nhau vào mẫu
 Ghép cặp mỗi cá thể với một số ngẫu nhiên,
các cá thể được lựa chọn theo sự ngẫu
nhiên của con số.

Cỡ mẫu
Sác xuất lựa chọn =
Tổng số cá thể của quần thể
Chọn mẫu ngẫu nhiên đơn

Khoảng cách giữa các cá thể là ngẫu nhiên, không có quy luật nào
 Ưu điểm
 Không cần nhiều thông tin về quần thể
 Tính gía trị cao, xác định được sai số thống kê
 Dễ dàng phân tích dữ liệu
 Hạn chế
 Yêu cầu danh sách cá thể trong quần thể
 Không khả thi nếu khung mẫu lớn
 Không cần chuyên môn của nghiên cứu viên
 Chọn mẫu hệ thống
 Cá thể đầu tiên được lựa chọn ngẫu nhiên
trong quần thể, các cá thể tiếp theo được
lựa chọn theo một khoảng cách xác định
(10th) so với cá thể trước đó. Khoảng
cách xác định được gọi là khoảng cách
mẫu k = Tổng số cá thể của quần thể/ cỡ
mẫu
Chọn mẫu hệ thống

Khoảng cách giữa các cá thể bằng nhau


 Mang tính quy luật
 Ưu điểm
 Chi phí hợp lý, hay được sử dụng
 Tính gía trị cao, xác định được sai số thống kế
 Các cá thể dễ tiếp cận
 Hạn chế
 Sai số chu kỳ do bản thân danh sách cá thể
cũng có thể có tính chu kỳ
 Yêu cầu danh sách cá thể của quần thể
 Chọn mẫu phân tầng

Chia quần thể theo một đặc tính cụ thể thành các nhóm/
tầng (strata) (Ví dụ: Chia quần thể lớp cao học thành 3
nhóm/ tầng: Nội tiêu hóa, tim mạch, sản).
Các cá thể trong mỗi tầng đồng nhất, nhưng không đồng
nhất giữa các tầng.

Có thể áp dụng chọn mẫu ngẫu nhiên đơn hay chọn mẫu
hệ thống ở mỗi tầng (strata). Số mẫu mỗi tầng tham gia
vào tổng mẫu có thể bằng nhau (chọn mẫu phân tầng
không cân xứng) hay tỷ lệ với số cá thể của mỗi tầng
(chọn mẫu phân tầng cân xứng)
Chọn mẫu phân tầng không cân xứng

1000 1000

Tầng 1 Tầng 2

N= 2000 N = 6000
Chọn mẫu phân tầng cân xứng

1000 3000

Tầng 1 Tầng 2

N= 2000 N = 6000
 Ưu điểm
 Đảm bảo mỗi nhóm đều có tính đại diện trong
tổng mẫu
 Mỗi nhóm đều được thống kê và so sánh
 Giảm sai số hệ thống
 Hạn chế
 Yêu cầu thông tin chính xác về tỷ lệ giữa các
tầng
 Chi phí để có được danh sách mỗi tầng
 Chọn mẫu theo cụm/ chùm
 Là một ví dụ của chọn mẫu 2 bước
 Bước 1: Chọn cụm thường là cụm địa lý
nơi các các thể sinh sống.
 Bước 2: chọn cá thể trong cụm.

 Phương pháp hay được sử dụng khi


không có danh sách cá thể của quần thể
 Ưu điểm
 Chí phí thấp do không phải xây dựng danh sách mẫu, ít đi
lại
 Không yêu cầu danh sách cá thể của cả quần thể, chỉ yêu
cầu danh sách cụm, tiểu cụm, tiểu tiểu… cụm, và danh
sách cá thể của đơn vị cụm cuối cùng
 Xác định được đặc điểm của cả cụm và quần thể
 Ưu tiên dùng khi quần thể quá lớn, ví dụ như cả một quốc
gia.
 Thường sử dụng đánh giá chương trình TMCR
 Hạn chế
 Sai số lớn hơn so với các phương pháp ngẫu nhiên khác
So sánh 2 phương pháp chọn mẫu

Chọn mẫu phân tầng Chọn mẫu chùm


 Không lặp lại  Chọn không lặp lại
 Tất cả các tầng đều có  Chỉ một bộ phận trong
trong mẫu chùm có trong mẫu
 Tốt nhất cho các nghiên  Tốt nhất cho các nghiên
cứu khi các cá thể trong cứu khi các cá thể trong
cùng 1 tầng thuần nhất cùng 1 tầng thuần nhất
Phân loại các phương pháp
chọn mẫu
Chọn mẫu

Không ngẫu
Ngẫu nhiên
nhiên

Hệ thống Phân tầng Thuận tiện Ném bóng


tuyết

Ngẫu nhiên
Theo cụm Chủ đích Chỉ tiêu
đơn
Chọn mẫu không ngẫu nhiên
 Chọn mẫu thuận tiện
 Cá thể được lựa chọn vào mẫu một cách
“thuận tiện”, sẵn có và dễ tiếp cận.
 Lý do lựa chọn: nhanh và chi phí thấp

 Phải giải trình và đánh giá giá trị nếu


chọn mẫu thuận tiện.
 Ưu điểm
 Chi phí thấp
 Hay được sử dụng

 Không cần danh sách cá thể trong quần


thể
 Hạn chế
 Độ biến thiên và sai số không đo lường
và kiểm soát được.
 Khó giải trình việc suy luận kết quả thống
kê trên mẫu ra của quần thể.
Chọn mẫu có chủ đích
 Chọn cá thể có một số đặc tính mong muốn vào
mẫu với chủ đích của nghiên cứu viên.
 Ưu điểm
 Chi phí vừa phải
 Hay được sử dụng
 Mẫu lựa chọn đảm bảo được mục tiêu
 Hạn chế
 Sai số!
 Khó giải trình việc suy luận kết quả thống kê
trên mẫu ra của quần thể.
 Chọn mẫu theo chỉ tiêu
 Mẫu đảm bảo đặc tính của quần thể, đại
diện ở một mức độ mà nghiên cứu viên
mong muốn
 Ưu điểm
 Chi phí vừa phải
 Rất hay sử dụng

 Không yêu cầu danh sách cá thể trong


quần thể
 Có phần nào tính chất của chọn mẫu
phân tầng
 Hạn chế
 Không đo lường và giải trình được biến
thiên và sai số
 Chọn mẫu “Ném bóng tuyết“
(Snowball sampling)
 Chọn mẫu bắt đầu từ một cá thể, được
chọn một cách ngẫu nhiên hay không
ngẫu nhiên. Các cá thể tiếp theo được
chọn từ cá thể ban đầu hay trước đó.
 Ưu điểm
 Chi phí thấp
 Hữu ích trong một số trường hợp cụ thể

 Dùng để xác định những quần thể hiếm

 Hạn chế
 Sai số do cá thể lựa chọn không hoàn
toàn độc lập
 Khó giải trình việc suy diễn kết quả thống
kê trên mẫu ra của quần thể.
Tính toán cỡ mẫu
 Thông tin/ dữ liệu cần thiết
 Loại nghiên cứu
 Các thuật toán thống kê sử dụng
 Đặc tính của cá thể - Thể hiện qua biến số (khác biệt cơ
bản giữa biến liên tục – biến phân hạng). Kết quả các
nghiên cứu trước được đưa vào làm cơ sở tính toán
 Độ tin cậy (95%, 90%)

 Gía trị p chấp nhận kết quả kiểm định (0,05/ 0,001)
 Mức độ biến thiên của kết quả mẫu so với kết quả thực
của quần thể (độ chính xác tương đối)
 Sức mạnh của mẫu nói lên mức độ kết quả mẫu đại
diện cho kết quả của quần thể
Tính toán cỡ mẫu
 Tính toán cỡ mẫu đơn giản:
 Dựa vào công thức cơ bản,
 Không tính đến thiết kế nghiên cứu,
 Không tính đến các thuật toán thống kê sử
dụng trong thiết kế
 Tính toán đơn giản, bằng máy calculator
thông thường
 Thường không chính xác, chỉ có tính chất giải
trình đủ đề mục chọn mẫu và tính cỡ mẫu
trong đề cương hay báo cáo nghiên cứu.
Tiêu chí ước lượng cỡ mẫu dựa trên thiết kế
nghiên cứu
NC Mô tả NC Phân tíc và thử nghiệm
- Mục tiêu: Ước lượng tham số - Mục tiêu: chứng minh giả thuyết
- Khung: phân bố mẫu - Khung: power analysis
- B1: xác định các biến số nghiên - B1: xác định giả thuyết
cứu chính - B2: xác định phương pháp thông kê
- B2: xác định loại hình ước lượng để chứng minh giả thuyết
của biến số (trung bình, tỷ lệ) - B3: lựa chọn xác định quần thể
- B3: xác định quần thể quan tâm quan tâm
- B4a: chỉ ra giá trị kỳ vọng của quần - B4a: Chỉ ra giá trị kỳ vọng về sự
thể khác biệt giả định
- B4b: Ước lượng SD
- B5: Quyết định mức CI
- B6: quyết định mức độ chính xác
- Tính toán cỡ mẫu

Das könnte Ihnen auch gefallen