SlideShare uma empresa Scribd logo
1 de 39
Baixar para ler offline
Phần 3 – Những phân tích căn bản trong SPSS
10 – Lựa chọn kỹ thuật thống kê phù hợp
Hoàng Sĩ Thính
Học viện Nông nghiệp Việt Nam
Mobile: 0942293689
Email: Sithinhdf@gmail.com
Facebook: Jamesunimelb@yahoo.com
1. Sự cần thiết phải chọn đúng kỹ thuật thống kê
• Một trong những việc khó nhất đối với người nghiên cứu là chọn đúng kỹ
thuật thống kê để phân tích số liệu
• Việc lựa chọn kỹ thuật thống kê tùy thuộc vào câu hỏi nghiên cứu mà bạn
đang phải trả lời, và đặc điểm số liệu bạn có
• Vì vậy, là một người nghiên cứu, bạn cần có những hiểu biết căn bản về
các kỹ thuật thống kê, các dạng câu hỏi phù hợp với các kiểu kỹ thuật
thống kê, các giả định và yêu cầu của từng kỹ thuật thống kê.
• Làm cách nào để hiểu được các điều trên??? Hãy đọc sách, bài báo…
• Việc quyết định lựa chọn một kỹ thuật thống kê cũng giống như quyết
định làm một món ăn. Bạn cần quan tâm đến hai điều: bạn đang có gì
(what you have) và bạn muốn mốn gì với những gì mình có (what you
want).
2. Khái quát chung về các kỹ thuật thống kê
sử dụng trong nghiên cứu
Tổng quát, các kỹ thuật thống kê được chia làm hai loại: các kỹ thuật
phân tích mối quan hệ giữa các biến (vd: giữa tuổi và độ lạc quan); và
các kỹ thuật so sánh khác biệt giữa các nhóm (vd: khác biệt về mức
độ lạc quan giữa nam và nữ)
3. Kỹ thuật phân tích quan hệ giữa các biến liên tục
(Exploring relationship)
1. Kỹ thuật phân tích tương quan (Correlation): Pearson correlation hoặc
Spearman correlation được sử dụng để phân tích mối quan hệ (cả độ
mạnh – strength, và xu hướng – direction) giữa hai biến liên tục. Chủ
đề này được cover trong Chapter 11
2. Kỹ thuật phân tích tương quan từng phần (Partial correlation): là một
dạng mở rộng của Pearson Correlation. Kỹ thuật này cho phép loại bỏ
ảnh hưởng của một biến ngoại sinh (vd: biến lạm phát có thể làm cho
phân tích tăng trưởng kinh tế trở nên mơ hồ). Nội dung này được
phân tích kỹ trong chương 12
3. Phân tích hồi quy bội (hồi quy đa biến – Multiple Regression):
– Là dạng mở rộng phức tạp của phân tích tương quan.
– Kỹ thuật này cho phép phân tích ảnh hưởng (khả năng dự báo) của
một nhóm các biếnđộc lập tới một biến phụ thuộc liên tục.
– Kỹ thuật này được chi tiết ở Chapter 13
3. Kỹ thuật phân tích quan hệ giữa các biến liên tục
(Exploring relationship)
4. Phân tích nhân tố (factor analysis):
– kỹ thuật này cho phép chuyển một số lượng biến lớn (hoặc một số
lượng lớn các thành phần của một biến) thành một số lượng biến nhỏ
hơn (hoặc một số lượng nhỏ hơn các thành phần của biên – chỉ tiêu
nghiên cứu). Tại sao??? Để tạo ra một tập hợp các biến (hoặc nhóm
thành phần của biến) có ý nghĩa hơn
– Việc gộp biến (nhóm các thành phần biến) được thực hiện như thế
nào? Bằng cách phân tích đặc điểm tương quan, từ đó tìm ra các
nhóm biết (nhóm thành phần biến) có tương quan rất mạnh. Các
nhóm này sau đó sẽ được gộp thành một biến (hoặc một thành phần
của biến)
– Kỹ thuật này thường được sử dụng để phát triển một chỉ tiêu nghiên
cứu (chỉ tiêu mới)
3. Kỹ thuật phân tích quan hệ giữa các biến liên tục
(Exploring relationship)
1. Có thể sử dụng phân tích “Chi Square Test for Relatedness or
Independence”.
Ví dụ: bạn muốn xem liệu giới tính (biến gender – biến catigorical) có ảnh
hưởng đến tỷ lệ người từ bỏ một phương thức trị bệnh (Drop out/ Continue).
2. Phân tích sự khác biệt (Discriminant function analysis):
– Phân tích khả năng dự đoán dựa trên một tập biến độc lập đối với một
biến categorical phụ thuộc
– Điều đó cũng như bạn muốn tìm ra những biến có ảnh hưởng quyết
định đến tình trạng phân loại nhóm của biến phụ thuộc (group
membership)
– Biến phụ thuộc thường là các tiêu chí rõ ràng (vd: passed/ failed;
dropped out/ continued with a treatment)
4. Kỹ thuật phân tích quan hệ giữa các biến trong đó
biến phụ thuộc là categorical (Exploring relationship)
• Phân tích tương quan cổ điển (hoặc phân tích Canonical Correlation):
– Dùng để phân tích mối quan hệ của hai nhóm biến
– Vd: phân tích mối quan hệ giữa nhóm biến nhân chủng học (demographic
variables) và nhóm biến gồm phúc lợi (wellbeing) và biến đánh giá
(adjustment)
• Mô hình phương trình cấu trúc (Structured Equation Modeling)
– Cho phép kiểm định các mô hình trong đó có mô tả mối quan hệ giữa các biến
– Cụ thể 1: có thể kiểm định độ mạnh trong tác động của từng biến đến mô
hình, hoặc độ chặt (thích hợp) của mô hình với những số liệu bạn có.
– Cụ thể 2: Kỹ thuật này còn cho phép so sánh giữa các dạng mô hình có thể
thay thế lẫn nhau.
4. Kỹ thuật phân tích quan hệ giữa các biến trong đó
biến phụ thuộc là categorical (Exploring relationship)
5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm
T-Test
• Chỉ sử dụng cho Parametric Test – biến liên tục
• T-Test được sử dụng khi nào??
Khi bạn muốn so sánh giá trị trung bình của hai nhóm khác cases (vd: males và
females), hoặc của hai dãy số liệu cùng cases (before và after).
• Có 2 loại T-test:
– Kiểm định T-test lặp (Paired sample t-tests, hay repeated measures): được dùng
cho kiểm định khác biệt của chỉ tiêu ở hai thời điểm điều tra khác nhau trên cùng
đối tượng (các cases ở hai lần là như nhau). Thông thường được ứng dụng cho các
động thái can thiệp (chính sách)
– Kiểm định T-test mẫu độc lập (Independent sample t-test): được dùng để so sánh
giá trị trung bình biến (chỉ tiêu) của hai nhóm cases khác nhau cùng một thời điểm
(males và females)
• T-test được trình bày cụ thể ở Chapter 17
• Chú ý: Để kiểm định nhóm non-parametric người ta thường sử dụng Mann-Whitney
U Test và Wilcoxon Signed Rank Test – Chi tiết trong Chapter 16
5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm
Phân tích phương sai một chiều
One-way analysis of variance - ANOVA
• Chỉ dùng cho parametric test
• Cũng giống như T-test, nhưng với số nhóm từ 2 trở lên (T-test chỉ làm cho 2 nhóm)
• Tại sao lại gọi là one-way? Vì nó chỉ sử dụng trong nghiên cứu ảnh hưởng của 1
biến độc lập lên biến phụ thuộc
• Kiểm định ANOVA chỉ giúp bạn cho biết có sự khác biệt hay không giữa các nhóm,
nhưng không cho biết mức độ khác biệt là bao nhiêu (significant difference) – Post
hoc analysis để tìm ra significant diffrence
• Cũng có 2 dạng ANOVA:
– Kiểm định ANOVA với biến lặp (cùng cases nhưng với hơn 2 thời điểm khác
nhau)
– Kiểm định ANOVA mẫu độc lập: kiểm định trung bình biến với 2 hoặc nhiều
hơn số nhóm cases khác nhau (trẻ, trung niên, già)
• One-way ANOVA được chi tiết trong Chapter 16, trong khi các kiểm định non-
parametric như là Kruskal-Wallis Test and Friedman Test sẽ được trình bày trong
Chapter 16
• Cho phép phân tích ảnh hưởng của hai biến độc lập lên một biến phụ thuộc
• Lợi thế của kỹ thuật này là cho phép kiểm định ảnh hưởng cộng hưởng (interaction effect) – tức là
ảnh hưởng của một biến chịu tác động bởi một biến khác. Vd: mức độ lạc quan (optimism) tăng khi
tuổi (age) tăng, nhưng chỉ với nhóm nam (males)
• Kỹ thuật này còn cho phép kiểm định ảnh hưởng của riêng biệt từng biến độc lập (sex, age,…) đến
biến phụ thuộc
• Có hai kỹ thuật two-way ANOVA: ANOVA cho các nhóm khác nhau (between group ANOVA – các
cases ở các nhóm khác nhau, vd: males và females), và ANOVA lặp (repeated measures ANOVA -
cùng cases nhưng được theo dõi trong nhiều lần khác nhau)
• Between group ANOVA và repeated measures ANOVA có thể được kết hợp cùng nhau trong cùng
một nghiên cứu. Kỹ thuật kết hợp này được gọi là “Mixed Between-Within Designs” hoặc “Split-
Plot” (chi tiết ở Chapter 20)
• Kỹ thuật two-way ANOVA được chi tiết trong chapter 19
5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm
Phân tích phương sai hai chiều
Two-way analysis of variance - ANOVA
• Được sử dụng để so sánh các nhóm cho (hoặc dựa trên) các biến
phụ thuộc khác nhau, nhưng có liên quan đến nhau
Vd: So sánh các biện pháp trị bệnh khác nhau (các nhóm khác
nhau) trên cơ sở tập hợp các tác dụng (các biến phụ thuộc) về sợ hãi
(anxiety), thất vọng (depression), và các triệu chứng vật lý (physical
symptoms)
• MANOVA có thể được sử dụng theo kiểu one-way, two-way hoặc
các phân tích so sánh có nhiều hơn các biến độc lập
• MANOVA được chi tiết trong Chapter 21
5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm
Phân tích phương sai đa chiều
Multivariate analysis of variance - MANOVA
5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm
Phân tích hiệp phương sai
Analysis of covariance (ANCOVA)
• Kỹ thuật này cho phép bạn kiểm soát ảnh hưởng của biến ngoại
sinh(confounding variable, hoặc covariate) đến mô hình
• Vd: ảnh hưởng của các biến độc lập lên biến phụ thuộc (ảnh hưởng
1) có thể chịu ảnh hưởng (ảnh hưởng 2) bởi một biến (một số biến)
nào khác. Kỹ thuật này cho phép bạn kiểm soát (loại trừ) ảnh hưởng
2
• ANCOVA có thể sử được sử dụng như là một phần của one-way,
two-way, hoặc các thiết kế multivariate designs
• ANCOVA được chi tiết trong Chapter 22
6. Chú ý khi ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)
• Như vậy có khá nhiều kỹ thuật thống kê, bạn phải lựa chọn cái nào
phù hợp với những gì mình có và những gì mình muốn
• Khi đi đến quyết định lựa chọn bạn cần phải quan tâm đến:
– Câu hỏi nghiên cứu của bạn là gì?
– Loại chỉ tiêu (biến) và thành phần biến mà bạn có trong phiếu
điều tra
– Đặc điểm số liệu của chỉ tiêu (biến) mà bạn có
– Các giả định thống kê bạn cần phải đảm bảo ứng với mỗi kỹ
thuật thống kê có thể sử dụng
Bước 1: Câu hỏi nghiên cứu là gì?
• Liệt kê tất cả những câu hỏi nghiên cứu bạn muốn trả lời
• Chú ý: mỗi câu hỏi nghiên cứu có thể được hỏi theo những cách
khác nhau (sử dụng những kỹ thuật khác nhau để trả lời)
– Vd: khi bạn muốn nghiên cứu ảnh hưởng của tuổi (age) đến
mức độ lạc quan (optimism), bạn có thể đặt thành các câu hỏi:
• Có bất kỳ mối liên hệ nào giữa tuổi và mức độ lạc quan
không?
• Liệu người cao tuổi có lạc quan hơn người trẻ không?
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)
Bước 2: Xác định các chỉ tiêu (biến - scale) và các thành phần biến (items) dùng để
trả lời từng câu hỏi nghiên cứu
• Đặc điểm của chỉ tiêu và items trong chỉ tiêu có ý nghĩa quyết định đến kỹ thuật
thống kê bạn sẽ sử dụng để trả lời câu hỏi nghiên cứu.
• Cũng chính vì thế mà trước khi phát triển chỉ tiêu nghiên cứu (và phiếu điều tra)
bạn cần chú ý đến dự định về các phân tích của mình về sau này
• Chẳng hạn, cũng là thông tin về tuổi (age), các cách hỏi khác nhau sẽ tạo ra định
dạng số liệu khác nhau, và do đó kỹ thuật thống kê sử dụng cũng sẽ khác:
– Nếu bạn hỏi họ tick vào một trong hai lựa chọn dưới hoặc trên 35, thì bạn chỉ
có hai giá trị biến tuổi, và như thế kỹ thuật thống kê sử dụng sẽ rất hạn chế.
– Trái lại, nếu bạn yêu cầu người trả lời cho biết tuổi của họ (in years), tình hình
sẽ khác hẳn. Bạn có một dãy số liệu (từ 18 đến 80+). Bạn có thể gộp nhóm
tuổi (collapse) để thực hiện một số phân tích (như ANOVA), trong khi dãy số
liệu ban đầu vẫn hoàn toàn khả thi cho phân tích khác (correlation chẳng hạn)
Tóm lại: hãy kiểm tra lại các biến (cả độc lập và phụ thuộc) xem nó được đo lường
thế nào (dạng số liệu là gì). Cái đó kết hợp với câu hỏi nghiên cứu, bạn sẽ có ý tưởng
cho việc nên lựa chọn kỹ thuật thống kê nào!
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)
Bước 3: Xem xét kỹ hơn về đặc điểm của biến
• Về tổng quát: biến nào là biến độc lập, biến nào là biến phụ thuộc? Câu trả lời đến từ
đặc điểm số liệu bạn có, cộng với hiểu biết của bạn về nội dung nghiên cứu, về các
nguyên lý, và về các nghiên cứu trước đó
• Hãy chắc chắn về mặt tư duy: biến nào gây nên ảnh hưởng (đó là independent
variable), biến nào chịu ảnh hưởng (đó là dependent variable)
• Có một số kỹ thuật thống kê (vd: correlation) không cần phân biệt đầu là biến độc lập,
đâu là biến phụ thuộc. Tuy nhiên, với một số kỹ thuật khác thì lại khác (vd: ANOVA)
• Chú ý về định dạng giá trị của biến
– Dạng biến phân loại (categorical – dạng biến định danh): Males/ females
– Dạng biến ordinal (ranking: 1st, 2nd, 3rd), và
– Dạng biến liên tục (continuous): dạng interval và ratio , vd: ages in years, scores on
the Optimism scale
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)
Bước 3: Xem xét kỹ hơn về các biến
Một số chú ý thêm về biến liên tục và biến phân loại:
• Đối với biến liên tục, bạn cần tìm hiểu thêm thông tin về phân bố
của chúng: chuẩn hay không chuẩn? Độ bao phủ (range) của nó ra
sao? (Chapter 6)
• Đối với biến categorical (vd: males/females) hãy tìm ra số lượng các
cases trong mỗi nhóm. Số lượng các cases trong các nhóm có cân
bằng nhau hay không? Có nhóm nào bị trống không? (Chapter 6)
Tất cả những thông tin trong bước 3 bạn có được từ biến sẽ có tác
dụng rất tích cực trong việc đi đến quyết định lựa chọn kỹ thuật thống
kê cho đề tài của mình
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)
Bước 4: Tưởng tượng biểu đồ (đồ thị, biểu, bảng) cho mỗi câu hỏi nghiên cứu
• Về khái quát: bạn cần rõ tôi muốn phân tích quan hệ giữa các biến, hay muốn
phân tích sự khác biệt giữa các nhóm
• Từ đó hãy tóm lược đặc điểm của các thông tin bạn có, rồi nghĩ (brainstorming)
ra những biều đồ bạn sẽ dùng để trả lời cho mỗi câu hỏi nghiên cứu.
Một số Slide sau sẽ minh hoạc một số ví dụ chỉ cho bạn biết bạn cần tư duy như
thế nào cho bước 4 (rất quan trọng – vd cho đề cương chi tiết của một nghiên
cứu)
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)
Vd 1: Nếu bạn muốn trả lời câu hỏi: “liệu có mối quan hệ giữa tuổi (age) và mức độ
lạc quan (optimism) không?”, thì bạn cần phải tư duy về những nội dung sau:
• Tư duy về biến (variables):
– Biến tuổi (age): là biến continuous, đo lường bằng số năm, từ 18 đến 80+
– Biến lạc quan (optimism): là biến continuous, đo lường bằng mức độ lạc quan,
từ 6 đến 30. Tại sao lại từ 6 đến 30???
• Tư duy về dạng biểu đồ (diagram)
– Hãy sử dụng literature để phán đoán về mối quan hệ
– Hình dung (vẽ) mối quan hệ ra giấy
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)
Ví dụ 2: Với câu hỏi “liệu nam giới có lạc quan hơn nữ giới không?”, bạn cần
phải tư duy như sau:
• Variables:
– Sex: independent, categorical (two groups): males/ females
– Optimism: dependent, continuous, đo lường bằng mức độ lạc quan
(từ 6 đến 30)
• Hình dung dạng biểu đồ:
– Chỉ có một biến độc lập dạng phân loại (2 nhóm) và 1 biến phụ thuộc
liên tục
– Do đó, dạng biểu đồ sẽ như sau:
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)
Ví dụ 3: Với câu hỏi “liệu ảnh hưởng của tuổi đến mức độ lạc quan có khác nhau
giữa 2 nhóm nam và nữ không?”, bạn cần phải tư duy:
• Kiểu ảnh hưởng: ảnh hưởng tổng hợp của cả biến tuổi (age) và biến giới tính
(gender). Do đó bạn có thể chia tuổi thành các nhóm khác nhau (vd: dưới 30, từ
31 đến 49 và từ 50 trở lên)
• Tư duy về biến (variables):
– Sex: independent, categorical: males/ females;
– Age: independent, categorical, chia làm 3 nhóm cân bằng nhau
– Optimism: dependent, continuous: đo lường bằng mức độ lạc quan, từ 6 đến 30
• Biểu đồ có thể sẽ như sau:
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)
Ví dụ 4: Với câu hỏi “sự biến động trong mức độ hài lòng về cuộc sống có thể
được giải thích như thế nào bởi các yếu tố thuộc về đặc điểm cá nhân (tự
trọng – self-esteem, optimism – lạc quan, perceived control – điều khiển
nhận thức)?”, bạn cần tư duy về:
• Variables:
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)
Bước 5: Quyết định xem kỹ thuật thống kê nào sẽ phù hợp: thống kê tham số
(parametric) hay thống kê phi tham số (non-parametric)
• Nhớ rằng các kỹ thuật thống kê có thể đi (được chia) theo hai nhóm: thống kê
tham số (parametric statistics) và thống kê phi tham số (non-parametric
statistics). Thông thường thống kê tham số được xem là mạnh hơn, tuy nhiên
nó đò hỏi những ràng buộc nhất định
• Ví dụ về giả định của thống kê tham số: giá trị biến phải đảm bảo phân bố
chuẩn
• Ngoài ra, các thống kê tham số đòi hỏi các giả định khác (chi tiết ở từng
Chapter đối với từng kỹ thuật).
• Do đó, bạn cần kiểm tra tình trạng vi phạm các giả định của kỹ thuật thống kê
trước khi bạn dùng mỗi kỹ thuật cụ thể.
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)
Bạn có thể làm gì nếu số liệu vi phạm các giả định thống kê??? Có một số cách:
• Cách 1 (Option 1): bạn vẫn có thể dùng parametric statistics với hy vọng rằng các vi
phạm không ảnh hưởng quá nghiêm trọng đến kết quả nghiên cứu.
– Một số học giả cho rằng các tiếp cận (trong đó có kỹ thuật thống kê) thường khá mạnh (robust) và
chúng có thể hạn chế tốt những ảnh hưởng của các vi phạm, đặc biệt nếu dung lượng mẫu lớn
– Nếu bạn vẫn lựa chọn tiếp tục con đường của mình, bạn cần thu thập nhiều bằng chứng để hỗ trợ
cho quyết định của mình. Hãy sử dụng các nghiên cứu có sẵn, đặc biệt là các nghiên cứu có sử dụng
cùng chỉ tiêu nghiên cứu như của bạn. Hãy xem họ đã làm gì với vấn đề phi phạm giả thiết ấy???
• Cách 2 (Option 2): Bạn có thể manipulate số liệu của mình nhằm thỏa mãn các giả thiết
thống kê của mình (vd: bạn có một số cách để chuyển từ biến không chuẩn thành biến
chuẩn – Chapter 8). Một khi thực hiện chuyển biến, bạn cũng cần tìm đủ bằng chứng để
support cho việc làm của mình
• Cách 3 (Option 3 – cách cuối cùng): nếu số liệu không đảm bảo giả định thống kê
parametric, hãy sử dụng thống kê non-parametric. Mặc dù các kỹ thuật này cũng yêu
cầu một số giả định, nhưng sẽ không khắt khe như trường hợp parametric statistic. Tuy
nhiên, các kỹ thuật này sẽ “yếu” hơn các kỹ thuật parametric statistics (Non-parametric
statistics sẽ kỹ hơn ở Chapter 16)
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)- Bước 5 (tiếp)
Bước 6: Ra quyết định cuối cùng
Đến đây bạn sẽ biết nên dùng kỹ thuật thống
kê nào cho phù hợp với những gì bạn có và
những gì bạn muốn!
7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp
(Quyết định lựa chọn phương thức làm món ăn)
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.1 Phân tích quan hệ giữa các biến
Kỹ thuật 1: Chi square for independence
Vd câu hỏi nghiên cứu: “quan hệ giữa giới tính và số người từ bỏ điều bệnh
như thế nào?”
• Bạn cần phải có gì?
– Một biến độc lập, dạng phân loại (sex: males/ females)
– Một biến phụ thuộc, dạng phân loại (dropout: Yes/ No)
• Bạn muốn gì? Số người (từ bỏ/ không từ bỏ điều trị) ở mỗi nhóm (males/
females)
• Dạng biểu độ sẽ là:
• Câu hỏi nghiên cứu: “liệu có quan hệ
giữa tuổi và mức độ lạc quan không?
Liệu lạc quan có tăng khi tuổi tăng
không?”
• Những thứ bạn phải có: 2 biến
continuous (age và optimism)
• Biểu đồ sẽ có dạng dưới đây
• Kỹ thuật thống kê có thể thay thế:
Spearman's Rank Order Correlation
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.1 Phân tích quan hệ giữa các biến
Kỹ thuật 2: Phân tích tương quan (Correlation)
Câu hỏi nghiên cứu: Sau khi đã kiểm soát được
biến socially desirable responding, có mối quan
hệ rõ rệt nào giữa biến optimism và life
satisfaction không?
• Bạn cần có gì? 3 biến liên tục (life satisfaction,
optimism, và socially desirable responding)
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.1 Phân tích quan hệ giữa các biến
Kỹ thuật 3: Phân tích tương quan từng phần (Partial Correlation)
• Câu hỏi nghiên cứu: Sự biến động của biến life satisfaction được giải thích
như thế nào bởi một tập hợp các biến self-esteem, optimism, và perceived
control? Biến nào giải thích tốt hơn về sự biến động của life satisfaction?
• Bạn cần có gì?
– Một biến phụ thuộc, dạng continuous (life satisfaction), và
– Hai hoặc nhiều hơn hai biến độc lập, dạng continuous (self-esteem,
optimism, perceived control)
• Dạng biểu đồ:
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.2 Phân tích sự khác biệt giữa các nhóm
Kỹ thuật 6: Phân tích tương hồi quy đa biến (Multiple regression)
Câu hỏi nghiên cứu: “nam giới có lạc quan hơn nữ giới không?”
• Bạn cần có gì?
– Một biến độc lập, dạng phân loại chia thành hai nhóm (biến sex:
males/ females)
– Một biến độc lập, dạng continuous (optimism scores)
• Dạng biểu đồ:
• Kỹ thuật thống kê phi tham số thay thế: Mann-Whitney Test
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.2 Phân tích khác biệt giữa các nhóm
Kỹ thuật 7: Kiểm định T-test mẫu độc lập (Independent samples T-test)
Câu hỏi nghiên cứu: “liệu khóa đào tạo 10 tuần về tâm lý có làm giảm mức độ sợ
hãi của người tham gia hay không? Có sự thay đổi nào trong mức độ sợ hãi từ
thời gian 1 (trước đào tạo - pre-intervention) đến thời gian 2 (sau đào tạo – post-
intervention) hay không?”
• Bạn cần có gì?
– Một biến độc lập, dạng phân loại (Time 1 – before intervention, Time 2 –
after intervention)
– Một biến phụ thuộc, dạng continuous (anxiety scores)
• Chú ý: trường hợp này là cùng cases, được theo dõi vào các thời điểm khác
nhau
• Dạng biểu đồ:
• Thống kê phi tham số có thể thay thế: Wilcoxon Signed-Rank Test
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.2 Phân tích khác biệt giữa các nhóm
Kỹ thuật 8: Kiểm định T-test mẫu lặp (Paired Samples T-test – repeated measures)
• Câu hỏi nghiên cứu: “mức độ lạc quan (optimism score) có khác nhau giữa các
nhóm người dưới 30 tuổi, từ 31 đến 49 tuổi, và từ 50 tuổi trở lên không?”
• Bạn cần có:
– Một biến độc lập, dạng phân loại cho 2 hoặc nhiều hơn 2 nhóm (age:
under 30, 31-49, over 50) và
– Một biến phụ thuộc, dạng continuous (optimism score)
• Thống kê phi tham số có thể thay thế: Không có
• Chú ý thêm:
Phân tích phương sai có thể được mở rộng cho các trường hợp có từ 3 biến
độc lập trở lên (thường được gọi là phân tích nhân tố của phương sai – Factoral
Analysis of Variance)
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.2 Phân tích khác biệt giữa các nhóm
Kỹ thuật 9: Phân tích ANOVA một chiều mẫu độc lập (One-way between groups
analysis of Variance)
• Câu hỏi nghiên cứu: “Biện pháp can thiệp nào (kỹ năng toán – math skills/ và tạo niềm
tin – confidence building) có hiệu quả hơn trong giảm thiểu thống kê về nỗi sợ hãi được
đo lường trong 3 giai đoạn (trước khi can thiệp – pre-intervention, sau khi can thiệp –
post-intervention, ba tháng sau khi can thiệp – three month follow up)
• Bạn cần có:
– Một biến độc lập chia thành các nhóm khác nhau (one between groups
independent variable – type of intervention)
– Một biết độc lập chia thành các nhóm như nhau (one within groups independent
variable – time1, time2, time3)
• Dạng biểu đồ như sau:
• Thống kê phi tham số có thể thay thế: không có
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.2 Phân tích khác biệt giữa các nhóm
Kỹ thuật 10: Phân tích ANOVA kết hợp cả mẫu độc lập và mẫu lặp (Mixed
between and within groups analysis of Variance)
• Câu hỏi nghiên cứu: “liệu nam giới có khả năng kiểm soát tốt hơn nữ giới trong
những vấn đề liên quan đến sức khỏe thể chất và tâm lý (sợ hãi, thất vọng, và
áp lực cuộc sống)?”
• Bạn cần có:
– Một biến độc lập, dạng định danh (sex: males/ females); và
– Hai hoặc nhiều hơn hai biến phụ thuộc, dạng continuous (anxiety,
depression, and perceived stress)
• Dạng biểu đồ có thể là:
• Kỹ thuật thống kê phi tham số có thể thay thế: Không có
• Chú ý thêm: MANOVA có thể được sử dụng với phân tích một chiều (01 biến
độc lập), hoặc hai chiều (02 biến độc lập), và nhiều chiều hơn nữa.
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.2 Phân tích khác biệt giữa các nhóm
Kỹ thuật 11: Phân tích phương sai đa chiều (Multivariate Analysis of Variance -
MANOVA)
• Câu hỏi nghiên cứu: “Có hay không sự khác biệt về mức độ sợ hãi giữa hai
biện pháp điều trị (hai nhóm khác nhau) gồm maths skills và confidence
building, giả định rằng những ảnh hưởng của mức độ sợ hãi trước khi có
các biệt pháp can thiệp (điều trị) đã được kiểm soát (hoặc loại bỏ)
• Bạn cần có gì?
– Một biến độc lập, dạng phân loại (type of intervention – maths skills và confidence
building)
– Một biến phụ thuộc, dạng continuous (Fear scores at Time 2); và
– Một biến kiểm soát (tức là biến ta muốn tách ảnh hưởng của nó ra), dạng continuous
(Fear scores at Time 1 – Pre-intervention)
• Thống kê phi tham số có thể thay thế: Không có
• Chú ý thêm:
• ANCOVA có thể sử dụng với phân tích một chiều (một biến độc lập), hai
chiều (hai biến độc lập), và phân tích đa chiều (hai hoặc nhiều hơn hai
biến phụ thuộc)
8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản
8.2 Phân tích khác biệt giữa các nhóm
Kỹ thuật 12: Phân tích hiệp phương sai (Analysis of Covariance - ANCOVA)
Bảng tóm tắt các kỹ thuật thống kê phổ biến
Bảng tóm tắt các kỹ thuật thống kê phổ biến
Tham khảo
http://www.allenandunwin.com/spss/default.ht
ml

Mais conteúdo relacionado

Mais procurados

ĐIỀU TRỊ LAO
ĐIỀU TRỊ LAOĐIỀU TRỊ LAO
ĐIỀU TRỊ LAOSoM
 
PHÂN LOẠI MIGRAINE
PHÂN LOẠI MIGRAINEPHÂN LOẠI MIGRAINE
PHÂN LOẠI MIGRAINESoM
 
Tinh toan dien trong yhgd
Tinh toan dien trong yhgdTinh toan dien trong yhgd
Tinh toan dien trong yhgdThanh Liem Vo
 
ĐA TRỊ LIỆU TRONG ĐỘNG KINH
ĐA TRỊ LIỆU TRONG ĐỘNG KINHĐA TRỊ LIỆU TRONG ĐỘNG KINH
ĐA TRỊ LIỆU TRONG ĐỘNG KINHSoM
 
Nhóm 3 hoàn chỉnh
Nhóm 3 hoàn chỉnhNhóm 3 hoàn chỉnh
Nhóm 3 hoàn chỉnhHuyen Thanh
 
ĐIỀU TRỊ ĐỘNG KINH
ĐIỀU TRỊ ĐỘNG KINHĐIỀU TRỊ ĐỘNG KINH
ĐIỀU TRỊ ĐỘNG KINHSoM
 
Test thong ke
Test thong keTest thong ke
Test thong kethang_ph
 
Cập nhật Sốc phản vệ 2018
Cập nhật Sốc phản vệ 2018Cập nhật Sốc phản vệ 2018
Cập nhật Sốc phản vệ 2018Update Y học
 
TÍNH TOÁN LIỀU LƯỢNG THUỐC CHO TRẺ
TÍNH TOÁN LIỀU LƯỢNG THUỐC CHO TRẺTÍNH TOÁN LIỀU LƯỢNG THUỐC CHO TRẺ
TÍNH TOÁN LIỀU LƯỢNG THUỐC CHO TRẺSoM
 
DỊCH TỄ HỌC BỆNH TRUYỀN NHIỄM
DỊCH TỄ HỌC BỆNH TRUYỀN NHIỄMDỊCH TỄ HỌC BỆNH TRUYỀN NHIỄM
DỊCH TỄ HỌC BỆNH TRUYỀN NHIỄMSoM
 
Thực hành cộng đồng II 2016 - ctump
Thực hành cộng đồng II   2016 - ctumpThực hành cộng đồng II   2016 - ctump
Thực hành cộng đồng II 2016 - ctumpalexandreminho
 
VÀI LƯU Ý ĐIỀU TRỊ ĐỘNG KINH Ở TRẺ EM
VÀI LƯU Ý ĐIỀU TRỊ ĐỘNG KINH Ở TRẺ EMVÀI LƯU Ý ĐIỀU TRỊ ĐỘNG KINH Ở TRẺ EM
VÀI LƯU Ý ĐIỀU TRỊ ĐỘNG KINH Ở TRẺ EMSoM
 
Phân tích CLS suy tim
Phân tích CLS suy tim Phân tích CLS suy tim
Phân tích CLS suy tim HA VO THI
 
BỆNH TĂNG HUYẾT ÁP
BỆNH TĂNG HUYẾT ÁPBỆNH TĂNG HUYẾT ÁP
BỆNH TĂNG HUYẾT ÁPSoM
 
Khái niệm biến số và yếu tố nhiễu
Khái niệm biến số và yếu tố nhiễuKhái niệm biến số và yếu tố nhiễu
Khái niệm biến số và yếu tố nhiễuSoM
 
ECG DÀY THẤT, DÀY NHĨ VÀ THIẾU MÁU CƠ TIM
ECG DÀY THẤT, DÀY NHĨ VÀ THIẾU MÁU CƠ TIMECG DÀY THẤT, DÀY NHĨ VÀ THIẾU MÁU CƠ TIM
ECG DÀY THẤT, DÀY NHĨ VÀ THIẾU MÁU CƠ TIMSoM
 
Cap cuu-ngung-tuan-hoan-co-ban
Cap cuu-ngung-tuan-hoan-co-banCap cuu-ngung-tuan-hoan-co-ban
Cap cuu-ngung-tuan-hoan-co-banbanbientap
 
Chuong5 KIỂM ĐỊNH PHI THAM SỐ
Chuong5 KIỂM ĐỊNH PHI THAM SỐChuong5 KIỂM ĐỊNH PHI THAM SỐ
Chuong5 KIỂM ĐỊNH PHI THAM SỐThắng Nguyễn
 
Sử dụng thuốc giảm đau ở bệnh nhân có bệnh lý gan
Sử dụng thuốc giảm đau ở bệnh nhân có bệnh lý ganSử dụng thuốc giảm đau ở bệnh nhân có bệnh lý gan
Sử dụng thuốc giảm đau ở bệnh nhân có bệnh lý ganTRAN Bach
 

Mais procurados (20)

ĐIỀU TRỊ LAO
ĐIỀU TRỊ LAOĐIỀU TRỊ LAO
ĐIỀU TRỊ LAO
 
Cơn hen phế quản
Cơn hen  phế quảnCơn hen  phế quản
Cơn hen phế quản
 
PHÂN LOẠI MIGRAINE
PHÂN LOẠI MIGRAINEPHÂN LOẠI MIGRAINE
PHÂN LOẠI MIGRAINE
 
Tinh toan dien trong yhgd
Tinh toan dien trong yhgdTinh toan dien trong yhgd
Tinh toan dien trong yhgd
 
ĐA TRỊ LIỆU TRONG ĐỘNG KINH
ĐA TRỊ LIỆU TRONG ĐỘNG KINHĐA TRỊ LIỆU TRONG ĐỘNG KINH
ĐA TRỊ LIỆU TRONG ĐỘNG KINH
 
Nhóm 3 hoàn chỉnh
Nhóm 3 hoàn chỉnhNhóm 3 hoàn chỉnh
Nhóm 3 hoàn chỉnh
 
ĐIỀU TRỊ ĐỘNG KINH
ĐIỀU TRỊ ĐỘNG KINHĐIỀU TRỊ ĐỘNG KINH
ĐIỀU TRỊ ĐỘNG KINH
 
Test thong ke
Test thong keTest thong ke
Test thong ke
 
Cập nhật Sốc phản vệ 2018
Cập nhật Sốc phản vệ 2018Cập nhật Sốc phản vệ 2018
Cập nhật Sốc phản vệ 2018
 
TÍNH TOÁN LIỀU LƯỢNG THUỐC CHO TRẺ
TÍNH TOÁN LIỀU LƯỢNG THUỐC CHO TRẺTÍNH TOÁN LIỀU LƯỢNG THUỐC CHO TRẺ
TÍNH TOÁN LIỀU LƯỢNG THUỐC CHO TRẺ
 
DỊCH TỄ HỌC BỆNH TRUYỀN NHIỄM
DỊCH TỄ HỌC BỆNH TRUYỀN NHIỄMDỊCH TỄ HỌC BỆNH TRUYỀN NHIỄM
DỊCH TỄ HỌC BỆNH TRUYỀN NHIỄM
 
Thực hành cộng đồng II 2016 - ctump
Thực hành cộng đồng II   2016 - ctumpThực hành cộng đồng II   2016 - ctump
Thực hành cộng đồng II 2016 - ctump
 
VÀI LƯU Ý ĐIỀU TRỊ ĐỘNG KINH Ở TRẺ EM
VÀI LƯU Ý ĐIỀU TRỊ ĐỘNG KINH Ở TRẺ EMVÀI LƯU Ý ĐIỀU TRỊ ĐỘNG KINH Ở TRẺ EM
VÀI LƯU Ý ĐIỀU TRỊ ĐỘNG KINH Ở TRẺ EM
 
Phân tích CLS suy tim
Phân tích CLS suy tim Phân tích CLS suy tim
Phân tích CLS suy tim
 
BỆNH TĂNG HUYẾT ÁP
BỆNH TĂNG HUYẾT ÁPBỆNH TĂNG HUYẾT ÁP
BỆNH TĂNG HUYẾT ÁP
 
Khái niệm biến số và yếu tố nhiễu
Khái niệm biến số và yếu tố nhiễuKhái niệm biến số và yếu tố nhiễu
Khái niệm biến số và yếu tố nhiễu
 
ECG DÀY THẤT, DÀY NHĨ VÀ THIẾU MÁU CƠ TIM
ECG DÀY THẤT, DÀY NHĨ VÀ THIẾU MÁU CƠ TIMECG DÀY THẤT, DÀY NHĨ VÀ THIẾU MÁU CƠ TIM
ECG DÀY THẤT, DÀY NHĨ VÀ THIẾU MÁU CƠ TIM
 
Cap cuu-ngung-tuan-hoan-co-ban
Cap cuu-ngung-tuan-hoan-co-banCap cuu-ngung-tuan-hoan-co-ban
Cap cuu-ngung-tuan-hoan-co-ban
 
Chuong5 KIỂM ĐỊNH PHI THAM SỐ
Chuong5 KIỂM ĐỊNH PHI THAM SỐChuong5 KIỂM ĐỊNH PHI THAM SỐ
Chuong5 KIỂM ĐỊNH PHI THAM SỐ
 
Sử dụng thuốc giảm đau ở bệnh nhân có bệnh lý gan
Sử dụng thuốc giảm đau ở bệnh nhân có bệnh lý ganSử dụng thuốc giảm đau ở bệnh nhân có bệnh lý gan
Sử dụng thuốc giảm đau ở bệnh nhân có bệnh lý gan
 

Destaque

SPSS Lession 5.2 Phân tích tương quan từng phần (Partial Correlation)
SPSS Lession 5.2 Phân tích tương quan từng phần (Partial Correlation)SPSS Lession 5.2 Phân tích tương quan từng phần (Partial Correlation)
SPSS Lession 5.2 Phân tích tương quan từng phần (Partial Correlation)Si Thinh Hoang
 
Chapter 4 kiem dinh thong ke
Chapter 4 kiem dinh thong keChapter 4 kiem dinh thong ke
Chapter 4 kiem dinh thong kepmxuandba
 
Chuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Chuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐChuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Chuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐThắng Nguyễn
 
Phân tích tương quan hồi quy
Phân tích tương quan hồi quyPhân tích tương quan hồi quy
Phân tích tương quan hồi quySi Thinh Hoang
 
Spss lesson5.1 phan tich_tuong_quan_correlation
Spss lesson5.1 phan tich_tuong_quan_correlationSpss lesson5.1 phan tich_tuong_quan_correlation
Spss lesson5.1 phan tich_tuong_quan_correlationSi Thinh Hoang
 
Hướng dẫn thu thập và xử lý dữ liệu định lượng và định tính
Hướng dẫn thu thập và xử lý dữ liệu định lượng và định tínhHướng dẫn thu thập và xử lý dữ liệu định lượng và định tính
Hướng dẫn thu thập và xử lý dữ liệu định lượng và định tínhInfoQ - GMO Research
 
Spss lesson 4.4 checking reliability_of_scale (kiem tra do tin cay cua bien)
Spss lesson 4.4 checking reliability_of_scale (kiem tra do tin cay cua bien)Spss lesson 4.4 checking reliability_of_scale (kiem tra do tin cay cua bien)
Spss lesson 4.4 checking reliability_of_scale (kiem tra do tin cay cua bien)Si Thinh Hoang
 
SPSS Lesson #4.2 (Vietnamese - Biểu đồ_Graphs)
SPSS Lesson #4.2 (Vietnamese - Biểu đồ_Graphs)SPSS Lesson #4.2 (Vietnamese - Biểu đồ_Graphs)
SPSS Lesson #4.2 (Vietnamese - Biểu đồ_Graphs)Si Thinh Hoang
 
Đánh giá lựa chọn dự án đầu tư kinh doanh
Đánh giá lựa chọn dự án đầu tư kinh doanhĐánh giá lựa chọn dự án đầu tư kinh doanh
Đánh giá lựa chọn dự án đầu tư kinh doanhSi Thinh Hoang
 
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...vietlod.com
 
Spss lesson #1 #4.1 (Vietnamese)
Spss lesson #1 #4.1 (Vietnamese)Spss lesson #1 #4.1 (Vietnamese)
Spss lesson #1 #4.1 (Vietnamese)Si Thinh Hoang
 
Phân tích xử lý thông tin nghiên cứu định tính
Phân tích xử lý thông tin nghiên cứu định tínhPhân tích xử lý thông tin nghiên cứu định tính
Phân tích xử lý thông tin nghiên cứu định tínhPhap Tran
 
Phân tích dữ liệu thống kê
Phân tích dữ liệu thống kêPhân tích dữ liệu thống kê
Phân tích dữ liệu thống kêHọc Huỳnh Bá
 
Spss lesson 5 phan_tich_moi_quan_he_giua_cac_bien_Khaiquat
Spss lesson 5 phan_tich_moi_quan_he_giua_cac_bien_KhaiquatSpss lesson 5 phan_tich_moi_quan_he_giua_cac_bien_Khaiquat
Spss lesson 5 phan_tich_moi_quan_he_giua_cac_bien_KhaiquatSi Thinh Hoang
 
Spss lesson #4.3 quan ly file so lieu (phan 3 8 manipulating_data)
Spss lesson #4.3 quan ly file so lieu (phan 3 8 manipulating_data)Spss lesson #4.3 quan ly file so lieu (phan 3 8 manipulating_data)
Spss lesson #4.3 quan ly file so lieu (phan 3 8 manipulating_data)Si Thinh Hoang
 
Dàn bài nghiên cứu khoa học
Dàn bài nghiên cứu khoa họcDàn bài nghiên cứu khoa học
Dàn bài nghiên cứu khoa học希夢 坂井
 
SBC 2012 - Một số thuật toán phân lớp và ứng dụng trong IDS (Nguyễn Đình Chiểu)
SBC 2012 - Một số thuật toán phân lớp và ứng dụng trong IDS (Nguyễn Đình Chiểu)SBC 2012 - Một số thuật toán phân lớp và ứng dụng trong IDS (Nguyễn Đình Chiểu)
SBC 2012 - Một số thuật toán phân lớp và ứng dụng trong IDS (Nguyễn Đình Chiểu)Security Bootcamp
 
Thu thập và trình bày dữ liệu thống kê
Thu thập và trình bày dữ liệu thống kêThu thập và trình bày dữ liệu thống kê
Thu thập và trình bày dữ liệu thống kêHọc Huỳnh Bá
 
MÔ HÌNH HỒI QUY TUYẾN TÍNH THEO SỐ LIỆU THEO THỜI GIAN
MÔ HÌNH HỒI QUY TUYẾN TÍNH THEO SỐ LIỆU THEO THỜI GIANMÔ HÌNH HỒI QUY TUYẾN TÍNH THEO SỐ LIỆU THEO THỜI GIAN
MÔ HÌNH HỒI QUY TUYẾN TÍNH THEO SỐ LIỆU THEO THỜI GIAN希夢 坂井
 
Giao trinh-xu-ly-du-lieu-nghien-cuu-voi-spss-for-windows
 Giao trinh-xu-ly-du-lieu-nghien-cuu-voi-spss-for-windows Giao trinh-xu-ly-du-lieu-nghien-cuu-voi-spss-for-windows
Giao trinh-xu-ly-du-lieu-nghien-cuu-voi-spss-for-windowsHải Finiks Huỳnh
 

Destaque (20)

SPSS Lession 5.2 Phân tích tương quan từng phần (Partial Correlation)
SPSS Lession 5.2 Phân tích tương quan từng phần (Partial Correlation)SPSS Lession 5.2 Phân tích tương quan từng phần (Partial Correlation)
SPSS Lession 5.2 Phân tích tương quan từng phần (Partial Correlation)
 
Chapter 4 kiem dinh thong ke
Chapter 4 kiem dinh thong keChapter 4 kiem dinh thong ke
Chapter 4 kiem dinh thong ke
 
Chuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Chuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐChuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
Chuong4 PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ
 
Phân tích tương quan hồi quy
Phân tích tương quan hồi quyPhân tích tương quan hồi quy
Phân tích tương quan hồi quy
 
Spss lesson5.1 phan tich_tuong_quan_correlation
Spss lesson5.1 phan tich_tuong_quan_correlationSpss lesson5.1 phan tich_tuong_quan_correlation
Spss lesson5.1 phan tich_tuong_quan_correlation
 
Hướng dẫn thu thập và xử lý dữ liệu định lượng và định tính
Hướng dẫn thu thập và xử lý dữ liệu định lượng và định tínhHướng dẫn thu thập và xử lý dữ liệu định lượng và định tính
Hướng dẫn thu thập và xử lý dữ liệu định lượng và định tính
 
Spss lesson 4.4 checking reliability_of_scale (kiem tra do tin cay cua bien)
Spss lesson 4.4 checking reliability_of_scale (kiem tra do tin cay cua bien)Spss lesson 4.4 checking reliability_of_scale (kiem tra do tin cay cua bien)
Spss lesson 4.4 checking reliability_of_scale (kiem tra do tin cay cua bien)
 
SPSS Lesson #4.2 (Vietnamese - Biểu đồ_Graphs)
SPSS Lesson #4.2 (Vietnamese - Biểu đồ_Graphs)SPSS Lesson #4.2 (Vietnamese - Biểu đồ_Graphs)
SPSS Lesson #4.2 (Vietnamese - Biểu đồ_Graphs)
 
Đánh giá lựa chọn dự án đầu tư kinh doanh
Đánh giá lựa chọn dự án đầu tư kinh doanhĐánh giá lựa chọn dự án đầu tư kinh doanh
Đánh giá lựa chọn dự án đầu tư kinh doanh
 
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
Phát hiện và khắc phục phương sai thay đổi (heteroskedasticity) trên Eview, S...
 
Spss lesson #1 #4.1 (Vietnamese)
Spss lesson #1 #4.1 (Vietnamese)Spss lesson #1 #4.1 (Vietnamese)
Spss lesson #1 #4.1 (Vietnamese)
 
Phân tích xử lý thông tin nghiên cứu định tính
Phân tích xử lý thông tin nghiên cứu định tínhPhân tích xử lý thông tin nghiên cứu định tính
Phân tích xử lý thông tin nghiên cứu định tính
 
Phân tích dữ liệu thống kê
Phân tích dữ liệu thống kêPhân tích dữ liệu thống kê
Phân tích dữ liệu thống kê
 
Spss lesson 5 phan_tich_moi_quan_he_giua_cac_bien_Khaiquat
Spss lesson 5 phan_tich_moi_quan_he_giua_cac_bien_KhaiquatSpss lesson 5 phan_tich_moi_quan_he_giua_cac_bien_Khaiquat
Spss lesson 5 phan_tich_moi_quan_he_giua_cac_bien_Khaiquat
 
Spss lesson #4.3 quan ly file so lieu (phan 3 8 manipulating_data)
Spss lesson #4.3 quan ly file so lieu (phan 3 8 manipulating_data)Spss lesson #4.3 quan ly file so lieu (phan 3 8 manipulating_data)
Spss lesson #4.3 quan ly file so lieu (phan 3 8 manipulating_data)
 
Dàn bài nghiên cứu khoa học
Dàn bài nghiên cứu khoa họcDàn bài nghiên cứu khoa học
Dàn bài nghiên cứu khoa học
 
SBC 2012 - Một số thuật toán phân lớp và ứng dụng trong IDS (Nguyễn Đình Chiểu)
SBC 2012 - Một số thuật toán phân lớp và ứng dụng trong IDS (Nguyễn Đình Chiểu)SBC 2012 - Một số thuật toán phân lớp và ứng dụng trong IDS (Nguyễn Đình Chiểu)
SBC 2012 - Một số thuật toán phân lớp và ứng dụng trong IDS (Nguyễn Đình Chiểu)
 
Thu thập và trình bày dữ liệu thống kê
Thu thập và trình bày dữ liệu thống kêThu thập và trình bày dữ liệu thống kê
Thu thập và trình bày dữ liệu thống kê
 
MÔ HÌNH HỒI QUY TUYẾN TÍNH THEO SỐ LIỆU THEO THỜI GIAN
MÔ HÌNH HỒI QUY TUYẾN TÍNH THEO SỐ LIỆU THEO THỜI GIANMÔ HÌNH HỒI QUY TUYẾN TÍNH THEO SỐ LIỆU THEO THỜI GIAN
MÔ HÌNH HỒI QUY TUYẾN TÍNH THEO SỐ LIỆU THEO THỜI GIAN
 
Giao trinh-xu-ly-du-lieu-nghien-cuu-voi-spss-for-windows
 Giao trinh-xu-ly-du-lieu-nghien-cuu-voi-spss-for-windows Giao trinh-xu-ly-du-lieu-nghien-cuu-voi-spss-for-windows
Giao trinh-xu-ly-du-lieu-nghien-cuu-voi-spss-for-windows
 

Semelhante a Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

Bai 2 mo hinh nghien cuu va kiem dinh su tin cay thang do
Bai 2 mo hinh nghien cuu va kiem dinh su tin cay thang doBai 2 mo hinh nghien cuu va kiem dinh su tin cay thang do
Bai 2 mo hinh nghien cuu va kiem dinh su tin cay thang doNghiên Cứu Định Lượng
 
Phương pháp xử lý số liệu
Phương pháp xử lý số liệuPhương pháp xử lý số liệu
Phương pháp xử lý số liệunguoitinhmenyeu
 
Một số ứng dụng thống kê trong SPSS
Một số ứng dụng thống kê trong SPSSMột số ứng dụng thống kê trong SPSS
Một số ứng dụng thống kê trong SPSSBeriDang
 
Suy diễn thống kê và ngôn ngữ R (5): Phân tích tổng hợp (meta-analysis)
Suy diễn thống kê và ngôn ngữ R (5): Phân tích tổng hợp (meta-analysis)Suy diễn thống kê và ngôn ngữ R (5): Phân tích tổng hợp (meta-analysis)
Suy diễn thống kê và ngôn ngữ R (5): Phân tích tổng hợp (meta-analysis)Tài Tài
 
2. Phân tích định lượng.pdf
2. Phân tích định lượng.pdf2. Phân tích định lượng.pdf
2. Phân tích định lượng.pdfFred Hub
 
Isms regression vie
Isms regression vieIsms regression vie
Isms regression viezorro19
 
09 tvu sta301_bai7_v1.00131012140
09 tvu sta301_bai7_v1.0013101214009 tvu sta301_bai7_v1.00131012140
09 tvu sta301_bai7_v1.00131012140Yen Dang
 
Giới thiệu về SPSS
Giới thiệu về SPSSGiới thiệu về SPSS
Giới thiệu về SPSSkudos21
 
Bài Giảng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ.pdf
Bài Giảng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ.pdfBài Giảng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ.pdf
Bài Giảng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ.pdfjackjohn45
 
Chương v(tt). phuong phap thu thap so lieu
Chương v(tt). phuong phap thu thap so lieuChương v(tt). phuong phap thu thap so lieu
Chương v(tt). phuong phap thu thap so lieubesstuan
 
QUY TRÌNH THỰC HIỆN NGHIÊN CỨU ĐÁNH GIÁ TƯƠNG ĐƯƠNG SINH HỌC THUỐC GENERIC
QUY TRÌNH THỰC HIỆN NGHIÊN CỨU ĐÁNH GIÁ TƯƠNG ĐƯƠNG SINH HỌC THUỐC GENERIC QUY TRÌNH THỰC HIỆN NGHIÊN CỨU ĐÁNH GIÁ TƯƠNG ĐƯƠNG SINH HỌC THUỐC GENERIC
QUY TRÌNH THỰC HIỆN NGHIÊN CỨU ĐÁNH GIÁ TƯƠNG ĐƯƠNG SINH HỌC THUỐC GENERIC nataliej4
 
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhungHuong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhungNguyễn Ngọc Trâm
 
4.ANOVA - YẾN.pdf
4.ANOVA - YẾN.pdf4.ANOVA - YẾN.pdf
4.ANOVA - YẾN.pdfNhtLmNguyn3
 

Semelhante a Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics) (20)

Bai 2 mo hinh nghien cuu va kiem dinh su tin cay thang do
Bai 2 mo hinh nghien cuu va kiem dinh su tin cay thang doBai 2 mo hinh nghien cuu va kiem dinh su tin cay thang do
Bai 2 mo hinh nghien cuu va kiem dinh su tin cay thang do
 
PPNCKT_Chuong 4 p2
PPNCKT_Chuong 4 p2PPNCKT_Chuong 4 p2
PPNCKT_Chuong 4 p2
 
Phương pháp xử lý số liệu
Phương pháp xử lý số liệuPhương pháp xử lý số liệu
Phương pháp xử lý số liệu
 
Một số ứng dụng thống kê trong SPSS
Một số ứng dụng thống kê trong SPSSMột số ứng dụng thống kê trong SPSS
Một số ứng dụng thống kê trong SPSS
 
Suy diễn thống kê và ngôn ngữ R (5): Phân tích tổng hợp (meta-analysis)
Suy diễn thống kê và ngôn ngữ R (5): Phân tích tổng hợp (meta-analysis)Suy diễn thống kê và ngôn ngữ R (5): Phân tích tổng hợp (meta-analysis)
Suy diễn thống kê và ngôn ngữ R (5): Phân tích tổng hợp (meta-analysis)
 
2. Phân tích định lượng.pdf
2. Phân tích định lượng.pdf2. Phân tích định lượng.pdf
2. Phân tích định lượng.pdf
 
LÝ THUYẾT PROTOCOL.docx
LÝ THUYẾT PROTOCOL.docxLÝ THUYẾT PROTOCOL.docx
LÝ THUYẾT PROTOCOL.docx
 
Kiểm Định Anova Trong Spss.docx
Kiểm Định Anova Trong Spss.docxKiểm Định Anova Trong Spss.docx
Kiểm Định Anova Trong Spss.docx
 
Chapter 7
Chapter 7Chapter 7
Chapter 7
 
Isms regression vie
Isms regression vieIsms regression vie
Isms regression vie
 
09 tvu sta301_bai7_v1.00131012140
09 tvu sta301_bai7_v1.0013101214009 tvu sta301_bai7_v1.00131012140
09 tvu sta301_bai7_v1.00131012140
 
Giới thiệu về SPSS
Giới thiệu về SPSSGiới thiệu về SPSS
Giới thiệu về SPSS
 
Bài Giảng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ.pdf
Bài Giảng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ.pdfBài Giảng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ.pdf
Bài Giảng KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ.pdf
 
Chương v(tt). phuong phap thu thap so lieu
Chương v(tt). phuong phap thu thap so lieuChương v(tt). phuong phap thu thap so lieu
Chương v(tt). phuong phap thu thap so lieu
 
Nltk 2
Nltk 2Nltk 2
Nltk 2
 
QUY TRÌNH THỰC HIỆN NGHIÊN CỨU ĐÁNH GIÁ TƯƠNG ĐƯƠNG SINH HỌC THUỐC GENERIC
QUY TRÌNH THỰC HIỆN NGHIÊN CỨU ĐÁNH GIÁ TƯƠNG ĐƯƠNG SINH HỌC THUỐC GENERIC QUY TRÌNH THỰC HIỆN NGHIÊN CỨU ĐÁNH GIÁ TƯƠNG ĐƯƠNG SINH HỌC THUỐC GENERIC
QUY TRÌNH THỰC HIỆN NGHIÊN CỨU ĐÁNH GIÁ TƯƠNG ĐƯƠNG SINH HỌC THUỐC GENERIC
 
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhungHuong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
Huong dan thuc_hanh_spss_th_s_pham_le_hong_nhung
 
4.ANOVA - YẾN.pdf
4.ANOVA - YẾN.pdf4.ANOVA - YẾN.pdf
4.ANOVA - YẾN.pdf
 
Hdsd spss phan-1
Hdsd spss phan-1Hdsd spss phan-1
Hdsd spss phan-1
 
Chapter 9
Chapter 9Chapter 9
Chapter 9
 

Spss lesson 4.5 Lựa chọn đúng kỹ thuật thống kê (Choosing the right statistics)

  • 1. Phần 3 – Những phân tích căn bản trong SPSS 10 – Lựa chọn kỹ thuật thống kê phù hợp Hoàng Sĩ Thính Học viện Nông nghiệp Việt Nam Mobile: 0942293689 Email: Sithinhdf@gmail.com Facebook: Jamesunimelb@yahoo.com
  • 2. 1. Sự cần thiết phải chọn đúng kỹ thuật thống kê • Một trong những việc khó nhất đối với người nghiên cứu là chọn đúng kỹ thuật thống kê để phân tích số liệu • Việc lựa chọn kỹ thuật thống kê tùy thuộc vào câu hỏi nghiên cứu mà bạn đang phải trả lời, và đặc điểm số liệu bạn có • Vì vậy, là một người nghiên cứu, bạn cần có những hiểu biết căn bản về các kỹ thuật thống kê, các dạng câu hỏi phù hợp với các kiểu kỹ thuật thống kê, các giả định và yêu cầu của từng kỹ thuật thống kê. • Làm cách nào để hiểu được các điều trên??? Hãy đọc sách, bài báo… • Việc quyết định lựa chọn một kỹ thuật thống kê cũng giống như quyết định làm một món ăn. Bạn cần quan tâm đến hai điều: bạn đang có gì (what you have) và bạn muốn mốn gì với những gì mình có (what you want).
  • 3. 2. Khái quát chung về các kỹ thuật thống kê sử dụng trong nghiên cứu Tổng quát, các kỹ thuật thống kê được chia làm hai loại: các kỹ thuật phân tích mối quan hệ giữa các biến (vd: giữa tuổi và độ lạc quan); và các kỹ thuật so sánh khác biệt giữa các nhóm (vd: khác biệt về mức độ lạc quan giữa nam và nữ)
  • 4. 3. Kỹ thuật phân tích quan hệ giữa các biến liên tục (Exploring relationship) 1. Kỹ thuật phân tích tương quan (Correlation): Pearson correlation hoặc Spearman correlation được sử dụng để phân tích mối quan hệ (cả độ mạnh – strength, và xu hướng – direction) giữa hai biến liên tục. Chủ đề này được cover trong Chapter 11 2. Kỹ thuật phân tích tương quan từng phần (Partial correlation): là một dạng mở rộng của Pearson Correlation. Kỹ thuật này cho phép loại bỏ ảnh hưởng của một biến ngoại sinh (vd: biến lạm phát có thể làm cho phân tích tăng trưởng kinh tế trở nên mơ hồ). Nội dung này được phân tích kỹ trong chương 12
  • 5. 3. Phân tích hồi quy bội (hồi quy đa biến – Multiple Regression): – Là dạng mở rộng phức tạp của phân tích tương quan. – Kỹ thuật này cho phép phân tích ảnh hưởng (khả năng dự báo) của một nhóm các biếnđộc lập tới một biến phụ thuộc liên tục. – Kỹ thuật này được chi tiết ở Chapter 13 3. Kỹ thuật phân tích quan hệ giữa các biến liên tục (Exploring relationship)
  • 6. 4. Phân tích nhân tố (factor analysis): – kỹ thuật này cho phép chuyển một số lượng biến lớn (hoặc một số lượng lớn các thành phần của một biến) thành một số lượng biến nhỏ hơn (hoặc một số lượng nhỏ hơn các thành phần của biên – chỉ tiêu nghiên cứu). Tại sao??? Để tạo ra một tập hợp các biến (hoặc nhóm thành phần của biến) có ý nghĩa hơn – Việc gộp biến (nhóm các thành phần biến) được thực hiện như thế nào? Bằng cách phân tích đặc điểm tương quan, từ đó tìm ra các nhóm biết (nhóm thành phần biến) có tương quan rất mạnh. Các nhóm này sau đó sẽ được gộp thành một biến (hoặc một thành phần của biến) – Kỹ thuật này thường được sử dụng để phát triển một chỉ tiêu nghiên cứu (chỉ tiêu mới) 3. Kỹ thuật phân tích quan hệ giữa các biến liên tục (Exploring relationship)
  • 7. 1. Có thể sử dụng phân tích “Chi Square Test for Relatedness or Independence”. Ví dụ: bạn muốn xem liệu giới tính (biến gender – biến catigorical) có ảnh hưởng đến tỷ lệ người từ bỏ một phương thức trị bệnh (Drop out/ Continue). 2. Phân tích sự khác biệt (Discriminant function analysis): – Phân tích khả năng dự đoán dựa trên một tập biến độc lập đối với một biến categorical phụ thuộc – Điều đó cũng như bạn muốn tìm ra những biến có ảnh hưởng quyết định đến tình trạng phân loại nhóm của biến phụ thuộc (group membership) – Biến phụ thuộc thường là các tiêu chí rõ ràng (vd: passed/ failed; dropped out/ continued with a treatment) 4. Kỹ thuật phân tích quan hệ giữa các biến trong đó biến phụ thuộc là categorical (Exploring relationship)
  • 8. • Phân tích tương quan cổ điển (hoặc phân tích Canonical Correlation): – Dùng để phân tích mối quan hệ của hai nhóm biến – Vd: phân tích mối quan hệ giữa nhóm biến nhân chủng học (demographic variables) và nhóm biến gồm phúc lợi (wellbeing) và biến đánh giá (adjustment) • Mô hình phương trình cấu trúc (Structured Equation Modeling) – Cho phép kiểm định các mô hình trong đó có mô tả mối quan hệ giữa các biến – Cụ thể 1: có thể kiểm định độ mạnh trong tác động của từng biến đến mô hình, hoặc độ chặt (thích hợp) của mô hình với những số liệu bạn có. – Cụ thể 2: Kỹ thuật này còn cho phép so sánh giữa các dạng mô hình có thể thay thế lẫn nhau. 4. Kỹ thuật phân tích quan hệ giữa các biến trong đó biến phụ thuộc là categorical (Exploring relationship)
  • 9. 5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm T-Test • Chỉ sử dụng cho Parametric Test – biến liên tục • T-Test được sử dụng khi nào?? Khi bạn muốn so sánh giá trị trung bình của hai nhóm khác cases (vd: males và females), hoặc của hai dãy số liệu cùng cases (before và after). • Có 2 loại T-test: – Kiểm định T-test lặp (Paired sample t-tests, hay repeated measures): được dùng cho kiểm định khác biệt của chỉ tiêu ở hai thời điểm điều tra khác nhau trên cùng đối tượng (các cases ở hai lần là như nhau). Thông thường được ứng dụng cho các động thái can thiệp (chính sách) – Kiểm định T-test mẫu độc lập (Independent sample t-test): được dùng để so sánh giá trị trung bình biến (chỉ tiêu) của hai nhóm cases khác nhau cùng một thời điểm (males và females) • T-test được trình bày cụ thể ở Chapter 17 • Chú ý: Để kiểm định nhóm non-parametric người ta thường sử dụng Mann-Whitney U Test và Wilcoxon Signed Rank Test – Chi tiết trong Chapter 16
  • 10. 5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm Phân tích phương sai một chiều One-way analysis of variance - ANOVA • Chỉ dùng cho parametric test • Cũng giống như T-test, nhưng với số nhóm từ 2 trở lên (T-test chỉ làm cho 2 nhóm) • Tại sao lại gọi là one-way? Vì nó chỉ sử dụng trong nghiên cứu ảnh hưởng của 1 biến độc lập lên biến phụ thuộc • Kiểm định ANOVA chỉ giúp bạn cho biết có sự khác biệt hay không giữa các nhóm, nhưng không cho biết mức độ khác biệt là bao nhiêu (significant difference) – Post hoc analysis để tìm ra significant diffrence • Cũng có 2 dạng ANOVA: – Kiểm định ANOVA với biến lặp (cùng cases nhưng với hơn 2 thời điểm khác nhau) – Kiểm định ANOVA mẫu độc lập: kiểm định trung bình biến với 2 hoặc nhiều hơn số nhóm cases khác nhau (trẻ, trung niên, già) • One-way ANOVA được chi tiết trong Chapter 16, trong khi các kiểm định non- parametric như là Kruskal-Wallis Test and Friedman Test sẽ được trình bày trong Chapter 16
  • 11. • Cho phép phân tích ảnh hưởng của hai biến độc lập lên một biến phụ thuộc • Lợi thế của kỹ thuật này là cho phép kiểm định ảnh hưởng cộng hưởng (interaction effect) – tức là ảnh hưởng của một biến chịu tác động bởi một biến khác. Vd: mức độ lạc quan (optimism) tăng khi tuổi (age) tăng, nhưng chỉ với nhóm nam (males) • Kỹ thuật này còn cho phép kiểm định ảnh hưởng của riêng biệt từng biến độc lập (sex, age,…) đến biến phụ thuộc • Có hai kỹ thuật two-way ANOVA: ANOVA cho các nhóm khác nhau (between group ANOVA – các cases ở các nhóm khác nhau, vd: males và females), và ANOVA lặp (repeated measures ANOVA - cùng cases nhưng được theo dõi trong nhiều lần khác nhau) • Between group ANOVA và repeated measures ANOVA có thể được kết hợp cùng nhau trong cùng một nghiên cứu. Kỹ thuật kết hợp này được gọi là “Mixed Between-Within Designs” hoặc “Split- Plot” (chi tiết ở Chapter 20) • Kỹ thuật two-way ANOVA được chi tiết trong chapter 19 5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm Phân tích phương sai hai chiều Two-way analysis of variance - ANOVA
  • 12. • Được sử dụng để so sánh các nhóm cho (hoặc dựa trên) các biến phụ thuộc khác nhau, nhưng có liên quan đến nhau Vd: So sánh các biện pháp trị bệnh khác nhau (các nhóm khác nhau) trên cơ sở tập hợp các tác dụng (các biến phụ thuộc) về sợ hãi (anxiety), thất vọng (depression), và các triệu chứng vật lý (physical symptoms) • MANOVA có thể được sử dụng theo kiểu one-way, two-way hoặc các phân tích so sánh có nhiều hơn các biến độc lập • MANOVA được chi tiết trong Chapter 21 5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm Phân tích phương sai đa chiều Multivariate analysis of variance - MANOVA
  • 13. 5. Kỹ thuật thống kê phân tích khác biệt giữa các nhóm Phân tích hiệp phương sai Analysis of covariance (ANCOVA) • Kỹ thuật này cho phép bạn kiểm soát ảnh hưởng của biến ngoại sinh(confounding variable, hoặc covariate) đến mô hình • Vd: ảnh hưởng của các biến độc lập lên biến phụ thuộc (ảnh hưởng 1) có thể chịu ảnh hưởng (ảnh hưởng 2) bởi một biến (một số biến) nào khác. Kỹ thuật này cho phép bạn kiểm soát (loại trừ) ảnh hưởng 2 • ANCOVA có thể sử được sử dụng như là một phần của one-way, two-way, hoặc các thiết kế multivariate designs • ANCOVA được chi tiết trong Chapter 22
  • 14. 6. Chú ý khi ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn) • Như vậy có khá nhiều kỹ thuật thống kê, bạn phải lựa chọn cái nào phù hợp với những gì mình có và những gì mình muốn • Khi đi đến quyết định lựa chọn bạn cần phải quan tâm đến: – Câu hỏi nghiên cứu của bạn là gì? – Loại chỉ tiêu (biến) và thành phần biến mà bạn có trong phiếu điều tra – Đặc điểm số liệu của chỉ tiêu (biến) mà bạn có – Các giả định thống kê bạn cần phải đảm bảo ứng với mỗi kỹ thuật thống kê có thể sử dụng
  • 15. Bước 1: Câu hỏi nghiên cứu là gì? • Liệt kê tất cả những câu hỏi nghiên cứu bạn muốn trả lời • Chú ý: mỗi câu hỏi nghiên cứu có thể được hỏi theo những cách khác nhau (sử dụng những kỹ thuật khác nhau để trả lời) – Vd: khi bạn muốn nghiên cứu ảnh hưởng của tuổi (age) đến mức độ lạc quan (optimism), bạn có thể đặt thành các câu hỏi: • Có bất kỳ mối liên hệ nào giữa tuổi và mức độ lạc quan không? • Liệu người cao tuổi có lạc quan hơn người trẻ không? 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn)
  • 16. Bước 2: Xác định các chỉ tiêu (biến - scale) và các thành phần biến (items) dùng để trả lời từng câu hỏi nghiên cứu • Đặc điểm của chỉ tiêu và items trong chỉ tiêu có ý nghĩa quyết định đến kỹ thuật thống kê bạn sẽ sử dụng để trả lời câu hỏi nghiên cứu. • Cũng chính vì thế mà trước khi phát triển chỉ tiêu nghiên cứu (và phiếu điều tra) bạn cần chú ý đến dự định về các phân tích của mình về sau này • Chẳng hạn, cũng là thông tin về tuổi (age), các cách hỏi khác nhau sẽ tạo ra định dạng số liệu khác nhau, và do đó kỹ thuật thống kê sử dụng cũng sẽ khác: – Nếu bạn hỏi họ tick vào một trong hai lựa chọn dưới hoặc trên 35, thì bạn chỉ có hai giá trị biến tuổi, và như thế kỹ thuật thống kê sử dụng sẽ rất hạn chế. – Trái lại, nếu bạn yêu cầu người trả lời cho biết tuổi của họ (in years), tình hình sẽ khác hẳn. Bạn có một dãy số liệu (từ 18 đến 80+). Bạn có thể gộp nhóm tuổi (collapse) để thực hiện một số phân tích (như ANOVA), trong khi dãy số liệu ban đầu vẫn hoàn toàn khả thi cho phân tích khác (correlation chẳng hạn) Tóm lại: hãy kiểm tra lại các biến (cả độc lập và phụ thuộc) xem nó được đo lường thế nào (dạng số liệu là gì). Cái đó kết hợp với câu hỏi nghiên cứu, bạn sẽ có ý tưởng cho việc nên lựa chọn kỹ thuật thống kê nào! 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn)
  • 17. Bước 3: Xem xét kỹ hơn về đặc điểm của biến • Về tổng quát: biến nào là biến độc lập, biến nào là biến phụ thuộc? Câu trả lời đến từ đặc điểm số liệu bạn có, cộng với hiểu biết của bạn về nội dung nghiên cứu, về các nguyên lý, và về các nghiên cứu trước đó • Hãy chắc chắn về mặt tư duy: biến nào gây nên ảnh hưởng (đó là independent variable), biến nào chịu ảnh hưởng (đó là dependent variable) • Có một số kỹ thuật thống kê (vd: correlation) không cần phân biệt đầu là biến độc lập, đâu là biến phụ thuộc. Tuy nhiên, với một số kỹ thuật khác thì lại khác (vd: ANOVA) • Chú ý về định dạng giá trị của biến – Dạng biến phân loại (categorical – dạng biến định danh): Males/ females – Dạng biến ordinal (ranking: 1st, 2nd, 3rd), và – Dạng biến liên tục (continuous): dạng interval và ratio , vd: ages in years, scores on the Optimism scale 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn)
  • 18. Bước 3: Xem xét kỹ hơn về các biến Một số chú ý thêm về biến liên tục và biến phân loại: • Đối với biến liên tục, bạn cần tìm hiểu thêm thông tin về phân bố của chúng: chuẩn hay không chuẩn? Độ bao phủ (range) của nó ra sao? (Chapter 6) • Đối với biến categorical (vd: males/females) hãy tìm ra số lượng các cases trong mỗi nhóm. Số lượng các cases trong các nhóm có cân bằng nhau hay không? Có nhóm nào bị trống không? (Chapter 6) Tất cả những thông tin trong bước 3 bạn có được từ biến sẽ có tác dụng rất tích cực trong việc đi đến quyết định lựa chọn kỹ thuật thống kê cho đề tài của mình 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn)
  • 19. Bước 4: Tưởng tượng biểu đồ (đồ thị, biểu, bảng) cho mỗi câu hỏi nghiên cứu • Về khái quát: bạn cần rõ tôi muốn phân tích quan hệ giữa các biến, hay muốn phân tích sự khác biệt giữa các nhóm • Từ đó hãy tóm lược đặc điểm của các thông tin bạn có, rồi nghĩ (brainstorming) ra những biều đồ bạn sẽ dùng để trả lời cho mỗi câu hỏi nghiên cứu. Một số Slide sau sẽ minh hoạc một số ví dụ chỉ cho bạn biết bạn cần tư duy như thế nào cho bước 4 (rất quan trọng – vd cho đề cương chi tiết của một nghiên cứu) 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn)
  • 20. Vd 1: Nếu bạn muốn trả lời câu hỏi: “liệu có mối quan hệ giữa tuổi (age) và mức độ lạc quan (optimism) không?”, thì bạn cần phải tư duy về những nội dung sau: • Tư duy về biến (variables): – Biến tuổi (age): là biến continuous, đo lường bằng số năm, từ 18 đến 80+ – Biến lạc quan (optimism): là biến continuous, đo lường bằng mức độ lạc quan, từ 6 đến 30. Tại sao lại từ 6 đến 30??? • Tư duy về dạng biểu đồ (diagram) – Hãy sử dụng literature để phán đoán về mối quan hệ – Hình dung (vẽ) mối quan hệ ra giấy 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)
  • 21. Ví dụ 2: Với câu hỏi “liệu nam giới có lạc quan hơn nữ giới không?”, bạn cần phải tư duy như sau: • Variables: – Sex: independent, categorical (two groups): males/ females – Optimism: dependent, continuous, đo lường bằng mức độ lạc quan (từ 6 đến 30) • Hình dung dạng biểu đồ: – Chỉ có một biến độc lập dạng phân loại (2 nhóm) và 1 biến phụ thuộc liên tục – Do đó, dạng biểu đồ sẽ như sau: 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)
  • 22. Ví dụ 3: Với câu hỏi “liệu ảnh hưởng của tuổi đến mức độ lạc quan có khác nhau giữa 2 nhóm nam và nữ không?”, bạn cần phải tư duy: • Kiểu ảnh hưởng: ảnh hưởng tổng hợp của cả biến tuổi (age) và biến giới tính (gender). Do đó bạn có thể chia tuổi thành các nhóm khác nhau (vd: dưới 30, từ 31 đến 49 và từ 50 trở lên) • Tư duy về biến (variables): – Sex: independent, categorical: males/ females; – Age: independent, categorical, chia làm 3 nhóm cân bằng nhau – Optimism: dependent, continuous: đo lường bằng mức độ lạc quan, từ 6 đến 30 • Biểu đồ có thể sẽ như sau: 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)
  • 23. Ví dụ 4: Với câu hỏi “sự biến động trong mức độ hài lòng về cuộc sống có thể được giải thích như thế nào bởi các yếu tố thuộc về đặc điểm cá nhân (tự trọng – self-esteem, optimism – lạc quan, perceived control – điều khiển nhận thức)?”, bạn cần tư duy về: • Variables: 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn) – Bước 4 (tiếp)
  • 24. Bước 5: Quyết định xem kỹ thuật thống kê nào sẽ phù hợp: thống kê tham số (parametric) hay thống kê phi tham số (non-parametric) • Nhớ rằng các kỹ thuật thống kê có thể đi (được chia) theo hai nhóm: thống kê tham số (parametric statistics) và thống kê phi tham số (non-parametric statistics). Thông thường thống kê tham số được xem là mạnh hơn, tuy nhiên nó đò hỏi những ràng buộc nhất định • Ví dụ về giả định của thống kê tham số: giá trị biến phải đảm bảo phân bố chuẩn • Ngoài ra, các thống kê tham số đòi hỏi các giả định khác (chi tiết ở từng Chapter đối với từng kỹ thuật). • Do đó, bạn cần kiểm tra tình trạng vi phạm các giả định của kỹ thuật thống kê trước khi bạn dùng mỗi kỹ thuật cụ thể. 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn)
  • 25. Bạn có thể làm gì nếu số liệu vi phạm các giả định thống kê??? Có một số cách: • Cách 1 (Option 1): bạn vẫn có thể dùng parametric statistics với hy vọng rằng các vi phạm không ảnh hưởng quá nghiêm trọng đến kết quả nghiên cứu. – Một số học giả cho rằng các tiếp cận (trong đó có kỹ thuật thống kê) thường khá mạnh (robust) và chúng có thể hạn chế tốt những ảnh hưởng của các vi phạm, đặc biệt nếu dung lượng mẫu lớn – Nếu bạn vẫn lựa chọn tiếp tục con đường của mình, bạn cần thu thập nhiều bằng chứng để hỗ trợ cho quyết định của mình. Hãy sử dụng các nghiên cứu có sẵn, đặc biệt là các nghiên cứu có sử dụng cùng chỉ tiêu nghiên cứu như của bạn. Hãy xem họ đã làm gì với vấn đề phi phạm giả thiết ấy??? • Cách 2 (Option 2): Bạn có thể manipulate số liệu của mình nhằm thỏa mãn các giả thiết thống kê của mình (vd: bạn có một số cách để chuyển từ biến không chuẩn thành biến chuẩn – Chapter 8). Một khi thực hiện chuyển biến, bạn cũng cần tìm đủ bằng chứng để support cho việc làm của mình • Cách 3 (Option 3 – cách cuối cùng): nếu số liệu không đảm bảo giả định thống kê parametric, hãy sử dụng thống kê non-parametric. Mặc dù các kỹ thuật này cũng yêu cầu một số giả định, nhưng sẽ không khắt khe như trường hợp parametric statistic. Tuy nhiên, các kỹ thuật này sẽ “yếu” hơn các kỹ thuật parametric statistics (Non-parametric statistics sẽ kỹ hơn ở Chapter 16) 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn)- Bước 5 (tiếp)
  • 26. Bước 6: Ra quyết định cuối cùng Đến đây bạn sẽ biết nên dùng kỹ thuật thống kê nào cho phù hợp với những gì bạn có và những gì bạn muốn! 7. Các bước ra quyết định lựa chọn kỹ thuật thống kê phù hợp (Quyết định lựa chọn phương thức làm món ăn)
  • 27. 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.1 Phân tích quan hệ giữa các biến Kỹ thuật 1: Chi square for independence Vd câu hỏi nghiên cứu: “quan hệ giữa giới tính và số người từ bỏ điều bệnh như thế nào?” • Bạn cần phải có gì? – Một biến độc lập, dạng phân loại (sex: males/ females) – Một biến phụ thuộc, dạng phân loại (dropout: Yes/ No) • Bạn muốn gì? Số người (từ bỏ/ không từ bỏ điều trị) ở mỗi nhóm (males/ females) • Dạng biểu độ sẽ là:
  • 28. • Câu hỏi nghiên cứu: “liệu có quan hệ giữa tuổi và mức độ lạc quan không? Liệu lạc quan có tăng khi tuổi tăng không?” • Những thứ bạn phải có: 2 biến continuous (age và optimism) • Biểu đồ sẽ có dạng dưới đây • Kỹ thuật thống kê có thể thay thế: Spearman's Rank Order Correlation 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.1 Phân tích quan hệ giữa các biến Kỹ thuật 2: Phân tích tương quan (Correlation)
  • 29. Câu hỏi nghiên cứu: Sau khi đã kiểm soát được biến socially desirable responding, có mối quan hệ rõ rệt nào giữa biến optimism và life satisfaction không? • Bạn cần có gì? 3 biến liên tục (life satisfaction, optimism, và socially desirable responding) 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.1 Phân tích quan hệ giữa các biến Kỹ thuật 3: Phân tích tương quan từng phần (Partial Correlation)
  • 30. • Câu hỏi nghiên cứu: Sự biến động của biến life satisfaction được giải thích như thế nào bởi một tập hợp các biến self-esteem, optimism, và perceived control? Biến nào giải thích tốt hơn về sự biến động của life satisfaction? • Bạn cần có gì? – Một biến phụ thuộc, dạng continuous (life satisfaction), và – Hai hoặc nhiều hơn hai biến độc lập, dạng continuous (self-esteem, optimism, perceived control) • Dạng biểu đồ: 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.2 Phân tích sự khác biệt giữa các nhóm Kỹ thuật 6: Phân tích tương hồi quy đa biến (Multiple regression)
  • 31. Câu hỏi nghiên cứu: “nam giới có lạc quan hơn nữ giới không?” • Bạn cần có gì? – Một biến độc lập, dạng phân loại chia thành hai nhóm (biến sex: males/ females) – Một biến độc lập, dạng continuous (optimism scores) • Dạng biểu đồ: • Kỹ thuật thống kê phi tham số thay thế: Mann-Whitney Test 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.2 Phân tích khác biệt giữa các nhóm Kỹ thuật 7: Kiểm định T-test mẫu độc lập (Independent samples T-test)
  • 32. Câu hỏi nghiên cứu: “liệu khóa đào tạo 10 tuần về tâm lý có làm giảm mức độ sợ hãi của người tham gia hay không? Có sự thay đổi nào trong mức độ sợ hãi từ thời gian 1 (trước đào tạo - pre-intervention) đến thời gian 2 (sau đào tạo – post- intervention) hay không?” • Bạn cần có gì? – Một biến độc lập, dạng phân loại (Time 1 – before intervention, Time 2 – after intervention) – Một biến phụ thuộc, dạng continuous (anxiety scores) • Chú ý: trường hợp này là cùng cases, được theo dõi vào các thời điểm khác nhau • Dạng biểu đồ: • Thống kê phi tham số có thể thay thế: Wilcoxon Signed-Rank Test 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.2 Phân tích khác biệt giữa các nhóm Kỹ thuật 8: Kiểm định T-test mẫu lặp (Paired Samples T-test – repeated measures)
  • 33. • Câu hỏi nghiên cứu: “mức độ lạc quan (optimism score) có khác nhau giữa các nhóm người dưới 30 tuổi, từ 31 đến 49 tuổi, và từ 50 tuổi trở lên không?” • Bạn cần có: – Một biến độc lập, dạng phân loại cho 2 hoặc nhiều hơn 2 nhóm (age: under 30, 31-49, over 50) và – Một biến phụ thuộc, dạng continuous (optimism score) • Thống kê phi tham số có thể thay thế: Không có • Chú ý thêm: Phân tích phương sai có thể được mở rộng cho các trường hợp có từ 3 biến độc lập trở lên (thường được gọi là phân tích nhân tố của phương sai – Factoral Analysis of Variance) 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.2 Phân tích khác biệt giữa các nhóm Kỹ thuật 9: Phân tích ANOVA một chiều mẫu độc lập (One-way between groups analysis of Variance)
  • 34. • Câu hỏi nghiên cứu: “Biện pháp can thiệp nào (kỹ năng toán – math skills/ và tạo niềm tin – confidence building) có hiệu quả hơn trong giảm thiểu thống kê về nỗi sợ hãi được đo lường trong 3 giai đoạn (trước khi can thiệp – pre-intervention, sau khi can thiệp – post-intervention, ba tháng sau khi can thiệp – three month follow up) • Bạn cần có: – Một biến độc lập chia thành các nhóm khác nhau (one between groups independent variable – type of intervention) – Một biết độc lập chia thành các nhóm như nhau (one within groups independent variable – time1, time2, time3) • Dạng biểu đồ như sau: • Thống kê phi tham số có thể thay thế: không có 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.2 Phân tích khác biệt giữa các nhóm Kỹ thuật 10: Phân tích ANOVA kết hợp cả mẫu độc lập và mẫu lặp (Mixed between and within groups analysis of Variance)
  • 35. • Câu hỏi nghiên cứu: “liệu nam giới có khả năng kiểm soát tốt hơn nữ giới trong những vấn đề liên quan đến sức khỏe thể chất và tâm lý (sợ hãi, thất vọng, và áp lực cuộc sống)?” • Bạn cần có: – Một biến độc lập, dạng định danh (sex: males/ females); và – Hai hoặc nhiều hơn hai biến phụ thuộc, dạng continuous (anxiety, depression, and perceived stress) • Dạng biểu đồ có thể là: • Kỹ thuật thống kê phi tham số có thể thay thế: Không có • Chú ý thêm: MANOVA có thể được sử dụng với phân tích một chiều (01 biến độc lập), hoặc hai chiều (02 biến độc lập), và nhiều chiều hơn nữa. 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.2 Phân tích khác biệt giữa các nhóm Kỹ thuật 11: Phân tích phương sai đa chiều (Multivariate Analysis of Variance - MANOVA)
  • 36. • Câu hỏi nghiên cứu: “Có hay không sự khác biệt về mức độ sợ hãi giữa hai biện pháp điều trị (hai nhóm khác nhau) gồm maths skills và confidence building, giả định rằng những ảnh hưởng của mức độ sợ hãi trước khi có các biệt pháp can thiệp (điều trị) đã được kiểm soát (hoặc loại bỏ) • Bạn cần có gì? – Một biến độc lập, dạng phân loại (type of intervention – maths skills và confidence building) – Một biến phụ thuộc, dạng continuous (Fear scores at Time 2); và – Một biến kiểm soát (tức là biến ta muốn tách ảnh hưởng của nó ra), dạng continuous (Fear scores at Time 1 – Pre-intervention) • Thống kê phi tham số có thể thay thế: Không có • Chú ý thêm: • ANCOVA có thể sử dụng với phân tích một chiều (một biến độc lập), hai chiều (hai biến độc lập), và phân tích đa chiều (hai hoặc nhiều hơn hai biến phụ thuộc) 8. Các tính năng chủ yếu của một số kỹ thuật thống kê căn bản 8.2 Phân tích khác biệt giữa các nhóm Kỹ thuật 12: Phân tích hiệp phương sai (Analysis of Covariance - ANCOVA)
  • 37. Bảng tóm tắt các kỹ thuật thống kê phổ biến
  • 38. Bảng tóm tắt các kỹ thuật thống kê phổ biến