Biểu đồ phân tán trong quản lý chất lượng và 5 Lưu ý quan trọng

Biểu đồ phân tán (scatter plot) là một loại biểu đồ trực quan hóa mối quan hệ giữa hai biến số liên tục và được ứng dụng nhiều trong thống kê, khoa học dữ liệu, kinh doanh và nhiều lĩnh vực khác. Cùng Vinacontrol CE Hồ Chí Minh tìm hiểu về loại biểu đồ này cũng như những lưu ý quan trọng của nó trong quản lý chất lượng. 

1. Biểu đồ phân tán (Scatter Plot) là gì?

Biểu đồ phân tán (hay còn được gọi là scatter plot, scatter diagram, scatter graph, biểu đồ scatter, biểu đồ tán xạ) là một công cụ trực quan để biểu diễn mối quan hệ giữa hai biến số dựa trên tọa độ toán học. Trên biểu đồ này, trục Oy (trục tung) thể hiện các giá trị của biến phụ thuộc, trong khi trục Ox (trục hoành) thể hiện các giá trị của biến độc lập được sử dụng để dự đoán và phân tích.

Scatter plot có nguồn gốc từ thế kỷ 19 khi nhà khoa học người Anh Francis Galton nghiên cứu về di truyền và biến đổi của các đặc tính sinh học. Vào đầu thế kỷ 20, việc phát triển các phương pháp thống kê đã làm cho biểu đồ scatter trở nên phổ biến hơn để đo lường và kiểm tra mối tương quan giữa các biến số.

Scatter diagram cũng được áp dụng rộng rãi trong nhiều lĩnh vực khoa học khác nhau, bao gồm vật lý, sinh học, y học, kinh tế và xã hội học. Nó là một công cụ quan trọng trong việc phân tích dữ liệu và khám phá thông tin từ dữ liệu.

>>> XEM NGAY: 15 Lý do nghỉ việc thuyết phục [kèm mẫu] cùng các gợi ý chi tiết

Ví dụ về scatter plot

Một cửa hàng kem ở Mỹ theo dõi số lượng kem họ bán được trong ngày so với nhiệt độ vào buổi trưa cùng ngày hôm đó. Số liệu được theo dõi trong vòng 12 ngày và đây là kết quả thống kê được:

Số lượng kem bán được và nhiệt độ

Nhiệt độ (°C)

Số lượng kem bán được

14.2°

$215

16.4°

$325

11.9°

$185

15.2°

$332

18.5°

$406

22.1°

$522

19.4°

$412

25.1°

$614

23.4°

$544

18.1°

$421

22.6°

$445

17.2°

$408

Và đây là kết quả được biểu thị bằng biểu đồ scatter:

biểu đồ phân tán
Đồ thị phân tán biểu thị mối liên hệ giữa số lượng kem bán được và nhiệt độ

Qua biểu đồ, có thể thấy rằng, khi thời tiết ấm áp hơn, doanh số bán hàng tăng lên. Tuy nhiên, đây chưa phải là mối quan hệ hoàn hảo.

>>> KHÔNG NÊN BỎ QUA: Tăng x5 hiệu quả của scatter chart khi kết hợp với TOP 7 công cụ quản lý chất lượng hiệu quả nhất mọi thời đại

2. Cách hoạt động của biểu đồ phân tán

Scatter plot là một loại biểu đồ sử dụng hai trục để biểu diễn hai biến số và quan hệ giữa chúng. Mỗi điểm trên biểu đồ đại diện cho một cặp giá trị của hai biến số. Các điểm này được vẽ trên biểu đồ sao cho vị trí của chúng trên trục tương ứng thể hiện giá trị của hai biến số.

Có một số khía cạnh quan trọng trong scatter plot:

  • Mối quan hệ tuyến tính hoặc phi tuyến tính: Nếu các điểm trên biểu đồ scatter thẳng hàng với nhau, chúng cho thấy một mối quan hệ tuyến tính. Ngược lại, nếu các điểm không thẳng hàng mà có hình dạng cong, chúng cho thấy một mối quan hệ phi tuyến tính.
  • Mức độ mạnh yếu của mối quan hệ: Nếu các điểm trên scatter diagram gần nhau và có xu hướng tạo thành một đường thẳng hoặc hình dạng gần thẳng, chúng cho thấy một mối quan hệ mạnh. Nếu các điểm phân tán xa nhau và không có hình dạng rõ ràng, chúng cho thấy một mối quan hệ yếu.

Để làm rõ hơn mối quan hệ và xu hướng trên đồ thị phân tán, có thể sử dụng đường xu hướng. Đường xu hướng là một đường thẳng hoặc đường cong được vẽ trên biểu đồ để hướng dẫn và mô tả xu hướng chung của dữ liệu.

>>> XEM THÊM: ISO 9000 là gì? Định nghĩa và các nội dung chính của tiêu chuẩn

3. Khi nào nên sử dụng biểu đồ phân tán?

Biểu đồ phân tán (scatter plot) được sử dụng chủ yếu để quan sát và biểu diễn mối quan hệ giữa hai biến số. Khi bạn muốn phân tích tương quan hoặc hồi quy, việc sử dụng scatter plot trước tiên là rất quan trọng. Biểu đồ này giúp bạn hiểu mối quan hệ tuyến tính hoặc nhận biết những điểm ngoại lệ có thể tồn tại trong dữ liệu.

Bằng cách sử dụng scatter diagram, bạn có thể xác định hướng, độ mạnh và tính tuyến tính của mối quan hệ giữa hai biến số. Nó cũng cho phép bạn nhận thấy sự tương quan ban đầu giữa hai biến độc lập một cách dễ dàng.

biểu đồ phân tán
Khi nào nên sử dụng biểu đồ phân tán?

>> ĐỌC TIẾP: 2 Phút hiểu hết về Biểu đồ Histogram trong quản lý chất lượng

4. 4 Bước vẽ đồ thị phân tán

Để vẽ được một scatter diagram hoàn chỉnh, chi tiết, bạn có thể tham khảo và thực hiện theo quy trình 4 bước sau:

Bước 1: Thu thập dữ liệu các cặp biến số. Số lượng các cặp biến số phải từ 30 trở lên.

Bước 2: Vẽ đồ thị, với trục tung là một biến số và trục hoành là kết quả của biến số đó hoặc một biến số thứ hai.

Bước 3: Biểu diễn các điểm trên đồ thị bằng các điểm thể hiện mối tương quan giữa hai biến số. Trong trường hợp có các điểm trùng nhau, bạn có thể sử dụng các ký hiệu riêng để phân biệt chúng.

Bước 4: Nhận xét mức độ liên quan giữa hai biến số dựa trên hệ số tương quan. Hệ số tương quan là một chỉ số thống kê cho biết mối quan hệ giữa hai biến số. 

>>> XEM THÊM: Đào tạo chuyên gia đánh giá nội bộ ISO 22000:2018

5. 3 Loại quan hệ tương quan trong biểu đồ scatter

Trong một biểu đồ scatter, mối quan hệ giữa hai biến số được biểu thị bằng hệ số tương quan. Có 3 loại quan hệ tương quan chính:

5.1 Scatter plot thể hiện mối tương quan dương

Khi các điểm trong biểu đồ tăng lên khi di chuyển từ trái sang phải, đó là một tương quan dương. Nghĩa là giá trị của một biến tăng theo giá trị của biến khác. Có ba loại tương quan dương:

  • Tương quan dương hoàn hảo: Các điểm hình thành một đường thẳng hoàn hảo, có mối liên hệ chặt chẽ giữa hai biến số. Khi giá trị của biến x tăng, giá trị của biến y cũng tăng theo cách đúng đắn và nhất quán.
  • Tương quan dương cao: Các điểm gần nhau, cho thấy sự tương quan mạnh mẽ giữa hai biến số. Khi giá trị của biến x tăng, giá trị của biến y cũng tăng, mặc dù không cần phải là một đường thẳng hoàn hảo.
  • Tương quan dương thấp: Các điểm phân tán rải rác và không có mối liên hệ rõ ràng giữa hai biến số. Mặc dù có một sự tương quan dương nhưng nó không đủ mạnh để được coi là cao.
biểu đồ phân tán
3 dạng Scatter plot thể hiện mối tương quan dương

>>> XEM THÊM: Đào tạo an toàn điện

5.2 Scatter plot thể hiện mối tương quan âm

Khi các điểm trong scatter graph chuyển từ trái sang phải, và chúng có xu hướng giảm dần, ta gọi đó là mối tương quan âm. Điều này có nghĩa là giá trị của một biến giảm khi giá trị của biến khác tăng. Có ba loại mối tương quan âm:

  • Tương quan âm hoàn hảo: Các điểm hình thành một đường thẳng gần như thẳng đứng, với mỗi điểm cao hơn trên trục x thì điểm tương ứng sẽ thấp hơn trên trục y.
  • Tương quan âm cao: Các điểm có xu hướng gần nhau, tức là khi giá trị của biến x tăng, giá trị của biến y giảm.
  • Tương quan âm thấp: Các điểm phân tán rải rác và không có mối liên hệ rõ ràng giữa hai biến số.
biểu đồ phân tán
Scatter plot thể hiện mối tương quan âm

>>> XEM NGAY: Biểu đồ xương cá trong quản trị sản xuất và vai trò quan trọng

5.3 Scatter plot thể hiện mối tương quan không liên quan (bằng 0)

Trong Scatter plot, khi mối tương quan giữa hai biến số là không liên quan (bằng 0), có nghĩa là không có mối quan hệ hoặc sự phụ thuộc giữa chúng theo một cách tuyến tính. Các điểm biểu thị sẽ được phân bố ngẫu nhiên trên scatter diagram và không theo bất kỳ hình dạng nào cụ thể.

scatter plot
Biểu đồ minh họa Scatter plot thể hiện mối tương quan không liên quan

>>> XEM THÊM: Kiểm định hệ thống chống sét | Thực hiện toàn quốc

6. Ưu và nhược điểm khi sử dụng biểu đồ phân tán

Mỗi công cụ đều có ưu điểm và nhược điểm riêng, biểu đồ Scatter cũng không phải là ngoại lệ. Bên cạnh những ưu điểm của nó, scatter graph cũng có một số nhược điểm cần được khắc phục. Cụ thể như sau:

6.1 Ưu điểm của biểu đồ Scatter

Scatter diagram có những ưu điểm như:

  • Biểu diễn rõ ràng mối quan hệ giữa các dữ liệu

Biểu đồ Scatter cho thấy hướng, độ mạnh và tính tuyến tính của mối quan hệ giữa hai biến số. Bằng cách nhìn vào hình dạng của các chấm trên biểu đồ, bạn có thể nhận ra các xu hướng tiềm ẩn trong dữ liệu. 

>>> THAM KHẢO THÊM: 35+ Ý tưởng trò chơi team building trong nhà đơn giản, hiệu quả

  • Dễ xây dựng và dễ hiểu

Biểu đồ phân tán là một công cụ đồ họa đơn giản và linh hoạt, không đòi hỏi nhiều dữ liệu để vẽ. Chỉ cần có ít nhất hai cột hoặc hàng dữ liệu số và tiêu đề tương ứng, bạn có thể vẽ biểu đồ phân tán bằng nhiều phần mềm khác nhau như Excel, R, Python, Tableau, Power BI và Spotfire.

Đồ thị phân tán sử dụng các chấm để biểu diễn giá trị của hai biến số và dễ hiểu. Bằng cách quan sát sự phân bố của các chấm trên biểu đồ, ta có thể nhận thấy mối quan hệ giữa hai biến và có cái nhìn tổng quan về xu hướng, tương quan và tính tuyến tính của dữ liệu.

>>> ĐỌC THÊM: 20+ Mẫu sơ đồ tổ chức công ty theo loại hình, lĩnh vực, bộ phận

  • Dễ dàng xác định phạm vi dữ liệu

Scatter plot cho thấy giá trị nhỏ nhất, lớn nhất và trung bình của mỗi biến số trên trục ngang và trục dọc. Bạn cũng có thể sử dụng các công cụ như khoảng tin cậy hoặc khoảng dự đoán để ước lượng giá trị của một biến số khi biết giá trị của biến số kia.

>>> ĐỌC NGAY: Chiến lược Just in Time và 5 bài học từ các Doanh nghiệp lớn

6.2 Nhược điểm của biểu đồ Scatter

Những nhược điểm mà scatter graph vẫn còn tồn đọng như:

  • Không hiệu quả trong trường hợp có quá nhiều dữ liệu

Khi số lượng dữ liệu quá lớn, các chấm trên scatter plot có thể bị chồng lấn lên nhau, làm mất đi sự rõ ràng và khả năng phân tích của biểu đồ. Điều này cũng có thể gây ra hiện tượng overplotting, khi các chấm có cùng giá trị của một biến số nhưng khác giá trị của biến số kia.

Giải pháp: Bạn có thể sử dụng các kỹ thuật như làm mờ, thay đổi kích thước hoặc màu sắc của các chấm, hoặc sử dụng các biểu đồ khác.

biểu đồ phân tán
Ví dụ cho hiện tượng overplotting trong biểu đồ phân tán

>>> ĐỌC THÊM: [TẢI MIỄN PHÍ] 15 Mẫu đơn xin nghỉ việc chi tiết, chuyên nghiệp

  • Đôi khi các biến có liên kết nhưng lại không có ý nghĩa về quan hệ

Thường thì khi hai biến số có mối tương quan cao, tức là chúng có xu hướng thay đổi cùng nhau. Tuy nhiên, điều này không đồng nghĩa với việc chúng có mối quan hệ nguyên nhân – kết quả. Có thể hai biến số chỉ là những biến trung gian cho một biến số khác, hoặc chỉ là sự trùng hợp ngẫu nhiên. 

Để xác định mối quan hệ nguyên nhân – kết quả, cần có sự nghiên cứu kỹ lưỡng và phân tích bổ sung để loại trừ những yếu tố ngẫu nhiên và xác định được cơ chế tương quan giữa hai biến số.

Ví dụ, có thể có một mối tương quan cao giữa số lượng kem bán ra và số vụ cướp bóc xảy ra trong một năm, nhưng điều này không có nghĩa là kem gây ra cướp bóc hoặc ngược lại. Có thể hai biến số này đều bị ảnh hưởng bởi một biến số khác là nhiệt độ.

Giải pháp: Chọn lọc các biến phù hợp khi biểu diễn biểu đồ.

>>> THAM KHẢO NGAY: 18 Bảng đánh giá nhân viên theo tháng, năm, ngành nghề chi tiết

  • Cẩn trọng khi giải thích mối quan hệ nhân quả dựa trên các tương quan

Khi bạn vẽ biểu đồ phân tán để khám phá mối quan hệ giữa hai biến số, bạn cần phải cẩn trọng khi suy luận về mối quan hệ nhân quả dựa trên các tương quan. Tương quan chỉ cho thấy sự liên kết giữa hai biến số, không cho thấy sự ảnh hưởng của một biến số lên biến số kia.

Giải pháp: Để chứng minh được mối quan hệ nhân quả, bạn cần có các bằng chứng khác như thiết kế nghiên cứu, kiểm tra giả thuyết và phân tích thống kê.

>>> ĐỌC NGAY: Văn hóa doanh nghiệp của Vinamilk và 3 bài học giá trị

7. 4 Gợi ý giúp xây dựng biểu đồ phân tán hiệu quả

Để tăng tính hiệu quả cho cho biểu đồ phân tán, bạn có thể cân nhắc và thêm 4 gợi ý sau khi xây dựng scatter diagram:

7.1 Thêm đường xu hướng

Đường xu hướng là một đường thẳng hoặc cong được vẽ trên scatter graph để thể hiện xu hướng của dữ liệu. Việc thêm vào biểu đồ scatter một đường xu hướng sẽ giúp bạn nhận ra mối quan hệ tuyến tính hoặc phi tuyến giữa hai biến số, cũng như đánh giá độ mạnh và hướng của mối quan hệ. Đường xu hướng cũng có thể được sử dụng để dự đoán giá trị của một biến số khi biết giá trị của biến số kia.

>>> TÌM HIỂU NGAY: Kênh phân phối là gì? Cách lựa chọn kênh phân phối phù hợp

7.2 Phân loại biến thứ ba bằng màu sắc và hình dạng

Nếu có một biến số thứ ba ngoài hai biến số liên tục, bạn có thể sử dụng màu sắc và hình dạng để phân loại các điểm trên biểu đồ phân tán theo giá trị của biến số thứ ba. Bạn có thể sẽ phải bất ngờ vì những gì bạn có thể sẽ khám phá được về các mối quan hệ phức tạp hơn giữa các biến số, cũng như nhận ra các nhóm hoặc các ngoại lệ trong dữ liệu.

>>> ĐỌC THÊM: Ma trận BCG và hướng dẫn phân tích chi tiết từ A-Z

7.3 Mã hóa nếu biến thứ ba có giá trị số

Khi có một biến thứ ba có giá trị số, bạn có thể sử dụng mã hóa phổ biến bằng cách thay đổi kích thước của các điểm trên biểu đồ. Điều này tạo ra một loại biểu đồ phân tán được gọi là biểu đồ bong bóng. Trong biểu đồ bong bóng, kích thước của các điểm biểu thị phụ thuộc vào giá trị của biến thứ ba. Khi giá trị tăng, kích thước điểm cũng tăng lên, và ngược lại. Công cụ này giúp trực quan hóa mối quan hệ giữa ba biến số và cho phép phân loại và so sánh dữ liệu dựa trên hai biến số chính và biến thứ ba.

>>> ĐỌC TIẾP: MBTI là gì? 16 Loại tính cách MBTI chi tiết và cách ứng dụng

7.4 Sử dụng thêm chú thích và màu sắc 

Chú thích (hoặc nhãn) và màu sắc đóng vai trò quan trọng trong việc làm cho biểu đồ phân tán trở nên dễ hiểu và trực quan hơn. Chú thích là các ký tự, chẳng hạn chữ hoặc số, được gắn với các điểm trên biểu đồ để cung cấp thông tin bổ sung về dữ liệu. Màu sắc, qua việc sử dụng các gam màu khác nhau, giúp làm nổi bật các điểm trên biểu đồ. Cả hai yếu tố này cùng nhau giúp truyền đạt thông điệp rõ ràng và thu hút sự chú ý của người xem đối với biểu đồ phân tán.

biểu đồ phân tán
Sử dụng chú thích và màu sắc giúp cho biểu đồ càng thêm trực quan

>>> ĐỌC THÊM: [TẢI MIỄN PHÍ] 10+ Bảng chấm công theo giờ, ngày, ca chi tiết

8. 5 Lưu ý khi phân tích biểu đồ phân tán

Khi phân tích biểu đồ tán xạ, có rất nhiều yếu tố quan trọng, ảnh hưởng và tác động đến các biến mà bạn cần xem xét. Trong đó, phải chú ý đặc biệt đến 5 yếu tố sau:

  • Ngay cả khi sơ đồ phân tán cho thấy một mối quan hệ, đừng cho rằng biến này gây ra biến kia. Cũng có thể cả hai biến đều bị ảnh hưởng bởi một biến thứ ba nào đó.
  • Khi dữ liệu được vẽ biểu đồ, biểu đồ càng giống một đường thẳng thì mối quan hệ càng chặt chẽ.
  • Nếu một đường không rõ ràng, số liệu thống kê ( N và Q) xác định liệu có sự chắc chắn hợp lý rằng một mối quan hệ tồn tại hay không. Nếu số liệu thống kê nói rằng không có mối quan hệ nào tồn tại thì mô hình có thể xảy ra một cách ngẫu nhiên.
  • Nếu biểu đồ phân tán không hiển thị mối quan hệ giữa các biến, hãy xem xét liệu dữ liệu có thể được phân tầng hay không.
  • Nếu biểu đồ không thể hiện mối quan hệ nào, hãy xem xét liệu biến độc lập (trục Ox) có bị thay đổi nhiều hay không. Đôi khi một mối quan hệ không rõ ràng vì phạm vi của dữ liệu không đủ rộng.

>>> XEM THÊM: [3 LƯU Ý] Thời hạn giấy chứng nhận ISO 9001 cần phải biết

9. 3 Công cụ thay thế biểu đồ phân tán

Ngoài đồ thị scatter, bạn hoàn toàn có thể sử dụng 3 công cụ khác như bản đồ phân tán, bản đồ nhiệt, biểu đồ phân tán được kết nối để bổ sung hoặc thay thế cho scatter diagram.

9.1 Bản đồ phân tán (Scatter map)

Scatter map hay còn gọi là bản đồ phân tán là một loại biểu đồ scatter được vẽ trên một bản đồ địa lý, thường dùng để thể hiện sự phân bố của các điểm dữ liệu theo vị trí địa lý. Trong đó, một số yếu tố như kích thước, màu sắc, hình dạng hoặc mã hóa có thể được sử dụng để biểu diễn các thuộc tính khác của các điểm dữ liệu. Scatter map thường được sử dụng để khám phá các mẫu, xu hướng, ngoại lệ và mối quan hệ trong dữ liệu địa lý.

scatter diagram
Một mẫu bản đồ phân tán (Scatter map)

>>> XEM THÊM: Kiểm định thang máy theo Thông tư 36/2019/TT-BLĐTBXH năm 2023

9.2 Bản đồ nhiệt (Heatmap)

Heatmap còn được hiểu là bản đồ nhiệt, là một loại biểu đồ trực quan hóa giá trị của một biến số liên tục bằng màu sắc trên một lưới hai chiều. Loại bản đồ này có thể được sử dụng để so sánh giá trị của một biến số giữa các nhóm, khoảng thời gian, vị trí hoặc bất kỳ biến số phân loại nào. 

Để thể hiện mức độ tương quan giữa các biến số hoặc các thuộc tính, người ta cũng có thể sử dụng bản đồ nhiệt này.  

biểu đồ phân tán
Ví dụ về bản đồ nhiệt (Heatmap)

>>> XEM THÊM: Chứng nhận ISO 22000:2018 – Hệ thống quản lý an toàn thực phẩm

9.3 Biểu đồ phân tán được kết nối (Connected scatter plot)

Connected scatter plot, còn được gọi là biểu đồ phân tán được kết nối, là một loại scatter graph trong đó các điểm dữ liệu được nối với nhau bởi các đoạn thẳng theo một thứ tự có ý nghĩa, thường là theo thời gian. 

Biểu đồ phân tán được kết nối có thể được sử dụng để so sánh hai biến số liên tục theo quá trình phát triển của chúng. Ngoài ra, loại biểu đồ này còn cho thấy hướng, độ mạnh và tính tuyến tính của mối quan hệ giữa hai biến số.

biểu đồ phân tán
Ứng dụng của scatter plot được kết nối (Connected scatter plot)

Biểu đồ phân tán (scatter plot) là một loại biểu đồ hữu ích để khám phá và minh họa mối quan hệ giữa hai biến số liên tục. Doanh nghiệp có nhu cầu tham khảo các dịch vụ của Vinacontrol CE Hồ Chí Minh, vui lòng liên hệ qua hotline: 1800.646.820 hoặc email: vncehcm@vnce.com.vn để được tư vấn miễn phí và nhanh chóng!

>>> ĐỌC THÊM CÁC BÀI VIẾT KHÁC:

5/5 - (16 bình chọn)

1 những suy nghĩ trên “Biểu đồ phân tán trong quản lý chất lượng và 5 Lưu ý quan trọng

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *