Loading
Trong thống kê, một đại lượng sẽ được gọi là biến (variable) nếu đại lượng này có 2 đặc điểm xác định:
Cụ thể hơn, hãy nhìn vào một tập dữ liệu mẫu dưới đây. Thảo là một sinh viên theo học ngành kế toán. Ngoài việc đến trường, Thảo còn làm thêm bằng việc bán nước mía.
Trong ví dụ trên, các đại lượng được gọi là biến là: Ngày, Thứ, Tờ rơi, Nhiệt độ, Lượng mưa, Giá, Doanh số, Doanh thu
Biến thống kê có thể được phân loại thành 2 loại:
Ở những phương trình đại số, các biến định lượng được biểu diễn bởi các biểu tượng (ví dụ: x, y, z)
Biến định lượng có thể được chia tiếp ra làm 2 loại là đứt đoạn (discrete) và liên tục (continuous). Nếu một biến có thể nhận bất kì giá trị nào giữa giá trị nhỏ nhất và giá trị lớn nhất của nó, nó được gọi là một biến liên tục; ngược lại, nó được gọi là biến đứt đoạn.
Trong ví dụ của Thảo, nhiệt độ là biến liên tục bởi vì biến này có thể nhận bất kì giá trị nào chúng ta đo được, ví dụ 30, 23.5, 23.1… Tuy nhiên, biến doanh số (được tính theo số cốc nước mía) là biến đứt đoạn bởi vì một ngày Thảo không thể bán được 20.5 cốc hay 40.3 cốc nước mía. Chúng ta chỉ có thể đếm từng cốc nước mía một.
Phân tích thống kê thường được phân loại theo số lượng biến được nghiên cứu.
Phân biệt các kiểu biến đóng một vai trò cực kì quan trọng trong phân tích thống kê. Biết được kiểu biến, chúng ta mới có thể thực hiện các phép tính toán phù hợp với những giá trị của chúng. Hãy quan sát hình dưới đây:
Tôi thực hiện phép tính tổng cho tất cả các giá trị của biến trong ví dụ nước mía. Ta có thể thấy ngay, phép tính tổng (sum) cho ra kết quả bằng 0 đối với biến Thứ, ta có thể tính được Tổng nhiệt độ và Tổng giá nhưng 2 con số này hoàn toàn vô nghĩa. Hàm AVERAGE sẽ có ý nghĩa hơn đối với 2 biến này.
Vì vậy, khi phân tích việc đầu tiên chúng ta cần xem xét đó là kiểu dữ liệu của các biến liên quan là gì.
3 Bình luận: