Tìm hiểu về Grangerizing: Hướng dẫn chuẩn bị dữ liệu chuỗi thời gian
Grangerizing là một quá trình chuyển đổi dữ liệu chuỗi thời gian thành một quy trình cố định, có nghĩa là các thuộc tính thống kê của dữ liệu không đổi theo thời gian. Điều này được thực hiện bằng cách loại bỏ các thành phần xu hướng và tính thời vụ khỏi dữ liệu, chỉ để lại những biến thể còn lại không thể dự đoán được.
Thuật ngữ "gragrizing" xuất phát từ tên của thử nghiệm nhân quả Granger, đây là một thử nghiệm thống kê được sử dụng để xác định liệu một lần chuỗi có thể được sử dụng để dự đoán chuỗi thời gian khác. Kiểm định nhân quả Granger dựa trên ý tưởng rằng nếu một chuỗi thời gian có thể được sử dụng để dự đoán một chuỗi thời gian khác thì phải có một loại mối quan hệ nào đó giữa hai chuỗi thời gian đó. Bằng cách chia nhỏ dữ liệu, về cơ bản, chúng tôi đang loại bỏ mọi mối quan hệ có thể tồn tại giữa chuỗi thời gian và khiến việc dự đoán trở nên khó khăn hơn.
Có một số phương pháp để chia nhỏ dữ liệu chuỗi thời gian, bao gồm:
1. Giảm xu hướng: Điều này liên quan đến việc loại bỏ xu hướng tổng thể khỏi dữ liệu bằng cách khớp đường xu hướng tuyến tính hoặc logarit và sau đó trừ nó khỏi dữ liệu gốc.
2. Phân rã theo mùa: Điều này liên quan đến việc chia nhỏ dữ liệu thành các phần cấu thành của nó, chẳng hạn như các mẫu theo mùa và xóa chúng khỏi dữ liệu.
3. Sự khác biệt: Điều này liên quan đến việc lấy sự khác biệt giữa các quan sát liên tiếp trong chuỗi thời gian, điều này có thể giúp loại bỏ bất kỳ xu hướng hoặc tính thời vụ nào có thể có trong dữ liệu.
4. Mô hình hóa trung bình di chuyển tích hợp tự động (ARIMA): Điều này liên quan đến việc điều chỉnh mô hình thống kê cho dữ liệu bao gồm các thành phần về xu hướng, tính thời vụ và biến thể ngẫu nhiên. Sau đó, mô hình có thể được sử dụng để loại bỏ các thành phần này khỏi dữ liệu, chỉ để lại các biến thể còn lại.
Nhìn chung, chia nhỏ là một kỹ thuật hữu ích để chuẩn bị dữ liệu chuỗi thời gian cho phân tích, vì nó có thể giúp loại bỏ bất kỳ biến số hoặc mối quan hệ gây nhiễu nào có thể ảnh hưởng đến kết quả phân tích.



