현재 위치 - 중국 분류 정보 발표 플랫폼 - 비즈니스 서비스 정보 - 일반적으로 사용되는 16 가지 데이터 분석 방법-시계열 분석

일반적으로 사용되는 16 가지 데이터 분석 방법-시계열 분석

시계열 (time series) 은 시스템의 변수에 대한 관찰이 시간순 (시간 간격이 같음) 으로 정렬된 숫자 시퀀스로, 특정 기간 동안의 연구 대상의 변경 과정을 보여 줍니다. 사물의 변화 특성, 발전 추세 및 법칙을 찾고 분석합니다. 시스템의 한 변수가 다른 다양한 요소의 영향을 받는 총 결과입니다.

시계열을 연구하는 주요 목적은 기존 시계열 데이터를 기반으로 미래의 변화를 예측하는 예측을 할 수 있다. 시계열 예측 키: 기존 시계열의 변경 패턴을 결정하고 이 패턴이 미래까지 계속될 것으로 가정합니다.

시계열의 기본 특징

사물의 발전 추세가 미래로 확장된다고 가정

예측의 기반이 되는 데이터는 불규칙성

입니다

사물 발전 사이의 인과관계를 고려하지 않는다

시계열 데이터는 시간에 따른 현상 변화의 특징을 설명하는 데 사용됩니다.

시계열 고려 사항

시계열 분석은 발전 내역 단계와 사용된 통계 분석 방법에 대해 전통적인 시계열 분석과 현대 시계열 분석으로 나뉜다. 관찰 시간에 따라 시계열의 시간은 연도, 분기, 월 또는 기타 모든 시간 형식이 될 수 있다.

시계열 분석의 주요 고려 사항은 다음과 같습니다.

L 장기 추세 (Long-term trend)?

시계열은 상당히 안정적이거나 시간에 따라 어떤 추세를 나타낼 수 있다.

시계열 추세는 일반적으로 선형 (선형), 2 차 방정식 (quadratic) 또는 지수 함수 (exponential function) 입니다.

L 계절적 변동 (Seasonal variation)

시간 변화에 따라 반복적인 행동의 순서를 나타낸다.

계절적 변동은 보통 날짜나 기후와 관련이 있다.

계절적 변동은 보통 연주기와 관련이 있다.

L 주기적 변경

시계열은 계절적 변동에 비해' 주기적 변동' 을 경험할 수 있다.

주기적인 변동은 보통 경제 변동으로 인한 것이다.

L 무작위 영향 (Random effects)

또한 시계열에 영향을 미치는 우연한 요인이 있어 시계열에 임의 변동이 나타납니다. 시계열은 추세, 주기성, 계절성 후의 우연한 변동을 제거하여 무작위성 (random) 또는 불규칙한 변동 (irregular variations) 이라고도 합니다.

시계열의 주요 구성 요소

시계열의 구성 요소는

네 가지로 나눌 수 있습니다

L 추세 (t),

L 계절적 또는 계절적 변동 (s),

L 주기 또는 순환 변동 (c),

L 무작위성 또는 불규칙 변동 (I).

전통적인 시계열 분석의 주요 내용 중 하나는 시계열에서 이러한 구성 요소를 분리 하 고 특정 수학적 관계로 관계를 표현 하 고 별도로 분석 합니다.

시계열 모델링 기본 단계

1) 관찰, 조사, 통계, 샘플링 등의 방법으로 관찰된 시스템 시계열 동적 데이터를 얻습니다.

2) 동적 데이터를 기준으로 관련 다이어그램을 만들고 관련 분석을 수행하여 관련 함수를 구합니다.

관련 그래프는 변화의 추세와 주기를 보여주고 점퍼와 전환점 등을 발견할 수 있다.

점퍼는 다른 데이터와 일치하지 않는 관찰입니다. 점퍼가 정확한 관찰이라면 모델링할 때 고려해야 하고, 비정상인 경우에는 점퍼점을 기대에 맞게 조정해야 합니다.

전환점 란 시계열이 상승 추세에서 갑자기 하강 추세로 바뀌는 지점을 말한다. 전환점 (예: 문 회귀 모델 사용) 이 있는 경우 모델링할 때 다른 모델을 사용하여 시계열을 세그먼트화해야 합니다.

3) 적절한 임의 모델을 식별하고 곡선 맞춤을 수행합니다. 즉, 범용 임의 모델을 사용하여 시계열의 관찰 데이터를 맞춥니다.

짧거나 간단한 시계열의 경우 추세 모델 및 계절 모델에 오류를 추가하여 맞출 수 있습니다.

부드러운 시계열의 경우 일반 ARMA 모형 (자동 회귀 슬라이딩 평균 모형) 및 특수한 상황에 대한 자동 회귀 모형, 슬라이딩 평균 모형 또는 조합 -ARMA 모형 등을 사용하여 맞출 수 있습니다.

ARMA 모형은 관찰이 50 개가 넘을 때 일반적으로 사용됩니다. 비 정적 시계열의 경우 먼저 관찰된 시계열을 차등 연산하고, 부드러운 시계열로 전환한 다음, 적절한 모델을 사용하여 이 차이 시퀀스를 맞추어야 합니다.

Spss 시계열 분석 프로세스

첫 번째 단계: 날짜 레이블 정의:

데이터 파일을 열고 "데이터" 를 누르고 "날짜 및 시간 정의" 를 선택한 다음 "날짜 정의" 대화 상자 팝업

데이터의 시작 시간은 데이터 파일 내의 셀의 첫 번째 시간이고, 나의 첫 번째는 1997 년 8 월이며, 각 행은 월별 판매량을 나타내므로, [날짜 정의] 대화 상자의 왼쪽에 있는 "사례" 상자에서 "연도, 월" 을 선택하고 왼쪽에' 1997' 을 입력해야 합니다.

마지막으로 확인을 클릭하면 SPSS 데이터 파일에 세 개의 새로운 변수

가 생성됩니다

아래 그림:

2 단계: 시계열의 변화 추세 이해

시계열의 변화 추세를 이해하고 시퀀스 테이블을 만들면 됩니다. "분석" 을 클릭하고 "시계열 예측" 을 선택하고 "순서도" 대화 상자를 선택한 다음' 평균' 을' 변수' 상자로 이동하고' date _' 를' 타임라인 레이블' 으로 이동합니다 결과는 다음과 같습니다

시퀀스 다이어그램의 분석에 따르면, 시퀀스의 변동은 계절의 변동에 따라 점점 더 커지기 때문에 곱셈 모델을 선택했습니다.

3 단계: 분석

분석을 클릭하고 시계열 예측을 선택한 다음 계절별 분할을 선택하고 계절별 분할 대화상자를 팝업한 후 확인을 클릭합니다. 그림:

네 가지 더 많은 변수:

LERR 은 오류 분석을 나타냅니다.

LSAS 는 계절 요인 보정 후 시퀀스를 나타냅니다.

LSAF 는 계절 요인을 나타냅니다.

LSTC 는 장기 추세와 순환 변화 순서를 나타냅니다.

우리는 새로 나타난 네 개의 변수, 평균, DATE_ 를 순서도로 만들 수 있다. 먼저 ERR, SAS, STC, 평균 및 DATE_ 를 순서도로 만들어 다음과 같은 효과를 냅니다.

SAT 및 DATE_ _ 에 대한 시계열 차트

-응?

4 단계: 예측

1. [분석], [시계열 예측], [기존 모델 생성] 을 차례로 선택합니다. [시계열 모델링] 대화 상자가 나타납니다.

2. 평균을 요소 변수 상자로 이동하고 중간 방법을 결정하고 드롭다운 목록에서 전문가 모델러 항목을 선택한 다음 오른쪽의 조건 버튼을 클릭하여 시계열 모델러: 전문가 모델러 조건 대화상자를 표시합니다..

3, 시계열 모델러: 전문가 모델러 조건 대화 상자의 모델 탭에 있는 모델 유형 상자에서 "모든 모델" 항목을 선택하고 "전문가 모델러가 계절성 모델을 고려합니다" 확인란을 선택한 후 설정하고 "계속" 을 클릭합니다

4, 시계열 모델러 대화 상자에서 저장 탭으로 전환하고 예측 값 확인란을 선택한 다음 모델 조건 내보내기 상자에서 XML 파일 뒤에 있는 찾아보기 버튼을 클릭하고 내보낸 모델 파일 및 저장 경로를 설정합니다. 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4

위의 단계를 완료하면 원시 데이터 위에 또 다른 예측치가 나타납니다. 그림:

-응?

이전에 예측 모델을 저장했는데, 우리는 지금 그 모델을 이용하여 예측 데이터를 하고 있다.

1. [분석] 을 누르고 [시계열 예측], [기존 모델 적용] 을 차례로 선택하여 [모델 시퀀스 적용] 대화 상자를 표시합니다. 구체적인 작업은 다음과 같습니다.

-응?

마지막 단계는 저장 인터페이스로 전환하고, 예측값을 선택한 후 확인을 누르면 됩니다.

예측값에서 직접 볼 수 없고, 예측된 데이터와 원시 데이터를 함께 볼 수도 있고, 직접 순서도를 만들 수도 있습니다.

이렇게 하면 시계열의 모델이 완성됩니다. 특정 예측 데이터는 원본 데이터 위에 나타나는 새로운 데이터 열을 볼 수 있습니다.

-End-