첫째, 사례 배경
Thera Bank 는 성장하고 있는 고객층을 보유한 은행이다. 이 은행의 대다수 고객의 예금 규모는 모두 다르다. 대출 업무는 고객 수가 적기 때문에 은행은 예금 사용자를 대출 사용자로 효과적으로 전환하여 대출 업무량의 기반을 넓혀 더 많은 대출 업무를 창출하고 그 과정에서 대출 이자를 통해 더 많은 돈을 벌기를 희망하고 있다. (윌리엄 셰익스피어, 대출, 대출, 대출, 대출, 대출, 대출, 대출, 대출, 대출, 대출)
이에 따라 이 은행은 지난해 예금사용자를 위해 개인대출 업무를 처리하지 않은 고객을 위해 개인대출 업무를 추진하기 위한 프로모션을 실시했고, 일부 고객은 이 행사를 통해 이미 관련 서비스를 처리했다. 이때 소매 마케팅 부서는 마케팅을 포지셔닝하기 위한 더 나은 전략을 세우고 최소한의 예산으로 성공률을 높이고자 합니다. 이 부서는 대출을 구매할 가능성이 더 높은 잠재 고객을 식별하여 전환의 성공률을 높이고 마케팅 비용을 줄이고자 합니다.
둘째, 데이터 이해
이 데이터 세트는 총 5000 행, 14 열 데이터, 해당 필드는 다음과 같이 해석됩니다.
일반적으로 이 데이터 세트는 주로 Personal Loan 대출 결과와 사용자 그룹의 id 자산 정보 등으로 구성됩니다
셋째, 데이터 관찰 및 청소
이 문서의 데이터 정리 프로세스는 여전히 예비 관찰과 청소 두 단계로 나뉘어 있으며, 데이터 관찰은 주로
를 통해 이루어집니다비정상적인 데이터 유형 및 데이터 문제 수정, 수정 후 설명 통계 다시 수행, 전체 데이터 특성 관찰
전체적인 아이디어:
1 이번 행사는 효과가 어떻습니까? 얼마나 많은 사람들이 대출을 하게 되었습니까?
2 어떤 사람이 대출을 더 선호합니까
행사 효과 이 경우 목표가 달성되더라도 대출이 목표이므로 퍼소날론에서 대출과 대출이 없는 인원만 계산하면 된다.
이번 행사를 통해 5,000 명의 고객 중 480 명이 대출 업무를 개설하여 약 10 대 정도를 차지하고 있으며, 이 행사는 대출을 받지 않은 사용자를 위한 것으로, 전반적으로 10 대 이상 사업이 향상되어 효과가 상당히 좋다.
대출 사용자의 잠재적 영향 요인을 분석하려면 대출 여부 Personal Loan 필드를 다른 필드와 상관 관계 (corr () 함수) 를 구하고 관련 계수가 가장 큰 값을 찾아
를 표시하는 것입니다이를 바탕으로 대지를 더 세분화하고 각 열과 personal loan (대출 여부) 관련 계수를 시각화하여 다음과 같은 결과를 얻을 수 있습니다
그림에서 찾을 수 있습니다.
1. 대출에 영향을 미치는 강력한 관련 변수는 소득, 월별 신용 카드 소비액, 예금 계좌 여부
입니다2. 대출에 영향을 미치는 약한 관련 변수는 교육 수준, 주택담보가치, 가족수
입니다3. 나머지 요소 (예: 우편번호, 인터넷은, 신용카드, 증권계좌 등) 는 대출에 큰 영향을 미치지 않습니다
4. 나이와 근로연수도 큰 영향을 미치지 않지만 연속성 변수이기 때문에 일정 기간 동안 대출에 대한 수요가 크다는 것을 배제하지 않으므로
에 대한 후속 분석이 필요하다이전 단계를 기준으로 대출에 영향을 미치는 변수를 더 분석하고 변수의 성격에 따라
를 별도로 처리합니다이 경우 변수를 정성과 정량으로 나누어 각각 대출과 대출의 영향을 탐구하고, 이 경우 방향성 변수에는 주로 은행 예금 계좌, 교육 수준, 가족 수 등이 있는지 여부 등이 있다.
그 결과 예금 계좌를 개설한 사용자가 대출을 신청할 가능성은 미개설 예금 계좌를 개설한 사용자보다 6 배 차이가 나며, 고객이 예금 계좌를 개설할 수 있도록 하는 것은 대출률을 높이는 수단 중 하나가 아닌 것 같습니다.
학력이 높아지면서 대출 신청 비율이 높아져 고학력 사용자가 대출 사용자가 되는 경향이 있음을 보여 주며, 학력이 높을수록 고급 소비의 소비관을 받아들일 수 있을 수록 대출의 잠재 사용자
가 되기 쉽다가족 수 3-4 의 고객은 1-2 의 고객에 비해 대출 신청 가능성이 더 높으며, 이는 가족 구성원이 증가함에 따라 경제적 압력이 커지고 대출의 잠재적 수요가 증가하며 해당 업무를 사용하는 경향이 있다는 것을 반영한 것이다.
이 경우 정량변수의 연령, 수입, 신용카드 상환액, 주택담보대출과 대출 개통 여부에 대한 관계를 주로 탐구하는데, 정량변수이기 때문에 구간은 연속 구간이고, 질적 변수와는 비교하면 데이터의 전모를 쉽게 이해할 수 있다. 이러한 변수는 간격마다 별도로 집계해야 합니다
종합적으로 볼 때 대출 사용자와 비 대출 사용자 간의 나이 차이는 크지 않으며, 특정 연령대로 볼 때 32.0-39.0 이 연령대의 고객은 대출
을 선호한다소득, 주택 담보 가치, 월별 신용카드 소비액 분석 과정은 나이라는 변수와 거의 같다
전반적으로 고소득층의 저소득층은 대출을 더 선호한다. 수입이 82 를 넘으면 대출자 수가 5 배, 98 배 이상, 대출 의지가 17 이상, 170 이 넘으면 대출 의지가 절반 이상이기 때문에 수입이 높아진다. 대출 업무 의향이 강할수록
주택 담보 가치가 109.5 를 넘으면 대출 의지가 눈에 띄게 높아지는데, 전반적으로 주택 담보 가치가 높을수록 고객은 대출을 더 많이 받는 경향이 있다
대부분의 대출 사용자는 신용 카드 소비의 평균이 4 에 육박하고, 미대출 사용자는 2 에 육박하며, 무려 2 배 이상이다. 반면, 사용자 층을 보면 신용 카드 소비액이 2.8 천 달러를 넘어선 후 대출 확률이 4 배, 6 천 달러를 넘으면 0.3 으로 떨어지며, 2.8 천 달러보다 크게 상승하기 때문에 매월 신용 카드 소비액이 2.8 천 달러보다 크다는 점을 중점적으로 파악해야 한다