현재 위치 - 중국 분류 정보 발표 플랫폼 - 비즈니스 서비스 정보 - Apache zeppelin 시작하기

Apache zeppelin 시작하기

Apache Zeppelin 은 대화형 데이터 분석을 지원하는 웹 기반 NoteBook 입니다. Zeppelin 을 사용하면 Scala (Apache Spark 사용), Python (Apache Spark 사용), SparkSQL 과 같은 풍부한 사전 구축 언어 백엔드 (또는 인터프리터) 를 사용하여 정교한 데이터 중심, 대화형 및 협업 문서를 만들 수 있습니다

Zeppelin 은

와 같은 중요한 기능을 갖춘 비즈니스에 주력하고 있습니다

이 문서는 자체 데이터 분석 응용 프로그램을 만들거나 기존 Zeppelin 노트북을 가져올 수 있도록 Zeppelin 의 기본 기능 소개를 완료하는 데 사용됩니다. 또한 인터프리터 만들기 및 바인딩, 외부 라이브러리 가져오기

와 같은 Zeppelin 의 고급 기능에 대해서도 알아봅니다

이 문서는 향후 Spark 자습서에서 사용할 기본 사항으로, notebook 생성, 기존 notebook 가져오기 및 확장, Zeppelin 이 잠재력을 최대한 발휘할 수 있도록 다양한 백엔드를 환경에 바인딩하는 등 중요한 주제를 다룹니다.

Hdp 환경에서 Zeppelin 에 액세스하는 방법에는 Amabari 의 Quick Links * 를 통한 방법과 브라우저에서 Zeppelin 의 전용 포트로 이동하는 두 가지가 있습니다.

Amy_ds/amy_ds 를 사용자 이름/비밀번호 조합으로 Ambari (운영 콘솔) 에 로그인합니다.

새 note book 을 만드는 대신 기존 note book 을 가져올 수 있습니다.

Zeppelin 노트북을 가져오는 두 가지 방법은 환경 로컬 JSON notebook 을 가리키거나 github 와 같은 다른 곳에서 호스팅되는 원본 파일에 URL 을 제공하여 가져올 수 있습니다. 다음으로 이러한 파일을 가져오는 두 가지 방법에 대해 설명합니다.

1. JSON 파일 가져오기

Zeppelin UI 에서 가져오기를 클릭합니다.

그런 다음 [JSON 파일 선택] 버튼

을 클릭합니다

마지막으로 가져올 노트북을 선택한 다음 열기 를 클릭합니다.

2. URL 을 사용하여 notebook 가져오기

가져오는 동안 Add from URL

을 선택합니다

마지막으로 URL 을 (원본) JSON 파일에 붙여 넣은 다음 Import Note 를 클릭합니다.

노트북을 삭제하려면 Zeppelin 시작 페이지로 이동합니다. 노트 아래의 페이지 왼쪽에는 메모 가져오기, 새 메모 작성, 필터 상자, 필터 상자 아래 작성 또는 가져온 노트북을 찾을 수 있는 다양한 옵션이 표시됩니다.

Zeppelin ui 에서 사용할 zeppelin 인터프리터를 설치하는 방법에 대해 설명합니다. 원하는 인터프리터를 설치할 수 있도록 지원되는 인터프리터를 기록해 두십시오.

설치가 완료되면 zeppelin 을 다시 시작합니다

Zeppelin notebook 은 다양한 인터프리터를 지원하므로 데이터에 대해 많은 작업을 수행할 수 있습니다. 다음은 다양한 스파크 자습서에서 사용할 인터프리터입니다.

각 인터프리터의 시작 부분에 유의하십시오. 각 단락은 로 시작하고 그 뒤에 인터프리터 이름이 와야 합니다. 다음 그림은 Markdown, Spark, 셸 등 세 가지 인터프리터를 보여줍니다

1. Zeppelin 시작 페이지 오른쪽에 있는 익명

을 클릭합니다

2. 드롭다운 목록에서 Interpreter

를 선택합니다

3. Interpreters 페이지의 오른쪽 위 모서리에 Create 가 표시됩니다. 이를 클릭하면 Create new interpreter 옵션이 열립니다. 쉘 인터프리터를 예로 들어 보겠습니다.

방금 만든 인터프리터를 바인딩하려면 새 인터프리터를 바인딩할 노트북을 다시 열어야 합니다.

1. Zeppelin 노트북의 오른쪽 위에 있는 기어를 클릭합니다. 이 기어를 클릭하면 인터프리터 바인딩 설정 섹션이 표시됩니다. 새로 생성된 설명을 볼 수 있습니다. 이 경우 명령 인터프리터 SH 가 표시됩니다.

2. 인터프리터를 클릭합니다. 흰색에서 파란색으로 바뀝니다.

3. 저장

을 클릭합니다

새로운 쉘 인터프리터는 사용할 준비가 되었습니다.

Zeppelin 을 탐색할 때 하나 이상의 외부 라이브러리를 사용할 수 있습니다. 예를 들어 Magellan 을 실행하려면 종속성을 가져와야 합니다. 사용자 환경에 Magellan 라이브러리를 포함해야 합니다. Zeppelin 노트북에는 외부 종속성을 포함할 수 있는 세 가지 방법이 있습니다.

1. dep 인터프리터 사용 (참고: Maven 에 게시된 라이브러리에만 적용됩니다. )

2. spark2 인터프리터 사용

3. import 문 사용