1. RapidMiner
이 도구는 Java 언어로 작성되었으며 템플릿 기반 프레임워크를 통해 고급 분석 기술을 제공합니다. 이 도구의 가장 큰 장점은 사용자가 코드를 작성할 필요가 없다는 것입니다. 기본 소프트웨어가 아닌 서비스로 제공됩니다. 이 도구가 데이터 마이닝 도구 목록에서 1위를 차지한다는 점은 언급할 가치가 있습니다.
또한 RapidMiner는 데이터 마이닝 외에도 데이터 전처리 및 시각화, 예측 분석 및 통계 모델링, 평가 및 배포와 같은 기능도 제공합니다. 더욱 강력한 점은 WEKA(지능형 분석 환경) 및 R 스크립트의 학습 솔루션, 모델 및 알고리즘도 제공한다는 것입니다.
RapidMiner는 AGPL 오픈 소스 라이선스에 따라 배포되며 SourceForge에서 다운로드할 수 있습니다. SourceForge는 개발자가 개발 및 관리를 수행하는 중앙 집중식 장소입니다. Wikipedia에서 사용하는 MediaWiki를 포함하여 수많은 오픈 소스 프로젝트가 여기에 정착했습니다.
2. WEKA
WEKA의 기본 비Java 버전은 주로 농업 분야의 데이터 분석을 위해 개발되었습니다. 이 도구는 Java 버전을 기반으로 하며 매우 정교하며 데이터 분석을 위한 시각화 및 알고리즘은 물론 예측 모델링을 포함한 다양한 애플리케이션에 사용됩니다. RapidMiner에 비해 장점은 사용자가 원하는 대로 사용자 정의할 수 있기 때문에 GNU General Public License에 따라 무료라는 것입니다.
WEKA는 데이터 전처리, 수집, 분류, 회귀 분석, 시각화 및 기능 선택을 포함한 다양한 표준 데이터 마이닝 작업을 지원합니다.
WEKA는 시퀀스 모델링을 추가해 더욱 강력해질 예정이지만, 현재는 포함되어 있지 않습니다.
3. R-프로그래밍
GNU 프로젝트인 R 프로젝트가 R(R-programming의 약자, 이하 통칭)로 작성되었다고 말하면 어떻게 하시겠습니까? R) 자체로는 주로 C와 FORTRAN 언어로 작성되어 있는 것 같은데, 많은 모듈이 프로그래밍 언어와 소프트웨어 환경에서 통계 계산과 그래프 작성을 위한 무료 소프트웨어인 R로 작성되어 있습니다. R 언어는 데이터 마이닝뿐만 아니라 통계 소프트웨어 및 데이터 분석 개발에도 널리 사용됩니다. 사용 용이성과 확장성 또한 최근 몇 년간 R의 인기를 크게 높였습니다.
데이터 외에도 선형 및 비선형 모델링, 고전적인 통계 테스트, 시계열 분석, 분류, 수집 등을 포함한 통계 및 차트 기술도 제공합니다.