본문 바로가기
RESEARCH/Book

데이터 마이닝 (Data Mining) ???

by BLADEBONE 2010. 5. 31.

데이터 마이닝(Data Mining), 바로 이 블로그에서 주로 다루고자 하는 주제이다.

 

이에 대한 다양한 정의가 있을 수 있겠지만 나는 아래와 같이 생각한다.

 

데이터 마이닝 이란 대규모 데이터로부터 유용한 정보를 자동화된 방법으로 탐색하는 과정을 의미하며, 지식 발견(KDD, Knowledge discovey in database) 과정의 한 단계로서 중요한 역할을 하고 있다.

 

그렇다면 최근에 와서 이에 대한 관심이 증대되는 이유는 무엇일까?

 

먼저 기술의 발달을 첫째 이유로 볼 수 있다.

 

다음으로 기업들의 패러다임의 전환도 큰 영향을 미치고 있다. 

 

서론이 길었다. 이 블로그에서는 데이터 마이닝에 관한 도서나 논문 리뷰, 간단한 구현 등을 통해 이해를 높이고자 한다. 이에 대한 시작으로 Introduction to Data Mining(2005) 이란 도서를 공부하고 그 내용을 정리하고자 한다. 이 책은 데이터 마이닝에 대해 비교적 쉽게 설명된 책으로 크게 Data, Classcification, Association analysis, clustering, 그리고 anomaly detection의 5가지 주제에 대해 다루고 있다. 이후 데이터 마이닝에 관한 포스팅은 각 장을 공부하고 이에 대해 요약하는 형태로 게재 할 계획이다. 더불어 가능한 경우에는 Matlab을 이용한 간단한 실험도 추가하여 이해를 돕고자 한다.



 

덧글,

아직은 데이터 마이닝이란 분야에 대해 아는 것보다 모르는 것이 더 많기 때문에 잘못된 지식이나 정보를 올릴 수도 있으므로 이에 대해 지적하거나 언급해주시면 감사히 생각하겠습니다.


반응형

'RESEARCH > Book' 카테고리의 다른 글

Chapter 2. Data (2) 데이터 품질  (0) 2010.06.11
Chapter 2. Data (1) 데이터의 종류  (4) 2010.06.08
Chapter 1. Introduction  (0) 2010.06.01

댓글