*(Machine Learning with Python Library)은 읽고 정리합니다.
- 규칙 기반 전문가 시스템
- 결정을 내리는 데 필요한 논리는 도메인 또는 작업에 따라 다릅니다. 운영상의 작은 변화라도 전체 시스템의 재설계가 필요할 수 있습니다.
- 규칙 디자인은 주제 전문가의 의사 결정 방법에 대한 충분한 이해가 필요합니다.
- ex) 안면인식 시스템 장애
- 기계 학습 1: 지도 학습
- 알려진 사례를 기반으로 일반화된 모델을 생성하여 의사 결정 프로세스를 자동화합니다.
- 수작업이 필요하기 때문에 입력 및 출력 데이터 생성이 어렵습니다.
- 분석에 적합, 성능 측정에 적합
- 예) 봉투의 자필 우편번호 식별, 의료영상 이미지를 이용한 종양 식별, 의심스러운 신용카드 거래 감지
- 기계 학습 2: 비지도 학습(이 책에서 다루는 알고리즘)
- 알고리즘은 입력은 받지만 출력은 받지 않음
- 비지도 학습을 이해하거나 평가하는 것은 쉽지 않습니다.
- 예) 블로그 게시글 분류, 선호도가 유사한 고객군 그룹화, 비정상적인 웹사이트 트래픽 탐지
지도 학습과 비지도 학습 모두 입력 데이터를 컴퓨터가 인식할 수 있는 형태로 준비하는 것이 중요합니다.
선 | 열 |
개별 데이터 | 데이터를 구성하는 모든 속성 |
샘플, 데이터 포인트 | 특성 |
1.1.2 문제와 데이터의 이해
기계 학습 프로세스에서 가장 중요한 단계는 사용할 데이터와 해당 데이터가 해결하려는 문제와 어떤 관련이 있는지 이해하는 것입니다.
– 어떤 질문에 대한 답변을 원하십니까? 가지고 있는 데이터가 원하는 답을 줄 수 있습니까?
– 데이터를 충분히 수집했는가?
https://gaussian37.github.io/math-la-sparse_matrix/
희소 행렬 및 압축 희소 행(CSR)
gaussian37의 블로그
gaussian37.github.io