(머신러닝) 1장 소개

*(Machine Learning with Python Library)은 읽고 정리합니다.

  • 규칙 기반 전문가 시스템
    • 결정을 내리는 데 필요한 논리는 도메인 또는 작업에 따라 다릅니다. 운영상의 작은 변화라도 전체 시스템의 재설계가 필요할 수 있습니다.
    • 규칙 디자인은 주제 전문가의 의사 결정 방법에 대한 충분한 이해가 필요합니다.
    • ex) 안면인식 시스템 장애
  • 기계 학습 1: 지도 학습
    • 알려진 사례를 기반으로 일반화된 모델을 생성하여 의사 결정 프로세스를 자동화합니다.
    • 수작업이 필요하기 때문에 입력 및 출력 데이터 생성이 어렵습니다.
    • 분석에 적합, 성능 측정에 적합
    • 예) 봉투의 자필 우편번호 식별, 의료영상 이미지를 이용한 종양 식별, 의심스러운 신용카드 거래 감지
  • 기계 학습 2: 비지도 학습(이 책에서 다루는 알고리즘)
    • 알고리즘은 입력은 받지만 출력은 받지 않음
    • 비지도 학습을 이해하거나 평가하는 것은 쉽지 않습니다.
    • 예) 블로그 게시글 분류, 선호도가 유사한 고객군 그룹화, 비정상적인 웹사이트 트래픽 탐지

지도 학습과 비지도 학습 모두 입력 데이터를 컴퓨터가 인식할 수 있는 형태로 준비하는 것이 중요합니다.

개별 데이터 데이터를 구성하는 모든 속성
샘플, 데이터 포인트 특성

1.1.2 문제와 데이터의 이해

기계 학습 프로세스에서 가장 중요한 단계는 사용할 데이터와 해당 데이터가 해결하려는 문제와 어떤 관련이 있는지 이해하는 것입니다.

– 어떤 질문에 대한 답변을 원하십니까? 가지고 있는 데이터가 원하는 답을 줄 수 있습니까?

– 데이터를 충분히 수집했는가?

https://gaussian37.github.io/math-la-sparse_matrix/

희소 행렬 및 압축 희소 행(CSR)

gaussian37의 블로그

gaussian37.github.io