DrawingProcess
드프 DrawingProcess
DrawingProcess
전체 방문자
오늘
어제
«   2026/03   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
  • 분류 전체보기 (990)
    • Profile & Branding (26)
      • Career (19)
    • IT Trends (255)
      • Conference, Faire (Experien.. (31)
      • News (187)
      • Youtube (20)
      • TED (8)
      • Web Page (2)
      • IT: Etc... (6)
    • Contents (98)
      • Book (67)
      • Lecture (31)
    • Project Process (95)
      • Ideation (0)
      • Study Report (35)
      • Challenge & Award (22)
      • 1Day1Process (5)
      • Making (5)
      • KRC-FTC (Team TC(5031, 5048.. (10)
      • GCP (GlobalCitizenProject) (15)
    • Study: ComputerScience(CS) (73)
      • CS: Basic (9)
      • CS: Database(SQL) (5)
      • CS: Network (14)
      • CS: OperatingSystem (3)
      • CS: Linux (39)
      • CS: Etc... (3)
    • Study: Software(SW) (95)
      • SW: Language (29)
      • SW: Algorithms (1)
      • SW: DataStructure & DesignP.. (1)
      • SW: Opensource (15)
      • SW: Error Bug Fix (43)
      • SW: Etc... (6)
    • Study: Artificial Intellige.. (159)
      • AI: Research (2)
      • AI: 2D Vision(Det, Seg, Tra.. (40)
      • AI: 3D Vision (74)
      • AI: MultiModal (3)
      • AI: SLAM (0)
      • AI: Light Weight(LW) (3)
      • AI: Data Pipeline (7)
      • AI: Machine Learning(ML) (1)
    • Study: Robotics(Robot) (9)
      • Robot: ROS(Robot Operating .. (9)
      • Robot: Positioning (8)
      • Robot: Planning & Control (7)
    • Study: DeveloperTools(DevTo.. (83)
      • DevTool: Git (12)
      • DevTool: CMake (13)
      • DevTool: NoSQL(Elastic, Mon.. (25)
      • DevTool: Container (17)
      • DevTool: IDE (11)
      • DevTool: CloudComputing (4)
    • 인생을 살면서 (72)
      • 나의 취미들 (11)
      • 나의 생각들 (42)
      • 여행을 떠나자~ (10)
      • 분기별 회고 (9)

개발자 명언

“ 매주 목요일마다 당신이 항상 하던대로 신발끈을 묶으면 신발이 폭발한다고 생각해보라.
컴퓨터를 사용할 때는 이런 일이 항상 일어나는데도 아무도 불평할 생각을 안 한다. ”

- Jef Raskin

맥의 아버지 - 애플컴퓨터의 매킨토시 프로젝트를 주도

인기 글

최근 글

최근 댓글

티스토리

hELLO · Designed By 정상우.
DrawingProcess

드프 DrawingProcess

[Study] 혼공학습단 10기: 혼자 공부하는 머신러닝+딥러닝(박해선) - Chapter 06 비지도 학습(5주차)
Project Process/Study Report

[Study] 혼공학습단 10기: 혼자 공부하는 머신러닝+딥러닝(박해선) - Chapter 06 비지도 학습(5주차)

2023. 8. 11. 20:35
반응형

스터디

스터디 범위

Chapter 06 비지도 학습

  • 06-1 군집 알고리즘 ▶️ 흑백 이미지 분류 방법과 비지도 학습, 군집 알고리즘 이해하기
  • 06-2 k-평균 ▶️k-평균 알고리즘 작동 방식을 이해하고 비지도 학습 모델 만들기
  • 06-3 주성분 분석 ▶️차원을 알고 차원 축소 알고리즘 PC 모델 만들기

스터디 내용

06-1 군집 알고리즘 ▶️ 흑백 이미지 분류 방법과 비지도 학습, 군집 알고리즘 이해하기

 비지도 학습: 머신러닝의 한 종류로 훈련 데이터에 타깃이 없습니다. 타깃이 없기 때문에 외부의 도움 없이 스스로 유용한 무언가를 학습해야 합니다. 대표적인 비지도 학습 작업은 군집, 차원 축소 등입니다.

히스토그램: 구간별로 값이 발생한 빈도를 그래프로 표시한 것입니다. 보통 x축이 값의 구간(계급)이고 y축은 발생 빈도(도수)입니다. 

군집: 비슷한 샘플끼리 하나의 그룹으로 모으는 대표적인 비지도 학습 작업입니다. 군집 알고리즘으로 모은 샘플 그룹을 클러스터라고 부릅니다.

06-2 k-평균 ▶️k-평균 알고리즘 작동 방식을 이해하고 비지도 학습 모델 만들기

K-평균 알고리즘

  1. 처음에 랜덤하게 클러스터 중심 을 정하고 클러스터를 만듭니다 . 
  2. 그 다음 클러스터 에 속한 샘플의 특성 평균값으로 클러스터의 중심(centroid)을 이동한 후 다시 클러스터 를 만듭니다.
  3. 2. 번을 반복해서 최적의 클러스터를 구성하는 알고리즘입니다 . 

엘보우 방법: 최적 의 클러스터 개수를 정하는 방법 중 하나 입니다. 이너셔는 클러스터 중심과 샘플 사이 거리의 제곱합입니다 . 클러스터 개수에 따라 이너셔 감소가 꺾이는 지점이 적절한 클러스터 개수 k가 될 수 있습니다. 이 그래프의 모양 을 따서 엘보우 방법 이라고 부릅니다 

06-3 주성분 분석 ▶️차원을 알고 차원 축소 알고리즘 PC 모델 만들기

차원 축소(dimensionality reduction): 원본 데이터 의 특성을 적은 수의 새로운 특성으로 변환하는 비지도 학습의 한 종류 입니다 . 차원 축소는 저장 공간을 줄이고 시각화하기 쉬우며, 다른 알고리즘의 성능을 높일 수도 있습니다.

주성분 분석(principal component analysis): 데이터에서 가장 분산이 큰 방향을 찾아 주성분으로 설정하여 차원을 축소하는 방법입니다 . 원본 데이터를 주성분에 투영하여 새로운 특성을 만들 수 있습니다 . 일반적으로 주성분은 원본 데이터에 있는 특성 개수보다 작습니다 .

설명된 분산(explained variance): 주성분 분석에서 주성분이 얼마나 원본 데이터의 분산을 잘 나타내는지 기록한 것입니다. 사이킷런의 PCA 클래스는 주성분 개수나 설명된 분산의 비율을 지정하여 주성분 분석을 수행할 수 있습니다.

미션

기본 미션

K-평균 알고리즘 작동 방식 설명하기: 위에서 언급함.

선택 미션

Ch.06(06-3) 확인 문제 풀고, 풀이 과정 정리하기

1. 특성이 20개인 대량의 데이터셋이 있습니다. 이 데이터셋에서 찾을 수 있는 주성분 개수는 몇 개일까요?

: 20개 입니다. 주성분의 개수는 최대 특성의 개수만큼 찾을 수 있습니다.

2. 샘플 개수가 1,000개이고 특성 개수는 100개인 데이터셋이 있습니다. 즉 이 데이터셋의 크기는 (1000, 100)입니다. 이 데이터를 사이킷런의 PCA 클래스를 사용해 10개의 주성분을 찾아 변환했습니다. 변환된 데이터셋의 크기는 얼마일까요? 

: (1000 , 100) 크기 데이터 셋에서 10개의 주성분을 찾아 변환하면 샘플의 개수는 그대로이고 특성 개수만 100에서 10으로 바뀝니다 . 즉 (1000 , 10)이 됩니다 .

3. 2번 문제에서 설명된 분산이 가장 큰 주성분은 몇 번째인가요? 

: 주성분 분석은 가장 분산이 큰 방향 부터 순서 대로 찾습니다 . 따라서 첫 번째 주성분의 설명 된 분산이 가장 큽니다 .

참고

  • [Github] 예제 소스: https://github.com/rickiepark/hg-mldl
  • [Google Colab] 예제 소스: https://colab.research.google.com/github/rickiepark/hg-mldl 
  • Q&A: 박해선 저자님의 github: https://groups.google.com/g/ml-dl-book-qna?pli= 
  • 유튜브 강의: 👉전체 강의 목록: https://www.youtube.com/playlist?list=PLVsNizTWUw7HpqmdphX9hgyWl15nobgQX

혼공학습단, 혼공, ⁠혼공머신, 혼자 공부하는, 박해선, 혼자 공부하는 머신러닝+딥러닝

반응형
저작자표시 비영리 변경금지 (새창열림)

'Project Process > Study Report' 카테고리의 다른 글

[Study] 혼공학습단 10기: 혼자 공부하는 머신러닝+딥러닝(박해선) - Chapter 07 다양한 분류 알고리즘(6주차)  (2) 2023.08.20
[영어] 리얼클래스 학습 일기: 일상 회화 표현 정리(8월 2주차)  (0) 2023.08.15
[영어] 리얼클래스 학습 일기: 일상 회화 표현 정리(8월 1주차)  (0) 2023.08.07
[영어] 리얼클래스 학습 일기: 일상 회화 표현 정리(7월 4주차)  (0) 2023.07.30
[Study] 혼공학습단 10기: 혼자 공부하는 머신러닝+딥러닝(박해선) - Chapter 05 트리 알고리즘(4주차)  (0) 2023.07.30
    'Project Process/Study Report' 카테고리의 다른 글
    • [Study] 혼공학습단 10기: 혼자 공부하는 머신러닝+딥러닝(박해선) - Chapter 07 다양한 분류 알고리즘(6주차)
    • [영어] 리얼클래스 학습 일기: 일상 회화 표현 정리(8월 2주차)
    • [영어] 리얼클래스 학습 일기: 일상 회화 표현 정리(8월 1주차)
    • [영어] 리얼클래스 학습 일기: 일상 회화 표현 정리(7월 4주차)
    DrawingProcess
    DrawingProcess
    과정을 그리자!

    티스토리툴바