반응형
Track1. 자동 레이블링과 분산 학습을 통해 딥러닝을 쉽고 빠르게! (오경진 프로 (AI선행연구Lab))
1. cDL(Deep Learning)
- - 대용량 영상 데이터를 처리하는 비즈니스 환경에서 경험한 어려움들
- - 데이터 : 정제작업, 답안지만들기,,, 가내 수공업하는 느낌 -> Auto Labeling
- - 모델 개발 : 많은 실험을 일일이..? -> Distributed Model Training
- - 기업 비즈니스를 위한 대규모 AI로의 전환을 위한 고려사항
- R&D scale -> Operationalization of AI -> Enterprise scale
2. Auto Labeling : 학습데이터 Labeling 과정을 자동화하는 기능
- 기존 : 사람이 직접 모든 데이터를 labeling 해야함.
- 기술 : 학습효과가 가장 큰 이미지 20%선별 후 labeling 작업 후 Brightics AI가 20%이미지만으로 학습하여 나머지 80%데이터를 labeling함.
- 남은 unlabeled data를 추론해보라고 하면 답이 불확실한 data만 다시 labeling
- 클러스터링 후 대표건을 사람에게 질의(sampling) -> 학습 후 불확실건 질의(반복) -> 목표 정확도 달성시 출력
- 공개 데이터(STL10)기준 20%가량의 labeling할 경우 98%의 정확도의 데이터가 추출됨
- segmentation, detection 올해 말부터 출시
- https://www.samsungsds.com/global/ko/solutions/off/brig/brighticsAI.html
# 느낀점
대학교 1학년 2학기때 techtonic을 다녀오고 자동레이블링 기술을 보니 card_detecting에 응용해보자는 생각으로 찾았다. 그런데 12월쯤 배포된다기에 project에 사용을 못했고, 다시 영상을 보니 이제라도 써보고 싶은 기술이긴 확실하다. 처음 객체인식을 접했을 때 기술력을 가진 사람들도 AI를 만들기 위해서는 단순노무?를 해야한다는 사실이 쉽게 와닿지 않았는데, 우리나라의 대기업인 samsung의 직원들도 labeling과정이 지루해서 이런 기술을 만들다니 한편으로는 웃겼다. 아무튼 다음 project에서는 응용해보고 싶고 이런 걸 짜는 사람이 되고 싶다!
# 참고
https://www.youtube.com/embed/4lgP92rVPmc
반응형