반응형
Elasticsearch _bulk API
_bulk API 란?
- 여러 명령을 배치로 수행하기 위해서 _bulk API의 사용이 가능합니다.
- _bulk API로 index, create, update, delete의 동작이 가능하며 delete를 제외하고는 명령문(메타정보)과 데이터문(요청데이터)을 한 줄씩 순서대로 입해야 합니다. delete는 내용 입력이 필요 없기 때문에 명령문만 있습니다.
_bulk 의 명령문과 데이터문은 반드시 한 줄 안에 입력이 되어야 하며 줄바꿈을 허용하지 않습니다.
_bulk API를 사용해야하는 이유
- 벌크 동작은 따로따로 수행하는 것 보다 속도가 훨씬 빠릅니다.
- 특히 대량의 데이터를 입력 할 때는 반드시 _bulk API를 사용해야 불필요한 오버헤드가 없습니다.
- Logstash 와 Beats 그리고 Elastic 웹페이지에서 제공하는 대부분의 언어별 클라이언트에서는 데이터를 입력할 때 _bulk를 사용하도록 개발되어 있습니다.
_bulk API 예제
다음은 _bulk 명령을 실행한 예제입니다. 각 명령의 결과가 items에 배열로 리턴됩니다.
모든 명령이 동일한 인덱스에서 수행되는 경우에는 아래와 같이 <인덱스명>/_bulk 형식으로도 사용이 가능합니다.
파일에 저장 내용 실행
주의!!: Elasticsearch 에는 커밋이나 롤백 등의 트랜잭션 개념이 없습니다. _bulk 작업 중 연결이 끊어지거나 시스템이 다운되는 등의 이유로 동작이 중단 된 경우에는 어느 동작까지 실행되었는지 확인이 불가능합니다. 보통 이런 경우 전체 인덱스를 삭제하고 처음부터 다시 하는 것이 안전합니다. 또한 연결이 끊길 수 있으니 파일에 벌크 명령을 저장하고 사용하는 것도 추천합니다.
- 벌크 명령을 파일로 저장하고 curl 명령으로 실행시킬 수 있습니다.
- 저장한 명령 파일을 --data-binary 로 지정하면 저장된 파일로 부터 입력할 명령과 데이터를 읽어올 수 있습니다.
- 다음 내용을 bulk.json 이라는 이름의 파일로 저장한 후, 명령으로 bulk.json 파일에 있는 내용들을 _bulk 명령으로 실행 가능합니다. 파일 이름 앞에는 @문자를 입력합니다.
참고
- 순천향대학교 교육자료: http://cs.sch.ac.kr/lecture/BigData/2017/03-ElasticSearch-Introduction.pdf
- [Elastic 가이드북] 4.3 벌크 API - _bulk API: https://esbook.kimjmin.net/04-data/4.3-_bulk
- [Elastic 가이드북] _bulk API: https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-bulk.html
- [Elastic 가이드북] 4.3 검색 API - _search API: https://esbook.kimjmin.net/04-data/4.4-_search
반응형
'Study: DeveloperTools(DevTool) > DevTool: NoSQL(Elastic, Mongo)' 카테고리의 다른 글
[Elastic] Elasticsearch 구문 검색: 원하는 데이터를 삭제하자 (0) | 2022.08.03 |
---|---|
[Elastic] Elasticsearch 구문 검색(_search API): 대용량 데이터를 검색하자 (feat. scroll) (0) | 2022.08.02 |
[Elastic] Elasticsearch 구문 검색(_search API): 원하는 내용을 검색하자 (feat. dev tool(Kivana)) (0) | 2022.08.02 |
[Elastic] Elasticsearch 구문 검색: 'SQL Query' to 'Query DSL' (0) | 2022.08.02 |
[Elastic] Elasticsearch CRUD 정리: 데이터 다루기 (0) | 2022.07.27 |