일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Python
- MongoDB
- 도커
- Container
- clone
- docker
- 리워드앱
- 재테크
- 앱테크
- VPC
- Linux
- AWS
- 토스카드
- aws codecommit
- mininet
- 리뷰
- network
- MongoEngine
- 커피머니불리기
- built-in
- 후기
- 포인트앱
- python3
- DocumentDB
- 실사용
- namespace
- S3
- codecommit
- 하나머니
- docker network
- Today
- Total
ㅍㅍㅋㄷ
AWS DocumentDB(MongoDB) 의 Replication 구조 - Write Concern 에 대하여 본문
DocumentDB 의 Replication
AWS DocumentDB 서비스를 이용하며 알아본 몇가지 내용들을 공유하고자 한다.
이번 포스팅에서는 AWS DocumentDB 사용시 Primary 와 Secondary 간 데이터 일관성을 유지할 수 있는
Write concern 에 대해서 알아보자.
Write Concern 이란 무엇인가
Write concern 은 MongoDB 가 Client 의 요청으로 데이터를 기록할 때,
해당 요청에 대한 Response를 어느 시점에 주느냐에 대한 동작 방식을 지칭한다.
먼저 아래 그림을 보자.
MongoDB는 Client 가 보낸 데이터를 Primary 에 기록하고, 이에 대한 Response를 Client 에게 보내게 된다.
이때, MongoDB를 Replication 으로 구성하였을 경우 Primary 의 복제본을 유지하는 Secondary 가 함께 구성되게 된다.
만약 위 그림과 같이 Primary 1대와 Secondary 2대로 구성하였을 경우,
Client 가 보낸 데이터의 Write 처리는 Primary 에서만 먼저 처리하게 되며,
이후 Secondary 로 변경된 데이터를 동기화 시키는 단계를 거친다.
이때 눈여겨 봐야 하는 점은 Primary와 Secondary 간 동기화 되는데 시간차가 있다는 점이다.
만약 Client 가 보낸 데이터를 Primary 가 처리 한 직후 Client 쪽으로 Response 를 보내고
이후, Primary 와 Secondary 간 동기화가 진행된다고 가정하면
Client 가 Response를 받은 시점과 Primary 에서 Secondary로 Sync 되는 타이밍 사이에는
데이터 일관성이 보장되지 않는 위험 구간이 존재하게 되는 것이다.
만약 이 사이에 Primary 에 장애가 발생 했다고 가정해 보면,
아직 최신 데이터를 Sync 하지 못한 Secondary 멤버가 Primary 로 승격되게 되고
Client 는 이를 알아차리지 못한채 이미 작업이 완료된 Response 를 받았기 때문에
Client 가 알고 있는 데이터와 DB 의 데이터가 unmatch 되는 상황이 발생되게 된다.
이러한 문제를 해결하기 위해
Client 쪽에 보내는 response 시점을 Primary 와 Secondary 가 동기화 된 이후로 설정이 가능한데
이것이 바로 Write concern 설정의 핵심이다.
Write Concern 을 설정하게 되면
Primary 가 데이터 쓰기를 처리한 이후 바로 Client 에게 response 를 보내는 것이 아니라
Secondary 쪽으로 데이터를 동기화 작업을 완료한 이후에 Client 에게 response 를 보내게 된다.
이렇게 되면 Client 와 Primary, Secondary 간에 데이터 일관성을 유지할 수 있게 된다.
Write Concern 옵션
Write Concern 을 지정하는데는 크게 w / j / wtimeout 을 설정 할수 있는데 자세한 내용은 아래와 같다.
1) w option
w 를 설정하게 되면, ReplicaSet 에 속한 멤버중 지정된 수만큼의 멤버에게 데이터 쓰기가 완료되었는지 확인한다.
만약 Primary/Secondary 가 총 3대로 구성된 ReplicaSet 일 경우,
w = 3 으로 설정시 3대의 멤버에 데이터 쓰기가 완료 된 것을 확인하고 response 를 반환하게 된다.
보통은 w = 1 이 Default 설정이며, 이런 경우 Primary 에만 기록 완료되면 response 하게 된다.
만약, w = majority 로 설정할 경우, 멤버의 과반수 이상을 자동으로 설정하게 된다.
즉, 3대의 멤버가 Replicaset 에 속해 있을 경우 w = 2 와 동일한 설정으로 보면 된다.
2) j option
해당 값을 설정하면, 데이터 쓰기 작업이 디스크상의 journal 에 기록된 후 완료로 판단하는 옵션이다.
만약, Replicaset 의 멤버가 3대인 경우 w = majority, j = true 로 설정시
Primary 1 대 Secondary 1대 총 2대의 멤버에서 디스크의 journal 까지 기록이 완료 된 후 response 하게 된다.
3) wtimeout
해당 값을 설정하면, Primary 에서 Secondary 로 데이터 동기화시 timeout 값을 설정하는 옵션이다.
만약 wtimeout 의 limit 을 넘어가게 되면 실제로 데이터가 Primary에 기록되었다고 해도 error 를 리턴하게 된다.
설정 단위는 milisecond 이다.
DocumentDB 의 Write Concern
DocumentDB에 설정된 Write Concern 값을 확인해 보자.
설정 확인은 MongoDB 에 접속 후 rs.conf() 명령을 통해 확인 가능하다.
rs0:PRIMARY> rs.conf()
{
"_id" : "rs0",
"configsvr" : false,
"protocolVersion" : 1,
"writeConcernMajorityJournalDefault" : true,
"members" : [
{
"_id" : 0,
"host" : "<DOCDB-01>",
"arbiterOnly" : false,
"buildIndexes" : true,
"hidden" : false,
"priority" : 1,
"slaveDelay" : 0
},
{
"_id" : 1,
"host" : "<DOCDB-02>",
"arbiterOnly" : false,
"buildIndexes" : true,
"hidden" : false,
"priority" : 1,
"slaveDelay" : 0
},
{
"_id" : 2,
"host" : "<DOCDB-03>",
"arbiterOnly" : false,
"buildIndexes" : true,
"hidden" : false,
"priority" : 1,
"slaveDelay" : 0
}
],
"settings" : {
"getLastErrorDefaults" : {
"w" : "majority",
"wtimeout" : 0
}
}
}
ReplicaSet 으로 총 3대의 멤버가 있는 것을 볼 수 있다.
이 중 write concern 과 관련된 설정은 아래의 두가지를 통해 확인 가능하다.
1) writeConcernMajorityJournalDefault
"writeConcernMajorityJournalDefault" : true
해당 option 은 write concern 을 majority 로 설정 한 후, disk 로 data journal 을 기록 하는 설정이다.
DocumentDB 는 데이터의 내구성을 높이기 위해 majority 와 disk journaling 을 사용하도록 기본적으로 설정되어 있음을 알 수 있다.
2) getLastErrorDefaults
"getLastErrorDefaults" : {
"w" : "majority",
"wtimeout" : 0
}
이 option 또한 ReplicaSet 에 대한 write concern 을 지정하는 것으로, w 값이 majority 로 설정된 것을 보면, write concern 이 majority 로 동작하는 것임을 알 수 있다.
그렇다면, DocumentDB의 기본 replication config 를 변경할 수 있을까 해서 시도해 보니 변경이 불가함을 알 수 있다.
rs0:PRIMARY> rs.reconfig({"settings": { "writeConcernMajorityJournalDefault": false }})
{
"ok" : 0,
"errmsg" : "Feature not supported: replSetReconfig",
"code" : 303
}
DocumentDB의 이러한 정책들은 대부분 데이터 내구성에 초점이 맞춰진 설정들임을 알 수 있다.
하지만 이러한 안정 지향적인 설정들은 성능에 대한 부분과 trade off 되는 부분임은 감안해야 할 것이다.
AWS 는 Primary 와 Secondary 간 복제 지연 현상에 대해 간헐적으로 발생할수는 있으나 100 ms 이하 일 것이라고 가이드 하고 있다.
Reference
'IT > mongoDB' 카테고리의 다른 글
AWS DocumentDB Failover 동작 방식에 대한 이해 (0) | 2019.05.29 |
---|---|
AWS DocumentDB(MongoDB) Replication 과 MongoEngine 설정 (Read Preference) (0) | 2019.05.25 |
AWS DocumentDB(MongoDB) 를 python 을 활용해 접속해 보자 (TLS 암호화) (0) | 2019.05.24 |