Posts [42Seoul] push_swap 구현 과정
Post
Cancel

[42Seoul] push_swap 구현 과정

플로우차트

Mandatory

1

Bonus

2

인자값

1
./push_swap 4 2 1 3 5

인자가 입력된 순서대로 스택 A에 저장한다.

즉, 가장 먼저 들어온 인자는 스택 A의 맨 밑에, 가장 나중에 들어온 인자는 스택 A의 맨 위에 위치한다.

3

자료구조

4

스택을 구현하기 위해 원형 양방향 연결 리스트를 사용했다.

스택의 상단 뿐만 아니라 하단으로도 접근하여 연산횟수의 최소화를 이루고자 했다.

특히, 이번 과제에서는 모래시계 알고리즘을 사용했기 때문에 하단에 위치한 원소를 빠르게 상단으로 올릴 필요가 있었다.

스택 A에서 스택 B로 옮기기

인덱싱

인자로 들어온 원소들의 값을 인덱스 값으로 바꾼다.

예를 들어, 인자로 5 2 99 0 가 들어왔다면, 2 1 3 0 과 같이 바꾸는 것이다.

인덱스 값으로 바꾸는 이유는 스택으로 넘겨야 할 순서를 명확하게 정하기 위함이다.

인덱스로 변환하는 작업은 정렬 알고리즘을 사용하면 되는데, 이번 과제에서는 퀵 정렬을 사용했다. 퀵 정렬은 평균 시간 복잡도가 $n\ log_2n$ 이기 때문에 빠른 연산을 위해 사용했다.

모래시계 알고리즘

모래시계 알고리즘이란 push_swap 과제를 수행하기 위해 사용하는 특수한 알고리즘이다.

스택 A에 저장된 원소들을 스택 B로 옮겼을 때 큰 값들은 스택의 양 끝에 위치하고, 작은 값들은 스택의 중앙에 위치한 모습이 모래시계 모양과 비슷해서 모래시계 알고리즘으로 불리고 있다.

5

6

모래시계 알고리즘을 사용하는 이유는 연산횟수를 크게 줄일 수 있기 때문이다.

스택 B에서 스택 A로 값을 넘길 때, 스택 B의 상단과 하단에서만 값을 찾기 때문에 상대적으로 연산을 적게한다.

7

위와 같이 모래시계가 아닌 형태에서는 연산을 총 3번 수행한다.

8

한편, 모래시계 형태에서는 다음으로 넘겨야 할 수가 스택의 상단에 위치한다면 연산을 한번만 수행한다.

9

또는 스택의 하단에 위치해도 모래시계 형태가 아닐 때보다 연산 횟수가 상대적으로 적어진다.

정렬해야 하는 수가 더 많아진다면 모래시계 형태에서는 연산 횟수는 더욱 많이 줄어들 것이다.

구간을 나누기 위한 chunk

스택 A에서 스택 B로 넘길 때 스택 B가 모래시계 구조를 유지하기 위해서 chunk(덩어리)를 사용한다.

chunk는 숫자를 일정 구간으로 나누어주는 역할을 한다.

10

위의 그림처럼 가운데를 중심으로 대칭을 이루며 일정 구간에 속한 숫자들이 분포하도록 스택 A에서 스택 B로 원소들을 넘겨주기 위해 chunk를 사용한다.

나중에 스택 B에서 스택 A로 원소들을 옮길 때, 스택의 상단과 하단 근처에 넘겨야 하는 값들이 위치하도록 하는 것이 핵심이다.

다만, 숫자의 개수에 따라서 chunk의 값을 적절하게 조정해주어야 한다.

chunk가 작으면 일정 구간에 있는 숫자들의 편차가 작아지면서 정밀한 모래시계 모양이 만들어지지만, 연산 횟수가 증가한다.

아래의 사진은 300개의 숫자에 대해 chunk를 5로 설정한 결과이다.

11

반대로 chunk가 과도하게 크면 숫자들의 편차가 커지면서 모래시계 모양이 엉성하게 만들어진다.

아래의 사진은 300개의 숫자에 대해 chunk를 150으로 설정한 결과이다.

12

그리고 아래의 사진은 동일한 숫자 300개에 대해 chunk를 25개로 설정한 결과이다.

13

chunk가 과도하게 큰 경우보다 촘촘하지만, 과도하게 작은 경우보다는 약간 엉성한 모양을 띄고 있다.

하지만, 연산 횟수는 다른 경우보다 가장 적은 것으로 나왔다.

chunk에 따른 연산 횟수는 다음과 같다.

즉, 이를 통해 숫자의 개수에 따라 적절한 chunk를 설정해주어야 연산 횟수를 최소화 할 수 있다는 것을 알 수 있다.

그렇다면 적절한 chunk를 어떻게 구할 수 있을까?

우선, 직접 값을 넣어가며 귀납적으로 구하는 방법이 있다.

하지만 이미 과제를 구현하신 분들께서는 아래와 같은 방정식을 구하셨다.

\[y = 0.000000053x^2 + 0.03x + 14.5\]

위의 식을 이용하면 숫자 x 개에 따라 적절한 chunk y 를 구할 수 있다.

구현

num은 현재 스택 A에 남아있는 가장 작은 수라 해보자. 실제 값들을 인덱스로 바꾸었기 때문에 num은 0부터 시작한다.

현재 스택 A의 상단에 있는 값을 top이라 하면, 다음과 같은 규칙을 적용한다.

조건연산
top ≤ numpb
top > num && top ≤ num + chunkpb, rb
top > num + chunkra

top ≤ num

top이 num보다 작거나 같다는 것은 스택 B의 중앙에 위치해야 한다는 의미이다.

그렇기 때문에 바로 스택 B로 넘긴다.

top > num && top ≤ num + chunk

top이 num보다 크고, num + chunk보다 작거나 같다는 것은 스택의 중앙보다는 조금 더 위에 있거나 밑에 있어야 한다는 것을 의미한다.

그래서 스택 B로 보낸 다음 rb를 수행해서 스택의 양쪽으로 큰 값들이 위치하도록 한다.

만약, rb를 수행하지 않으면 모래시계 모양이 형성되지 않는다.

top > num + chunk

top이 num + chunk보다 크다는 것은 스택 B로 넘겨야 하는 값이 아니라는 의미이다.

그래서 ra를 수행해서 다른 값을 top으로 올리는 것이다.

최악의 경우

하지만 위와 같이 구현한다면 다음과 같은 케이스(526개)에 대해서는 성능이 좋지 않다.

14





이 케이스에 대해서는 모래시계의 중앙에 위치해야 하는 수가 가장 맨 밑에 있어서 계속 ra를 수행해서 연산 횟수가 크게 증가했다. (연산 횟수 : 7414번)

15

임의의 숫자 500개에 대해서 수행했을 때 평균 5000번인 것에 비하면 성능이 좋지 않다는 것을 알 수 있다.

성능 개선

성능을 저하시키는 원인은 top > num + chunk 인 경우에 ra 만 수행하기 때문이다.

만약 다음으로 넘길 숫자가 스택의 하단에 있다면 ra 가 아닌 rra 를 수행하면 연산 횟수를 줄일 수 있을 것이다.

그래서 스택의 상단 또는 하단에서 top <= num + chunk 이 되는 지점을 찾아서 해당 지점까지 rra 또는 ra 를 해주는 것으로 해결했다.

의사 코드는 다음과 같다.

1
2
3
4
5
6
7
8
9
10
while (스택의 상단에서 num + chunk보다 같거나 작을  까지)
	상단 개수 += 1
while (스택의 하단에서 num + chunk보다 같거나 작을  까지)
	하단 개수 += 1
if (상단 개수 < 하단 개수)
	while (상단 개수만큼)
		rra(a)
else
	while (하단 개수만큼)
		ra(a)

덕분에 약 2배 정도 연산 횟수를 줄일 수 있었다. (연산 횟수 : 3925번)

16

과연 정말 최적화가 된 것일까?

최악의 경우에 대해 rra 도 함께 사용하도록 알고리즘을 바꾸면 다른 케이스들에서 평균 연산 횟수가 약 20% 증가하는 trade-off 관계를 발견했다.

즉, 오히려 ra 만 수행했을 때 연산이 더 적었다는 것이다.

평균적인 케이스와 최악의 케이스를 모두 잡기 위해 사용할 수 있는 최적의 알고리즘은 찾기 어려웠다.

이를 해결하기 위해 스택 A에서 스택 B로 넘기는 방법 2가지를 모두 시뮬레이션 해보고, 더 적은 연산을 수행하는 경우를 선택하는 그리디 알고리즘을 적용했다.

2가지 경우에 대해 모두 연산을 수행하다보니 시간 복잡도는 많이 증가했지만, 과제에서 요구하는 성능을 충족시키기 위해서는 최선의 선택이었다.

스택 B에서 스택 A로 옮기기

모래시계 모양으로 정렬된 스택 B에서 스택 A로 옮기는 것은 간단하다.

상단과 하단 중에서 스택 B에서 가장 큰 수를 찾아서 rb 또는 rrb 를 수행한 다음 pb 를 수행하면 된다.

17

보너스

보너스는 Mandatory를 잘 마쳤다면 수월하게 해결할 수 있다.

보너스는 Mandatory에서 실행한 결과로 스택 A에 정렬이 잘 되었는지, 스택 B에 남은 원소는 없는지 판단하는 checker 를 만드는 것이다.

Mandatory에서 만든 파일을 아래와 같이 실행하면 수행한 연산들이 출력되는데, 이 연산들을 그대로 수행해서 결과를 확인하면 된다.

1
2
3
4
5
6
7
8
9
./push_swap 4 5 1 3 2
ra
ra
pb
ra
pb
rra
pa
pa

push_swap 실행 결과는 stdout 으로 출력되는데, checker 는 파이프를 통해 이 결과를 get_next_line 함수를 사용해서 받아오면 된다.

이 부분에 대해서는 file descriptor 를 이해하면 금방 해결할 수 있으므로 자세한 설명은 생략한다.

회고

최고의 알고리즘은 없다.

데이터를 효율적으로 정렬하기 위해 수 많은 알고리즘이 존재하며, 자료구조도 많다.

문제를 해결하기 위해 어떤 알고리즘을 적용하면, 다른 알고리즘의 장점이 상쇄되는 trade-off 상황을 자주 접했다.

결국 알고리즘은 어떤 문제를 해결하기 위해 고안된 방법론 중 하나일 뿐, 모든 문제에 적합하다고는 할 수 없는 것이다.

문제에 맞는 알고리즘을 사용하되, 여러 제약 조건 중에서 포기할 수 있는 것과 포기하면 안되는 것을 선택하는 것이 중요하다는 것을 배웠다.

정석은 없다.

사실 이 과제를 모래시계 알고리즘으로 해결하는 것에 대해 일종의 죄책감 내지는 불편함을 느끼고 있었다.

퀵 정렬이나 병합 정렬 같이 널리 알려진 정렬이 아닌 이 과제에만 적용할 수 있는 모래시계 알고리즘을 쓴다는 것이 약간 편법처럼 느껴졌기 때문이다.

하지만, 문제 하나를 해결하기 위해 정답은 여러 개가 있을 수 있는 것이기 때문에 이에 대한 불편함은 내려놓기로 했다. 어차피 모래시계 알고리즘을 구현하기 위해서 전처리 과정에서 퀵 정렬을 사용했으니, 어느 정도 과제의 목표를 달성한 것 아닐까 싶다.

대신, 모래시계 알고리즘이 왜 문제를 해결하는데 효율적이며, 내부적으로 어떻게 작동하는지 이해하기 위해 노력했다.

그리고 최악의 케이스를 해결하기 위해 그리디 방식으로 연산이 적은 횟수를 택하도록 했다.

어찌보면 이 과제를 해결하기 위해 퀵 정렬, 모래시계 알고리즘, 그리디 3가지 방식을 적용한 셈이다.

함께하면 금방 한다.

push_swap은 2서클 과제에서도 수문장으로 소문난 과제였기에 두려움이 앞섰다.

하지만, 운이 좋게도 so_long 과제에 이어 이번 과제도 마음이 맞는 동료들과 함께 페어 프로그래밍을 하며 과제를 진행했다.

오프라인으로 모이기 어려운 상황이라서 주로 온라인으로 진행했는데, 보너스까지 구현하는데 약 2주 정도 소요되었다.

매일 스터디를 하지는 않았지만, 시간이 맞을 때마다 모여서 문제를 해결하니 혼자 과제를 할 때보다 훨씬 많은 것을 배울 수 있었다.

조건문에서 부등호 방향을 반대로 하거나, 변수 초기화를 안해서 생기는 에러를 동료가 빠르게 발견해준 덕분에 시간을 절약할 수 있었다.

이 자리를 빌어 함께 고생한 동료들에게 감사하다는 인사를 전한다.

This post is licensed under CC BY 4.0 by the author.