퀵 정렬 (Quick sort)

분할정복법과 퀵 정렬 (Quick sort)

퀵 정렬은 합병 정렬과 마찬가지로 분할정복법을 사용하지만 그 방법에 있어서 차이가 있습니다.
퀵 정렬에서는 정렬할 데이터가 주어지면 하나의 값을 기준값(pivot)으로 사용하여 정렬을 합니다. 어떤 값을 기준값으로 설정하는지가 퀵정렬의 성능을 좌우합니다.

분할정복법 3단계를 바탕으로 퀵정렬의 과정을 알아보겠습니다.

  1. 분할 : 하나의 값을 기준값(pivot)으로 설정 한 후 데이터들을 기준값보다 큰 값과 작은값으로 분류한다.
  2. 정복 : 분할한 양쪽을 각각 재귀로 퀵 정렬한다.
  3. 합병 : 이미 분할 과정에서 정렬이 완료되었기 때문에 따로 과정이 없다.

퀵 정렬에서의 분할정복법 과정

퀵 정렬 의사 코드

의사 코드는 다음과 같습니다.

1
2
3
4
5
6
7
8
9
10
11
12
quickSort(A[], p, r) {
if(p<r) then{
q = partition(A, p, r); // 분할
quickSort(A, p, q-1); // 왼쪽 부분배열 정렬
quickSort(A, q+1, r); // 오른쪽 부분배열 정렬
}
}

partition(A[], p, r) {
배열 A[p...r]의 원소들을 A[r]을 기준으로 양쪽으로 재배치하고
A[r]이 자리한 위치를 return
}

배열 A의 인덱스 p에서 r사이에 있는 데이터를 정렬합니다. 조건문으로 p가 r보다 작은 경우에만 알고리즘이 실행되도록 합니다. 다음으로 partion 함수는 기준값(pivot)을 기준으로 전체 데이터를 나눠주고 피봇 인덱스를 반환하는 역할을 합니다. 따라서, q는 피봇이 됩니다.

[p, q-1] 은 배열의 왼쪽 부분, 작은 값이고
[q+1, r] 까지는 배열의 오른쪽 부분, 큰 값입니다.
재귀적으로 quickSort 함수를 호출해 정렬합니다.

위의 그림에서 기준값(pivot)으로 인덱스의 마지막 값을 사용하고 있습니다. 위의 그림 기준에서 현재 인덱스 j의 값이 기준값보다 크다면 j를 증가시켜 다음값으로 넘어갑니다.
그러나 인덱스 j의 값이 기준값보다 작다면 앞쪽으로 보내야하는데, 이때 i값을 1 증가 시킨 후 그 값과 교환합니다.


위의 과정은 기준값을 마지막 인덱스의 값인 15로 설정하고 i와 j를 증가시키면서 정렬하는 과정을 보여줍니다. 모든 정렬이 완료되면 인덱스 i+1의 값과 기준값의 위치를 변경합니다.

1
2
3
4
5
6
7
8
9
10
Partition(A, p, r){
x<-A[r];
i<-p-1;
for j<-p to r-1
if A[j] <= x then
i<-i+1;
exchange A[i] and A[j];
exchange A[i+1] and A[r];
return i+1;
}

Partition 함수를 더 자세한 의사 코드로 나타냈습니다. 앞서 설명한 위치 변환과 인덱스 증가로 정렬을 완료하고 마지막으로 기준값(pivot)의 인덱스를 리턴합니다.

퀵 정렬 c++ 코드

이제 의사 코드를 바탕으로 c++ 코드를 작성하면 다음과 갖습니다. (의사 코드와는 완전히 일치하지는 않습니다.)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
#include <iostream>

#define ITEM_SIZE 10

using namespace std;

void print_arr(int a[], int size) {
for (int i = 0; i < size; i++) {
cout << a[i] << ' ';
}
cout << '\n';
}

int partition(int a[], int left, int right) {
int pivot = right;
int i = left - 1;
int j = left;
int tmp;

if (left < right) {
while (j < right) {
if (a[j] < a[pivot]) {
tmp = a[j];
a[j] = a[i + 1];
a[i + 1] = tmp;
i++;
}
j++;
}
tmp = a[pivot];
a[pivot] = a[i + 1];
a[i + 1] = tmp;
}
pivot = i + 1;

return pivot;
}

void quick_sort(int a[], int left, int right) {
if (left < right) {
int pivot = partition(a, left, right);
quick_sort(a, left, pivot - 1);
quick_sort(a, pivot + 1, right);
}
}

int main() {
int a[ITEM_SIZE] = { 15, 2, 24, 18, 7, 13, 12, 4, 21, 9 };
print_arr(a, ITEM_SIZE);
quick_sort(a, 0, ITEM_SIZE - 1);
print_arr(a, ITEM_SIZE);
return 0;
}

퀵 정렬 시간 복잡도

퀵 정렬에서의 시간 복잡도는 파티션(분할) 하는데 모든 데이터를 한번씩 비교하면 되므로 n이 됩니다. 정확하게 말하자면 데이터의 개수가 n개일때, n-1 번의 비교가 이루어집니다.

합병 정렬보다는 시간 복잡도를 구하는게 조금 더 복잡한데, 합병 정렬은 항상 2개로 나뉘는것과 달리 퀵 정렬은 항상 양쪽이 고르게 나누어지지 않기 때문입니다.

먼저 최악의 경우부터 생각해보면 모든 배열이 정렬되어있을 때, 기준값이 최대/최소 값일 때, 최악의 시간 복잡도가 발생합니다. 분할은 0개와 나머지 전체로 나누어지므로 결국 데이터는 아무변화가 없고 똑같은 루틴이 반복되기 때문에 시간 복잡도는 **O(n^2)**가 됩니다.

반대로 최선의 경우는 항상 절반으로 분할되는 경우로, 이 때는 합병 정렬과 동일한 시간인 **O(nlogn)**의 시간을 같습니다.

퀵 정렬은 다른 정렬 알고리즘보다 대체로 빠르기 때문에 퀵 정렬 이라는 이름이 붙었습니다. 그렇지만 최악의 경우에는 O(n^2)의 느린 속도를 보여줬는데 왜 퀵 정렬이 다른 알고리즘 보다 빠른 걸가요?

최선의 경우와 최악의 경우는 극단적인 케이스라서 실제적으로 일어나기 어려운 상황입니다.

항상 한쪽이 적어도 1/9 이상이 되도록 분할된다면?

현식적으로 가정했을 때, n개의 데이터가 항상 9:1로 분할 된다고 하면 한 단계 당 분할되는 시간을 구하면 항상 n이므로 전체 비교 연산은 트리의 깊이 * n 입니다.
트리는 대칭적이지 않으므로 가장 깊은 오른쪽 경로(최악의 경우)를 예로 들면 (9/10)^k * n = 1이 됩니다.
따라서 시간 복잡도 k = log9/10(n)이 됩니다.

이 예가 의미하는 것은 퀵 정렬의 성능은 파티션이 얼마나 밸런스있게 나뉘냐에 결정된다는 것입니다. 극단적인 경우만 아니라면 퀵 정렬의 시간 복잡도는 nlogn 이 되므로 실제로 상당히 빠른 정렬 방법이 됩니다.

출처 : 2015 봄학기 알고리즘 - 부경대 권오흠 교수님

합병 정렬 (Merge sort)

분할정복법과 합병 정렬 (Merge sort)

합병 정렬은 앞서 알아본 선택, 삽입, 버블 정렬과는 다르게 분할정복법이라는 개념을 사용합니다.

**분할정복법(Divide-And-Conquer)**이라는 것은 주어진 문제를 다음과 같은 3단계의 절차를 통해 해결하는 방법입니다.

  1. 분할 : 해결하고자 하는 문제를 작은 크기의 동일한 문제들로 분할한다.
  2. 정복 : 각각의 작은 문제를 순환적으로 해결한다.
  3. 합병 : 작은 문제의 해를 합하여(merge) 원래 문제에 대한 해를 구한다.

그럼 이를 토대로 합병 정렬의 과정을 살펴보겠습니다.

합병 정렬은 여러 개의 데이터를 한 번에 정렬하는 것이 아닌 이를 계속해서 반으로 나눈 후 다시 합병하는 과정에서 정렬이 이루어집니다.

분할을 반복하다보면 마지막은 길이가 1인 구간으로 나뉘어집니다. 더이상 분할이 불가능할때 다시 합병하면서 정렬을 하는것입니다. 그렇기 때문에 합병 정렬에서 가장 중요한 부분은 실제 정렬을 수행하는 **합병(merge)**하는 과정입니다.

그럼 합병과정에서 정렬은 어떻게 이루어질까요? 다음 그림을 통해서 실제 정렬이 이루어지는 합병 과정을 좀 더 자세히 알아보겠습니다.

먼저 위 그림은 합병이 이루어 지기 위한 이미 정렬된 2개의 블록이 존재하는 모습입니다. 현재 두개의 블록은 이미 길이가 1인 구간으로 나눠진 배열부터 시작해 각각 합병 과정을 거쳐 정렬된 상태로 만들어진 배열입니다.
이 두개의 블록을 정렬된 상태를 유지하며 합치기 위해서는 i 인덱스에 있는 값과, j 인덱스에 있는 값을 하나씩 비교한 후 추가배열에 저장하면 됩니다.

위 그림처럼 하나의 블록이 모두 합쳐 졌을 경우 나머지 블록은 순서대로 배열에 저장하면 됩니다.

모든 합병을 마친 후 이 추가배열의 값으로 기존 배열의 해당 구간에 복사하면 됩니다.

합병 정렬 의사 코드

의사 코드는 다음과 같습니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
mergeSort(A[],p,r){
if(p<r) then{
q <- (p+r)/2;
mergeSort(A,p,q);
mergeSort(A,q+1,r);
merge(A, p, q, r);
}
}

merge(A[], p, q, r){
정렬되어 있는 ㅜ 배열 A[p..q]와 A[q+1...r]을 합하여
정렬된 하나의 배열 A[p...r]을 만든다.
}

합병 정렬 c++ 코드

이제 의사 코드를 바탕으로 c++ 코드를 작성하면 다음과 같습니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
#include <iostream>

#define ITEM_SIZE 10

using namespace std;

void print_arr(int a[], int size) {
for (int i = 0; i < size; i++) {
cout << a[i] << ' ';
}
cout << '\n';
}

void merge(int a[], int left, int mid, int right) {
int i, j, k;

i = left;
j = mid + 1;
k = left;

int tmp_arr[ITEM_SIZE];

// left 부터 mid 까지의 블록과 mid + 1 부터 right 까지의 블록을 서로 비교
while (i <= mid && j <= right) {
if (a[i] <= a[j]) {
tmp_arr[k] = a[i];
i++;
}
else {
tmp_arr[k] = a[j];
j++;
}
k++;
}

// left 블록의 값이 다 처리되었지만, right 블록의 index가 남아 있는 경우
// right 블록의 남은 부분을 순차적으로 tmp_arr에 복사
if (i > mid) {
for (int m = j; m <= right; m++) {
tmp_arr[k] = a[m];
k++;
}
}
// left 블록의 남은 부분을 순차적으로 tmp_arr에 복사
else {
for (int m = i; m <= mid; m++) {
tmp_arr[k] = a[m];
k++;
}
}

// 임시 배열인 tmp_arr의 값을 원본 배열에 복사한다.
for (int m = left; m <= right; m++) {
a[m] = tmp_arr[m];
}
}

void merge_sort(int a[], int left, int right) {
int mid;

if (left < right) {
// 절반으로 나누기 위해 중간 위치 찾기
mid = (left + right) / 2;

// 분할
merge_sort(a, left, mid);
merge_sort(a, mid + 1, right);

// 합병
merge(a, left, mid, right);
}
}

int main() {
int a[ITEM_SIZE] = { 15, 2, 24, 18, 7, 13, 12, 4, 21, 9 };
print_arr(a, ITEM_SIZE);
merge_sort(a, 0, ITEM_SIZE - 1);
print_arr(a, ITEM_SIZE);
return 0;
}

합병 정렬 시간 복잡도

이제 마지막으로 합병 정렬의 시간 복잡도를 알아보겠습니다. 데이터가 n개 일때 합병 정렬로 계산하는 시간을 T(n)이라고 하겠습니다.
정렬을 위해서 반으로 분할한 후 n/2개의 블럭에 재귀함수를 호출하면, 반으로 분할된 블럭 2개에 대한 정렬을 수행해야하므로 **T(n/2) + T(n/2)**의 시간이 걸립니다. 두개의 정렬된 블럭을 merge할 때 두 블럭을 한번씩 비교하므로 merge 시간은 n입니다.
따라서, merge sort의 시간 복잡도는 T(n) = T(n/2) + T(n/2) + n이 됩니다.

결국 분할을 반복하면 위와 같은 그림의 식을 도출할 수 있고, 이 식을 수학적으로 풀어보면 **O(nlogn)**이 됩니다.

합병 정렬과 퀵 정렬 비교

아직 퀵 정렬에 대해 다루지 않았지만 합병 정렬과 퀵 정렬 모두 시간 복잡도로 **O(nlogn)**을 갖습니다. 그러나 퀵 정렬과 합병 정렬에는 서로 다른 특징이 있습니다.

합병 정렬은 합병 과정에서 임시적인 저장공간으로 데이터를 담고 있는 배열과 같은 크기인 추가 배열을 사용하기 때문에 **추가적인 메모리가 필요**합니다. 그러나 퀵 정렬은 추가 메모리를 사용하지 않고 내부 교환만으로 수행되는 차이가 있습니다.

또한 합병 정렬은 어떤 상황이라도 항상 **O(nlogn)**의 시간 복잡도를 갖지만 퀵 정렬의 경우 아이러니하게도 정렬하기 위해 정렬이 되어 있는 데이터를 사용할 경우 **O(n^2)**의 시간복잡도를 갖게 됩니다. (이 경우는 다음에 퀵 정렬에 대해 포스팅하며 알아보겠습니다.) 그러나 최악의 경우가 아닐 경우 일반적으로 퀵 정렬이 합병 정렬에 비해 빠른 성능을 보입니다.

합병 정렬은 퀵 정렬보다 성능이 전반적으로 떨어지고, 데이터 크기만한 메모리가 더 필요하지만 최대의 장점은 **stable sort**라는 점입니다. 퀵 정렬의 경우 만약 배열 A[25] = 100, A[33] = 100 인 정수형 배열을 정렬한다고 할 때, 33번째에 있던 100이 25번째에 있던 100보다 앞으로 오는 경우가 생길 수 있습니다. 그에 반해서 합병 정렬은 이전의 순서를 유지하면서 정렬된 상태를 만들 수 있습니다.

출처 : 2015 봄학기 알고리즘 - 부경대 권오흠 교수님

기본적인 정렬 알고리즘 (선택, 삽입, 버블)

정렬 알고리즘 종류와 특징

선택 정렬

선택 정렬은 해당 순서에 원소를 넣을 위치는 이미 정해져 있고, 어떤 원소를 넣을지 선택한다라고 생각하면 이해하기 쉽습니다.

선택 정렬 과정

현재 위의 예시에서는 각 순서마다 정렬되지 않은 범위에서 가장 큰 원소를 찾아 맨 마지막 값의 자리와 변경합니다. 가장 큰값을 찾아 맨 오른쪽 원소와 변경해 오름차순으로 정렬했지만, 매 순서마다 가장 작은 값을 찾아 맨 왼쪽의 원소와 변경해주어도 오름차순 정렬을 구현할 수 있습니다.

순서를 간략히 정리하면 다음과 같습니다
각 루프마다
1.최대 원소를 찾는다.
2.최대 원소와 맨 오른쪽 원소를 교환한다.
3.맨 오른쪽 원소를 제외한다.
하나의 원소만 남을 때까지 위의 루프를 반복

의사 코드는 다음과 같습니다.

1
2
3
4
5
6
selectionSort(A[], n) {
for last <- downto 2 {
A[1...last] 중 가장 큰 수 A[k]를 찾는다
A[K] <-> A[last]; A[k]와 A[last]값을 교환
}
}

시간 복잡도를 계산한다면
1)for 루프는 n-1번 반복 되고
2)가장 큰 수를 찾기 위한 비교 횟수는 n-1, n-2, … , 2, 1
3)교환은 상수 시간 작업이므로

T(n) = (n-1) + (n-2) + … + 2 + 1 = n(n-1)/2 = O(n^2)

시간 복잡도는 O(n^2)가 됩니다.

이제 마지막으로 c++ 코드로 작성하면 다음과 같습니다.
(위의 예시에서는 매 순서마다 가장 값이 큰 원소를 가장 오른쪽 원소와 변경함으로써 오름차순 정렬을 구현했지만, 아래의 코드에서는 매 순서마다 가장 값이 작은 원소를 가장 왼쪽의 원소와 변경함으로써 오름차순 정렬을 구현했습니다.)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
#include <iostream>

using namespace std;

void print_arr(int a[], int size) {
for (int i = 0; i < size; i++) {
cout << a[i] << ' ';
}
cout << '\n';
}

void selection_sort(int a[], int size) {
int min_idx, tmp;

for (int i = 0; i < size - 1; i++) {
min_idx = i;
for (int j = i + 1; j < size; j++) {
if (a[j] < a[min_idx]) {
min_idx = j;
}
}
tmp = a[min_idx];
a[min_idx] = a[i];
a[i] = tmp;
}
}

int main() {
int a[] = { 15, 2, 24, 18, 7, 13, 12, 4, 21, 9 };
int size = sizeof(a) / sizeof(int);
print_arr(a, size);
selection_sort(a, size);
print_arr(a, size);
return 0;
}

삽입 정렬

삽입 정렬은 매 순서마다 해당 원소를 삽입할 수 있는 위치를 찾아 해당 위치에 넣는다고 이해하면 쉽습니다.
(선택 정렬은 위치가 정해져있고 이 위치에 어떤 원소를 넣을지 선택하는 것이었다면, 삽입 정렬은 원소는 정해져있고 이 원소를 어디에 넣을지 선택하는 것이라고 이해하면 될 것 같습니다.)

삽입 정렬 과정

위의 그림은 삽입 정렬의 전체적인 과정을 보여주는 것이고, 아래 사진은 삽입 정렬의 전체과정 중 한 과정을 상세하게 보여주고 있습니다.

이번에 선택된 원소는 4이고, 이 원소를 어떤 자리에 삽입할지 탐색하는 과정을 보여줍니다.

삽입 정렬의 의사 코드는 다음과 같습니다.

1
2
3
4
5
insertionSort(A[], n){
for i<- 2 to n{
A[1...i]의 적당한 자리에 A[i]를 삽입한다.
}
}

시간 복잡도를 계산한다면
1)for 루프는 n-1번 반복 되고
2)최악의 경우 데이터 삽입을 위한 비교는 i-1번 비교

따라서 최악의 경우 T(n) = (n-1) + (n-2) + … + 2 + 1 = n(n-1)/2 = O(n^2)

시간 복잡도는 O(n^2)가 됩니다.

이제 마지막으로 c++ 코드로 작성하면 다음과 같습니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
#include <iostream>

using namespace std;

void print_arr(int a[], int size) {
for (int i = 0; i < size; i++) {
cout << a[i] << ' ';
}
cout << '\n';
}

void insert_sort(int a[], int size) {
int tmp;

for (int i = 1; i < size; i++) {
tmp = a[i];
int j = i;

while (j > 0 && a[j - 1] > tmp) {
a[j] = a[j - 1];
j--;
}
a[j] = tmp;
}
}

int main() {
int a[] = { 15, 2, 24, 18, 7, 13, 12, 4, 21, 9 };
int size = sizeof(a) / sizeof(int);
print_arr(a, size);
insert_sort(a, size);
print_arr(a, size);
return 0;
}

버블 정렬

버블 정렬은 선택 정렬과 기본 개념이 비슷합니다. 버블 정렬에서도 선택 정렬과 같이 이미 해당 순서에 원소를 넣을 위치는 정해져 있고, 어떤 원소를 넣을지 선택한다라고 생각하면 됩니다. 다만 선택 정렬과는 다르게 최대값을 찾고, 그 최대값을 맨 마지막 원소와 교환하는 과정에서 차이가 있습니다.

버블 정렬 과정

버블 정렬의 의사 코드는 다음과 같습니다.

1
2
3
4
5
6
bubbleSort(A[], n){
for last <- downto 2{
for i <- 1 to last - 1
if(A[i]>A[i+1]) then A[i] <-> A[i+1] // 교환
}
}

시간 복잡도를 계산한다면
1)바깥 for 루프는 n-1번 반복 되고
2)안쪽 for 루프는 n-1, n-2, …, 2, 1번 반복
3)원소 교환은 상수시간 작업

따라서 T(n) = (n-1) + (n-2) + … + 2 + 1 = n(n-1)/2 = O(n^2)**

시간 복잡도는 O(n^2)가 됩니다.

이제 마지막으로 c++ 코드로 작성하면 다음과 같습니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#include <iostream>

using namespace std;

void print_arr(int a[], int size) {
for (int i = 0; i < size; i++) {
cout << a[i] << ' ';
}
cout << '\n';
}

void buuble_sort(int a[], int size) {
int tmp;

for (int i = 0; i < size - 1; i++) {
for (int j = i + 1; j < size; j++) {
if (a[i] > a[j]) {
tmp = a[i];
a[i] = a[j];
a[j] = tmp;
}
}
}
}

int main() {
int a[] = { 15, 2, 24, 18, 7, 13, 12, 4, 21, 9 };
int size = sizeof(a) / sizeof(int);
print_arr(a, size);
buuble_sort(a, size);
print_arr(a, size);
return 0;
}

출처 : 2015 봄학기 알고리즘 - 부경대 권오흠 교수님

소수 구하기 (에라토스테네스의 체)

소수(Prime Number)약수로 1과 자기 자신만을 가지는 정수입니다. 정수론의 기본 정리에 의해 모든 자연수는 단 하나의 소수들의 곱으로 표현됩니다.

소수 구하는 알고리즘

1. 기본적인 접근

소수는 1과 N만을 약수로 가진다. 그럼 2부터 N-1까지의 수로는 나눠져서는 안된다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
#include <iostream>
using namespace std;

int main(){
unsigned int num;
cout << "소수를 구할 수를 입력하세요 : ";
cin >> num;
bool isPrime = true;

// 2부터 N-1의 수로 나눠서 나눠지는 수가 있으면 반복문 종료
for (int i=2; i<num; i++) {
if (num % i == 0) {
isPrime = false;
break;
}
}

if(isPrime) {
cout << num << "은 소수입니다." << endl;
}
else {
cout << num << "은 소수가 아닙니다." << endl;
}

return 0;
}

연산 횟수 : N-2번

2. 에라토스테네스의 접근

주어진 자연수 N이 소수이기 위한 필요충분 조건은 N이 N의 제곱근보다 크지 않은 어떤 소수로도 나눠지지 않는다. 수가 수를 나누면 몫이 발생하게 되는데 몫과 나누는 수, 둘 중 하나는 반드시 N의 제곱근 이하이기 때문이다.

즉, 2부터 N의 제곱근 까지 나눠보면 됩니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
#include <iostream>
#include <math.h>
using namespace std;

int main(){
unsigned int num;
cout << "소수를 구할 수를 입력하세요 : ";
cin >> num;
bool isPrime = true;

// 2부터 N의 제곱근까지의 수로 나눠서 나눠지는 수가 있으면 반복문 종료
for (int i=2; i<=sqrt(num); i++) {
if (num % i == 0) {
isPrime = false;
break;
}
}

if(isPrime) {
cout << num << "은 소수입니다." << endl;
}
else {
cout << num << "은 소수가 아닙니다." << endl;
}

return 0;
}

연산 횟수 : 루트(N-2) 번

3. 에라토스테네스의 체

에라토스테네스의 체는 매우 간단한 아이디어입니다. 위에서 모든 자연수는 소수들의 곱으로 표현이 된다고 했습니다. 제일 작은 소수 2부터 시작합니다. 2부터 N-1까지의 수 중에서 2의 배수를 모두 체로 거르고 남은 숫자들 중에서 3의 배수로 거르고를 반복해서 제곱근N 까지 나눠서 걸러지지 않고 남은 수들이 모두 소수가 됩니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#include <iostream>
#include <math.h>
using namespace std;

int main(){
unsigned int num;
cout << "소수를 구할 수를 입력하세요 : ";
cin >> num;

bool* prime = new bool[num+1];
memset(prime, 0, sizeof(bool) * (num + 1));

for (int i=2; i<=num; i++) {
if (prime[i] == false) {
for (int j=i*2; j<=num; j+=i) {
prime[j] = true;
}
}
}

for (int i=0; i<=num; i++) {
prime[i] = !prime[i];
}

if(prime[num]) {
cout << num << "은 소수입니다." << endl;
}
else {
cout << num << "은 소수가 아닙니다." << endl;
}

return 0;
}

주어진 수가 소수인지 아닌지 판별만 할 경우는 2번째 방법을 사용하는 것이 좋습니다.
그러나 다음 문제처럼 주어진 수 까지의 모든 소수를 구하기 위해서는 에라토스테네스의 체를 사용합니다.

다시 한번 간단하게 에라토스테네스의 체를 정리하며 마무리 하겠습니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
prime[10000];

for (int i = 2; i < 10000; i++) {
if (prime[i] == false) {
for (int j = i*2; j < 10000; j += i) {
prime[j] = true;
}
}
}

for (int i = 0; i < 10000; i++) {
prime[i] = !prime[i];
}

참고 : 에라토스테네스의 체 - 위키백과

이진 탐색 (Binary Search)

주어진 배열에서 특정한 요소(target) 을 찾아내는 상황을 가정해 봅시다. 가장 쉬운 방법은 각각의 배열 요소와 target 값을 같은지 순차적으로 모두 비교하는 것입니다. 만약 배열의 크기가 n이라고 했을때, 이 알고리즘의 시간복잡도를 Big-O notation을 이용해 나타낸다면 **O(n)**이 될 것 입니다.
그러나 더 효율적이고 빠르게 target 을 찾아내는 방법이 있습니다. 이 방법은 매 탐색마다 target을 찾기위한 배열의 크기를 절반으로 줄여가면서 탐색을 하는 것입니다. 정확히는 기존의 배열은 유지하지만 탐색해야하는 범위를 계속 절반으로 줄이는 것입니다. 이런식으로 탐색하는 방법이 바로 이진 탐색(Binary Search) 알고리즘입니다. 다만 이진 탐색 알고리즘은 순차 탐색과는 달리 배열의 데이터들이 정렬된 상태에서만 적용할 수 있다는 특징이 있습니다. 정렬이 되지 않은 데이터는 이진 탐색을 적용할 수 없습니다.
쉽게 생각해보면 만약 배열의 요소들이 정렬되지 않은 상태라면, 매 탐색마다 target을 찾기 위해 검사해야하는 배열의 범위를 줄이지 못할 것입니다. (정렬되어 있다 라는 기준이 없기 때문에 탐색해야 하는 배열의 시작과 끝 범위를 정할 수 있는 근거가 없기 때문입니다.)

이진 탐색 절차

크기가 n인 리스트 data에서 target 이라는 특정 요소를 찾아낸다고 가정했을 때, 이진 탐색의 절차는 다음과 같습니다. (리스트는 오름차순으로 정렬되어 있습니다.)

  1. begin = 0, end = n − 1 로 초기화 합니다.
  2. mid 는 (begin + end) 를 2 로 나눈 몫으로 결정합니다.
  3. data[mid] 와 target 이 서로 같으면 목적을 달성했으므로 탐색을 종료합니다.
  4. 만약 target < data[mid] 이면 end = mid-1 로 업데이트 한 후, 2번으로 돌아갑니다. 만약 target > data[mid] 라면 begin = mid+1 로 업데이트 한 후, 2번으로 돌아갑니다.

위 과정에서 begin, end, mid는 리스트의 index를 의미합니다. 또한 target과 data[mid]의 대소관계에 따라 다음 탐색 방향을 선택하게 됩니다. 이 과정은 리스트의 요소가 오름차순인지 내림차순인지에 따라 다르게 구현됩니다.

먼저 코드를 작성하기 전에 그림과 함께 과정을 살펴보겠습니다.


위의 리스트에서 15라는 데이터를 탐색하겠습니다. 먼저 첫번째 과정으로 데이터 집합의 중앙 요소를 선택합니다.


두번째 과정으로는 중앙 요소의 값과 찾으려는 값을 서로 비교하게 되는데, 만약 찾으려는 값이 중앙 요소의 값보다 작다면 중앙 요소의 왼편에서 중앙 요소를 다시 선택하고, 반대로 찾으려는 값이 중앙 요소의 값보다 크다면 오른편에서 중앙 요소를 다시 선택합니다. 그리고 다시 이 과정을 반복하는 것입니다. 위의 경우에는 찾으려는 값인 15가 중앙값 9보다 크기 때문에 중앙값 왼편은 탐색할 필요가 없습니다. 따라서 중앙 요소의 오른편에서 다시 중앙값을 선택합니다.


이제는 중앙값이 17입니다. 중앙값이 찾고자 하는 값인 15보다 크기 때문에 중앙값 왼편에서 다시 테이터를 탐색합니다.


왼편에서 중앙값을 택합니다. 이제 중앙값과 찾고자 하는 데이터가 같기 때문에 탐색을 종료합니다.

이진 탐색 성능

이진 탐색은 한번 비교를 할때마다, 탐색의 범위가 반으로 줄어듭니다. 데이터 리스트의 크기를 n이라 하고, 반복 횟수를 k라고 한다면 다음과 같은 수식이 만들어 집니다.

위는 데이터 리스트의 크기인 n을 2로 몇번을 나누어야 1이 되는지 말해주는 식으로, 위 수식을 정리하면 k=log2(n)이 되는 것입니다. 위 수식을 통해 데이터 리스트의 크기가 500만개라면 최대 22회, 1000만개라면 최대 23회의 탐색으로 데이터를 찾아낼 수 있다는 것입니다.

의사 코드 (수도 코드)

먼저 의사 코드를 살펴보겠습니다.

1
2
3
4
5
6
7
8
9
10
11
12
BinarySearch(A[0...N-1], target, begin, end) {
if (begin > end)
return -1 // not found
mid = (begin + end) / 2
if (A[mid] < target)
return BinarySearch(A, target, mid+1, end)
else if (A[mid] > target)
return BinarySearch(A, target, begin, mid-1)
else
return mid // found
}

출처 : 위키백과 - 이진 검색 알고리즘

C++ 코드

위의 의사 코드를 C++ 코드로 다시 작성하면 다음과 같습니다.

1
2
3
4
5
6
7
8
9
10
11
int BinarySearch(int A[], int target, int begin, int end) {
if (begin > end)
return -1;
mid = (begin + end) / 2;
if (A[mid] < target)
return BinarySearch(A, target, mid + 1, end);
else if (A[mid] > target)
return BinarySearch(A, target, begin, mid + 1);
else
return mid;
}

<12100> 2048 (Easy)

문제 : https://www.acmicpc.net/problem/12100

째로탈출2처럼 코드가 깁니다… 째로탈출2와 마찬가지로 2차원 배열을 조작하는 부분에서 코드가 많이 길어지게 되는데 더 간결하게 만들 수 있도록 연습을 해야할 것 같습니다.
구현은 combine_map함수를 통해서 방향에 맞게 같은 숫자를 합쳐주고 move_map함수를 통해 빈공간을 제거하는것을 반복하도록 구현했습니다. Easy의 경우 5회 반복이기 때문에 대부분 시간초과 경우는 없을 것 입니다.
(테스트 케이스가 문제에 1개 밖에 없다보니 힘들었습니다… 테스트 케이스가 부족하신 분들은 문제 게시판에 가시면 더 찾아보실 수 있습니다.)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
#include <iostream>
#include <algorithm>

#define MAP_MAX_SIZE 20
using namespace std;

int map[MAP_MAX_SIZE][MAP_MAX_SIZE];
int N;
int max_dp[6];

void init_map() {
for (int i = 0; i < N; i++) {
for (int j = 0; j < N; j++) {
cin >> map[i][j];
}
}
}

void copy_map(int(*map)[MAP_MAX_SIZE], int(*tmp_map)[MAP_MAX_SIZE]) {
for (int i = 0; i < N; i++) {
for (int j = 0; j < N; j++) {
tmp_map[i][j] = map[i][j];
}
}
}

void recovery_map(int(*map)[MAP_MAX_SIZE], int(*tmp_map)[MAP_MAX_SIZE]) {
for (int i = 0; i < N; i++) {
for (int j = 0; j < N; j++) {
map[i][j] = tmp_map[i][j];
}
}
}

void combine_map(int dir) {
// 상
if (dir == 0) {
for (int c = 0; c < N; c++) {
for (int r = 0; r < N - 1; r++) {
int data1 = map[r][c];

if (data1 == 0) {
continue;
}

for (int k = r + 1; k < N; k++) {
int data2 = map[k][c];

if (data2 == 0) {
continue;
}
else {
if (data1 == data2) {
map[r][c] *= 2;
map[k][c] = 0;
r = k;
}
break;
}
}
}
}
}
// 하
else if (dir == 1) {
for (int c = 0; c < N; c++) {
for (int r = N-1; r > 0; r--) {
int data1 = map[r][c];

if (data1 == 0) {
continue;
}

for (int k = r - 1; k >= 0; k--) {
int data2 = map[k][c];

if (data2 == 0) {
continue;
}
else {
if (data1 == data2) {
map[r][c] *= 2;
map[k][c] = 0;
r = k;
}
break;
}
}
}
}
}
// 좌
else if (dir == 2) {
for (int r = 0; r < N; r++) {
for (int c = 0; c < N - 1; c++) {
int data1 = map[r][c];

if (data1 == 0) {
continue;
}

for (int k = c + 1; k < N; k++) {
int data2 = map[r][k];

if (data2 == 0) {
continue;
}
else {
if (data1 == data2) {
map[r][c] *= 2;
map[r][k] = 0;
c = k;
}
break;
}
}
}
}
}
// 우
else if (dir == 3) {
for (int r = 0; r < N; r++) {
for (int c = N-1; c > 0; c--) {
int data1 = map[r][c];

if (data1 == 0) {
continue;
}

for (int k = c - 1; k >= 0; k--) {
int data2 = map[r][k];

if (data2 == 0) {
continue;
}
else {
if (data1 == data2) {
map[r][c] *= 2;
map[r][k] = 0;
c = k;
}
break;
}
}
}
}
}
}

int move_map(int dir) {
int max_value = 0;

// 상
if (dir == 0) {
for (int c = 0; c < N; c++) {
for (int r = 0; r < N; r++) {
max_value = max(max_value, map[r][c]);

if (map[r][c] == 0 && r != N - 1) {
for (int k = r+1; k < N; k++) {
if (map[k][c] != 0) {
map[r][c] = map[k][c];
map[k][c] = 0;
max_value = max(max_value, map[r][c]);
break;
}
}
}
}
}
}
// 하
else if (dir == 1) {
for (int c = 0; c < N; c++) {
for (int r = N-1; r >= 0; r--) {
max_value = max(max_value, map[r][c]);

if (map[r][c] == 0 && r != 0) {
for (int k = r - 1; k >= 0; k--) {
if (map[k][c] != 0) {
map[r][c] = map[k][c];
map[k][c] = 0;
max_value = max(max_value, map[r][c]);
break;
}
}
}
}
}
}
//좌
else if (dir == 2) {
for (int r = 0; r < N; r++) {
for (int c = 0; c < N; c++) {
max_value = max(max_value, map[r][c]);

if (map[r][c] == 0 && c != N-1) {
for (int k = c + 1; k < N; k++) {
if (map[r][k] != 0) {
map[r][c] = map[r][k];
map[r][k] = 0;
max_value = max(max_value, map[r][c]);
break;
}
}
}
}
}
}
//우
else if (dir == 3) {
for (int r = 0; r < N; r++) {
for (int c = N-1; c >= 0; c--) {
max_value = max(max_value, map[r][c]);

if (map[r][c] == 0 && c != 0) {
for (int k = c - 1; k >= 0; k--) {
if (map[r][k] != 0) {
map[r][c] = map[r][k];
map[r][k] = 0;
max_value = max(max_value, map[r][c]);
break;
}
}
}
}
}
}

return max_value;
}

void dfs(int cnt, int max_value) {
max_dp[cnt] = max(max_dp[cnt], max_value);

if (cnt >= 5) {
return;
}

// 상, 하, 좌, 우
for (int dir = 0; dir < 4; dir++) {
int tmp_map[MAP_MAX_SIZE][MAP_MAX_SIZE];
copy_map(map, tmp_map);

combine_map(dir); // 기울인 방향으로 합치기
int value = move_map(dir); // 빈칸 땡기기 & 현재 최대값 반환
dfs(cnt + 1, value);

recovery_map(map, tmp_map);
}
}

int main() {
ios::sync_with_stdio(false);
cin >> N;

init_map();
dfs(0, 0);

cout << max_dp[5] << '\n';

return 0;
}