일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 누적합
- 16985
- 다익스트라
- Naver Cloud
- BOJ
- 최소신장트리
- golang
- 세그먼트 트리
- dfs
- NCP
- SWEA
- redis
- 17503
- 시뮬레이션
- 11659
- 이분 탐색
- 점수 따먹기
- 구간합
- 21921
- 구현
- 민준이와 마산 그리고 건우
- mst
- 맥주 축제
- gorilla/mux
- 정렬
- DP
- 백준
- mongodb
- c++
- 크루스칼
- Today
- Total
Gi-Log
백준(BOJ) 20542 받아쓰기 C++ 풀이 본문
문제 링크: https://www.acmicpc.net/problem/20542
문제 풀이에 사용된 알고리즘: DP, 편집 거리, Levenshtein Distance
(정답 문자열)과 (내가 답안으로 작성한 문자열)이 같아지도록 얼마나 수정(편집, edit)을 진행해야를 수치화하는 문제이다.
Levenshtein Distance, 편집거리라고 하는 알고리즘을 적용해서 쉽게 풀 수 있는 문제이다.
동적 프로그래밍(DP)로 구현할 수 있다.
편집 거리에 대한 이론적인 내용은 다음의 블로그에서 참조하였다.
https://madplay.github.io/post/levenshtein-distance-edit-distance
이 문제를 풀 때 몇가지 유의할 점은 다음과 같다.
수정 중 변환 비용은 두 문자가 동일한지 아닌지에 의해 결정되는데, 답안의 i는 정답의 i, j, l과 동일한 문자로 취급하고, 답안의 v는 정답의 v, w와 동일한 문자로 취급한다는 점이다.
이런 이유로 char a와 char b가 있을 때 단순히 ==으로 비교를 진행하지 않고, 별도의 함수를 구현하였다.
그리고 정답과 답안의 길이인 m과 n이 1~100만의 범위를 갖는데, dp 배열을 만들기 위해서 d[1000000][1000000]을 선언하면 용량 초과가 발생한다.
하지만 n * m은 1천만을 넘지 않는다는 조건이 있으므로, dp 배열을 동적으로 생성할 수 있다면 크게 문제가 되지 않음을 알 수 있다.
그렇다고 어려운 동적할당으로 배열을 선언하는 것보다는 vector와 resize를 이용해서 구현하였다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
|
/* BOJ 20542 받아쓰기 */
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
#include <queue>
#include <vector>
#include <algorithm>
#include <cstring>
#include <string>
#include <string.h>
#define endl '\n'
using namespace std;
typedef long long ll;
int n, m;
string source, target;
vector<vector<int>> dp;
bool is_equal(char source_c, char target_c)
{
if (source_c == 'i')
{
if (target_c == 'i' || target_c == 'j' || target_c == 'l')
return true;
else return false;
}
else if (source_c == 'v')
{
if (target_c == 'v' || target_c == 'w')
return true;
else
return false;
}
else
return source_c == target_c;
}
int levenshtein_distance(string source, string target)
{
for (int i = 0; i < target.length(); i++)
{
for (int j = 0; j < source.length(); j++)
{
if (i == 0)
dp[i][j] = j;
else if (j == 0)
dp[i][j] = i;
else
{
int replace_cost = 0;
if (!is_equal(source[j], target[i]))
replace_cost = 1;
dp[i][j] = min(dp[i - 1][j] + 1, min(dp[i][j - 1] + 1, dp[i - 1][j - 1] + replace_cost));
}
}
}
return dp[m][n];
}
int main()
{
ios_base::sync_with_stdio(0);
cin.tie(0);
cout.tie(0);
freopen("input.txt", "r", stdin);
cin >> n >> m;
cin >> source >> target;
source = " " + source, target = " " + target;
dp.resize(m + 1);
for (int i = 0; i < m + 1; i++)
dp[i].resize(n + 1);
cout << levenshtein_distance(source, target) << endl;
return 0;
}
|
cs |
'알고리즘 BOJ' 카테고리의 다른 글
백준(BOJ) 11399 ATM C++ 풀이 (0) | 2021.07.11 |
---|---|
백준(BOJ) 13911 집 구하기 C++ 풀이 (0) | 2021.07.10 |
백준(BOJ) 1654 랜선 자르기 C++ 풀이 (0) | 2021.06.29 |
백준(BOJ) 14499 주사위 굴리기 C++ 풀이 (0) | 2021.06.29 |
백준(BOJ) 1182 부분 수열의 합 C++ 풀이 (0) | 2021.06.29 |