20. 최단 경로 : 다익스트라 알고리즘

2021. 11. 18. 00:32파이썬/알고리즘

다익스트라 알고리즘

여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 최단 거리를 각각 계산해주는 알고리즘.

 

1. 시작 노드를 설정한다.

2. 최단 거리 테이블을 초기화 한다.

3. 방문하지 않은 노드로 가서 최단 거리가 가장 짧은 노드를 선택한다..

4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 갱신한다.

5. 3 ~ 4를 반복한다.

 

가장 가까운 노드를 방문하면 해당 노드의 최소 거리 값은 변하지 않는다. (우선 최소 거리의 노드를 방문하기 때문에)

마지막 노드에 대해서는 해당 노드를 거쳐 다른 노드로 가는 경우를 확인할 필요는 없다.

 

간단한 다익스트라 알고리즘 소스코드

import sys

input = sys.stdin.readline
INF = int(1e9)

n, m = map(int,input().split())

start = int(input())

graph = [[] for _ in range(n+1)]

visited = [False] * (n+1)

distance = [INF] * (n+1)

for _ in range(m):
  a, b, c = map(int,input().split())
  graph[a].append((b,c))

def get_smallest_node() :
  min_value = INF
  index  = 0

  for i in range (1, n+1):
    if distance[i] < min_value and not visited[i]:
      min_value = distance[i]
      index = i

  return index

def dijkstra(start) :
  distance[start] = 0
  visited[start] = True

  for i in graph[start]:
    distance[i[0]] = i[1]

  for i in range(n-1):
    now = get_smallest_node()
    visited[now] = True

    for j in graph[now] :
      cost = distance[now] + j[1]
      if cost < distance[j[0]]:
        distance[j[0]] = cost

dijkstra(start)

for i in range(1, n + 1):
  if distance[i] == INF :
    print("INFINITY")
  else:
    print(distance[i])

개선된 다익스트라 알고리즘

 

위 다익스트라 알고리즘은 시간복잡도가 O(V**2)이다. 최단 거리가 가장 짧은 노드를 매번 선형 탐색해야 하고, 현재 노드와 연결된 노드를 매번 일일이 확인하기 때문이다.

 

하지만 힙 자료구조를 이용하여 개선된 다익스트라 알고리즘을 구현하면, 최악의 경우에도 시간 복잡도가 O(ElogV)를 보장하여 해결할 수 있다.

힙 자료구조를 이용하게 되면 특정 노드까지의 최단 거리에 대한 정보를 힙에 담아서 처리하므로 더욱 빠르다.

 

힙 자료구조는 우선순위 큐를 구현하기 위하여 사용하는 자료구조 중 하나다. 우선순위 큐는 우선순위가 가장 높은 데이터를 가장 먼저 삭제한다는 점이 특징이다.

(스택 : 가장 나중에 삽입된 데이터, 큐 : 가장 먼저 삽입된 데이터, 우선순위 큐 : 가장 우선순위가 높은 데이터)

 

우선순위 큐는 데이터를 우선순위에 따라 처리하고 싶을 때 사용한다. 여러 개의 물건 데이터를 자료구조에 넣었다가 가치가 높은 물건 데이터부터 꺼내서 확인해야 하는 경우는 우선순위 큐 자료구조를 이용하면 효과적이다.

파이썬에서는 우선순위 큐가 필요할 때 PriorituQueue 혹은 heapq를 사용할 수 있다.

일반적으로 heapq가 더 빠르게 동작하기 때문에 heapq를 권장.

 

우선순위의 값을 표현할 때는 일반적으로 정수형 자료형의 변수가 사용된다. 예를 들어 물건정보가 있고, 물건 정보는 물건의 가치와 물건의 무게로만 구성된다고 가정해보자. 그러면 모든 물건 데이터를 묶어서 우선순위 큐 자료구조에 넣을 수 있다. 우선순위 큐에서 물건을 꺼내게 되면 항상 가치가 높은 물건이 먼저 나오게 된다.

 

대부분 첫 번째 원소를 기준으로 우선순위를 설정한다. 또한 내부적으로 최소 힙 혹은 최대 힙을 이용한다.

최소힙을 이용하는 경우 값이 낮은 데이터가 먼저 삭제, 최대 힙을 이용하는 경우 값이 큰 데이터가 먼저 삭제 된다.

파이썬에서는 기본적으로 최소 힙 구조를 이용하는데 다익스트라 최단 경로 알고리즘에서는 비용이 적은 노드를 우선하여 방문하므로 그대로 사용하면 적합하다.

 

최소힙을 최대 힙처럼 사용하기 위해서 우선순위에 해당하는 값에 음수 부호를 붙여서 넣었다가. 꺼낼 때 다시 음스 부호를 붙여서 원래의 값으로 돌리는 방식을 사용할 수 있다.

 

삽입시간, 삭제시간 모두 O(logN) 이 것을 N번 반복하면 O(NlogN)이다.

 

우선 순위 큐를 적용하여도 다익스트라 알고리즘이 동작하는 기본 원리는 동일하다. 최단 거리를 저장하기 위한 1차원리스트는 아까와 같이 그대로 이용하고, 현재 가장 가까운 노드를 저장하기 위한 목적으로만 우선순위 큐를 추가로 이용한다.

 

앞의 코드와 비교했을 때 get_smallest_node()라는 함수를 작성할 필요가 없다는 특징이 있다. '최단 거리가 가장 짧은 노드'를 선택하는 과정은 다익스트라 최단 경로 함수 안에서 우선순위 큐를 이용하는 방식으로 대체할 수 있기 때문이다.

 

import heapq
import sys

input = sys.stdin.readline
INF = int(1e9)

n, m  = map(int,input().split())

start = int(input())

graph = [[] for i in range(n+1)]

distance = [INF] * (n+1)

for i in range(m):
  a, b, c = map(int,input().split())
  graph[a].append((b,c))

def dijkstra(start) :
  q = []
  heapq.heappush(q,(0, start))
  distance[start] = 0
  while q:
    dist, now = heapq.heappop(q)
    if distance[now] < dist :
      continue
    for i in graph[now]:
      cost = dist + i[1]
      if cost < distance[i[0]]:
        distance[i[0]] = cost
        heapq.heappush(q,(cost, i[0]))


dijkstra(start)

for i in range(1, n+1):
  print(distance[i])

개선된 다익스트라 알고리즘은 노드의 개수 이상의 횟수로는 반복되지 않는다. 또한 반복 될 때마다 각각 자신과 연결된 edge를 모두 확인한다.

따라서 현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인하는 총횟수는 총 최대 간선의 개수만큼 연산이 수행될 수 잇다.

다익스트라 최단 경로 알고리즘은 우선순위 큐를 이용한다는 점에서 우선순위 큐를 필요로 하는 다른 문제 유형과도 흡사하다는 특징이 있다 그래서 최단 경로를 찾는 문제를 제외하고도 다른 문제에도 두루 적용되는 소스코드 형태라고 볼 수 있다.

 

반응형