본문 바로가기

데이터엔지니어링

[1주차] 자료구조 / 알고리즘 (5)

🙂 Heap

🍦 프로그래머스 > 더 맵게

문제 설명

매운 것을 좋아하는 Leo는 모든 음식의 스코빌 지수를 K 이상으로 만들고 싶습니다. 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 Leo는 스코빌 지수가 가장 낮은 두 개의 음식을 아래와 같이 특별한 방법으로 섞어 새로운 음식을 만듭니다.

 

섞은 음식의 스코빌 지수 = 가장 맵지 않은 음식의 스코빌 지수 + (두 번째로 맵지 않은 음식의 스코빌 지수 * 2)

 

Leo는 모든 음식의 스코빌 지수가 K 이상이 될 때까지 반복하여 섞습니다.
Leo가 가진 음식의 스코빌 지수를 담은 배열 scoville과 원하는 스코빌 지수 K가 주어질 때, 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 섞어야 하는 최소 횟수를 return 하도록 solution 함수를 작성해주세요.

제한사항

  • scoville의 길이는 2 이상 1,000,000 이하입니다.
  • K는 0 이상 1,000,000,000 이하입니다.
  • scoville의 원소는 각각 0 이상 1,000,000 이하입니다.
  • 모든 음식의 스코빌 지수를 K 이상으로 만들 수 없는 경우에는 -1을 return 합니다.

입출력 예

scoville k return
[1, 2, 3, 9, 10, 12] 7 2

 

입출력 예 설명

  1. 스코빌 지수가 1인 음식과 2인 음식을 섞으면 음식의 스코빌 지수가 아래와 같이 됩니다.
    새로운 음식의 스코빌 지수 = 1 + (2 * 2) = 5
    가진 음식의 스코빌 지수 = [5, 3, 9, 10, 12]
  2. 스코빌 지수가 3인 음식과 5인 음식을 섞으면 음식의 스코빌 지수가 아래와 같이 됩니다.
    새로운 음식의 스코빌 지수 = 3 + (5 * 2) = 13
    가진 음식의 스코빌 지수 = [13, 9, 10, 12]

🤞 문제 풀이

최소 힙을 생각할 수 있음.

힙 구성 (heapify) - 삽입 (insert) - 삭제 (remove)

 

python 에서 힙 적용

import heapq
heapq.heapify(L)	# 리스트L로부터 min heap 구성
m = heapq.heappop(L)	# min heap L에서 최소값 삭제 및 반환
heapq.heappush(L, x)	# min heap L에 원소 x 삽입
heapq.heappush(L, -x)	# python에서는 min heap을 제공하지 않기에 부호를 바꾼 값 push로 구현
import heapq

def solution(scoville, K):
    answer = 0
    heapq.heapify(scoville)
    while True:
        min1 = heapq.heappop(scoville)
        if min1 >= K:
            break
        if len(scoville) == 0:
            answer = -1
            break
        min2 = heapq.heappop(scoville)
        heapq.heappush(scoville, min1 + 2 * min2)
        answer += 1
    return answer

복잡도: O(NlogN)


🙂 동적계획법 (DP: Dynamic Programming)

🍦 프로그래머스 > N으로 표현

문제 설명

아래와 같이 5와 사칙연산만으로 12를 표현할 수 있습니다.

12 = 5 + 5 + (5 / 5) + (5 / 5)
12 = 55 / 5 + 5 / 5
12 = (55 + 5) / 5

5를 사용한 횟수는 각각 6,5,4 입니다. 그리고 이중 가장 작은 경우는 4입니다.
이처럼 숫자 N과 number가 주어질 때, N과 사칙연산만 사용해서 표현 할 수 있는 방법 중 N 사용횟수의 최솟값을 return 하도록 solution 함수를 작성하세요.

제한사항

  • N은 1 이상 9 이하입니다.
  • number는 1 이상 32,000 이하입니다.
  • 수식에는 괄호와 사칙연산만 가능하며 나누기 연산에서 나머지는 무시합니다.
  • 최솟값이 8보다 크면 -1을 return 합니다.

입출력 예

N number return
5 12 4
2 11 3

 

입출력 예 설명

  1. 예제 #1
    문제에 나온 예와 같습니다.
  2. 예제 #2
    11 = 22 / 2와 같이 2를 3번만 사용하여 표현할 수 있습니다.

🤞 문제 풀이

DP

주어진 최적화 문제를 재귀적인 방식으로 보다 작은 부분 문제로 나누어 부분 문제를 풀어,

이 해를 조합하여 전체 문제의 해답에 이르는 방식.

알고리즘의 진행에 따라 탐색해야할 범위를 동적으로 결정함으로써 탐색 범위를 효과적으로 줄일 수 있음.

 

def solution(N, number):
    s = [set() for _ in range(8)]
    for i, x in enumerate(s, start=1):
        x.add(int(str(N) * i))
    for i in range(len(s)):
        for j in range(i):
            for op1 in s[j]:
                for op2 in s[i - j - 1]:
                    s[i].add(op1 + op2)
                    s[i].add(op1 - op2)
                    s[i].add(op1 * op2)
                    if op2 != 0:
                        s[i].add(op1 // op2)
        if number in s[i]:
            answer = i + 1
            break
    else:
         answer = -1
	return answer

 


🙂 DFS / BFS

🍦 프로그래머스 > 여행경로

문제 설명

주어진 항공권을 모두 이용하여 여행경로를 짜려고 합니다. 항상 "ICN" 공항에서 출발합니다.
항공권 정보가 담긴 2차원 배열 tickets가 매개변수로 주어질 때, 방문하는 공항 경로를 배열에 담아 return 하도록 solution 함수를 작성해주세요.

제한사항

  • 모든 공항은 알파벳 대문자 3글자로 이루어집니다.
  • 주어진 공항 수는 3개 이상 10,000개 이하입니다.
  • tickets의 각 행 [a, b]는 a 공항에서 b 공항으로 가는 항공권이 있다는 의미입니다.
  • 주어진 항공권은 모두 사용해야 합니다.
  • 만일 가능한 경로가 2개 이상일 경우 알파벳 순서가 앞서는 경로를 return 합니다.
  • 모든 도시를 방문할 수 없는 경우는 주어지지 않습니다.

입출력 예

tickets return
[["ICN", "JFK"], ["HND", "IAD"], ["JFK", "HND"]] ["ICN", "JFK", "HND", "IAD"]
[["ICN", "SFO"], ["ICN", "ATL"], ["SFO", "ATL"],
["ATL", "ICN"], ["ATL","SFO"]]
["ICN", "ATL", "ICN", "SFO", "ATL", "SFO"]

입출력 예 설명

예제 #1
["ICN", "JFK", "HND", "IAD"] 순으로 방문할 수 있습니다.

예제 #2
["ICN", "SFO", "ATL", "ICN", "ATL", "SFO"] 순으로 방문할 수도 있지만 ["ICN", "ATL", "ICN", "SFO", "ATL", "SFO"] 가 알파벳 순으로 앞섭니다.

🤞 문제 풀이

DFS: 스택을 이용해서 어느 정점에서 DFS를 하고 있는지를 기억하고 되돌아감.

BFS: 큐를 이용해서 어느 정점에서 BFS를 해야 하는지를 기록하고 진행.

 

한붓 그리기: 문제에서 보장되어 있음.

모든 정점 방문 X, 모든 간선을 거쳐야 함. - 순서 결정

 

def solution(tickets):
    
    answer = []
    nums = len(tickets)
    
    used = [False for _ in range(nums)]
    
    def dfs(name: list, depth, nums):
        
        if depth == nums:
            answer.append(name)
            return

        for i, ticket in enumerate(tickets):
            if name[-1] == tickets[i][0] and not used[i]:
                used[i] = True
                dfs(name+[tickets[i][1]], depth+1, nums)
                used[i] = False
            
    dfs(["ICN"], 0, nums)
    
    answer.sort()
    
    return answer[0]

 

다른 사람의 풀이

def solution(tickets):
    routes = {}
    for t in tickets:
        routes[t[0]] = routes.get(t[0], []) + [t[1]]
    for r in routes:
        routes[r].sort(reverse=True)
        
    stack = ['ICN']
    path = []
    
    while len(stack) > 0:
        top = stack[-1]
        if top not in routes or len(routes[top]) == 0:
            path.append(stack.pop())
        else:
            stack.append(routes[top][-1])
            routes[top] = routes[top][:-1]
    
    return path[::-1]

 


😄 코딩테스트 / 코딩인터뷰

이시윤 강사님

코딩테스트를 왜 하는가?

  • 최소한의 문제 해결 능력을 확인(검증)하기 위해
    • 문제의 분석과 해결 방법 착안 (problem solving) + 코드 구현 (code implementation)

 

엔지니어에게 중요한 능력: 내가 생각한 바를 적확하게 들어나도록 표현하는 능력

 

코딩 문제의 종류

Implementation: 제시된 흐름에 따라 실행하는 코드를 만들도록 요구

Algorithm Comprehension: 문제의 효과적/효율적 해법을 찾아내도록 요구

Competency Test: 특정한 (고난도) 자료구조와 알고리즘을 착안하여 제한시간 내에 문제의 답을 도출하도록 요구

 

코딩 테스트에 대한 대비

  1. 구현 능력 갖추기 (C/C++, Python, Java, JavaScript)
  2. 기본적인 자료구조 이해 (Array, Stack/Queue, Hash/Map, Tree, Graph, ... )
  3. 기초 알고리즘 및 시간/공간 복잡도에 대한 이해 (다익스트라, 크루스칼, ... )
  4. 현실 문제를 해결하기 위한 알고리즘 적용 해법 착안 사고훈련
  5. 제한 시간 내에 오류없이 코드 작성 및 디버깅할 수 있는 능력 훈련

 

자료구조 (ADS: Abstract Data Structure)

  • 자료구조란 무엇인가요?
    • 정보의 표현 방식과 여기에 정의되는 연산들의 집합
  • 자료구조는 왜 알아야 하나요?
    • 문제의 해결에 적용할 수 있는 도구를 갖추어야 하므로
  • 자료구조와 알고리즘의 관계는 무엇인가요?
    • 같은 문제의 해결에 대해서도 어떤 자료구조를 택하는지에 따라 적용할 알고리즘이 달라짐.

요약

문제 -> 추상화 -> 해법 착안 -> 코드 구현