프로그래머스 순위검색 파이썬 문제풀이

    문제 설명

    [본 문제는 정확성과 효율성 테스트 각각 점수가 있는 문제입니다.]

    카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.

    • 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
    • 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
    • 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
    • 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.

    인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.
    예를 들어, 개발팀에서 궁금해하는 문의사항은 다음과 같은 형태가 될 수 있습니다.
    코딩테스트에 java로 참여했으며, backend 직군을 선택했고, junior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 50점 이상 받은 지원자는 몇 명인가?

    물론 이 외에도 각 개발팀의 상황에 따라 아래와 같이 다양한 형태의 문의가 있을 수 있습니다.

    • 코딩테스트에 python으로 참여했으며, frontend 직군을 선택했고, senior 경력이면서, 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
    • 코딩테스트에 cpp로 참여했으며, senior 경력이면서, 소울푸드로 pizza를 선택한 사람 중 코딩테스트 점수를 100점 이상 받은 사람은 모두 몇 명인가?
    • backend 직군을 선택했고, senior 경력이면서 코딩테스트 점수를 200점 이상 받은 사람은 모두 몇 명인가?
    • 소울푸드로 chicken을 선택한 사람 중 코딩테스트 점수를 250점 이상 받은 사람은 모두 몇 명인가?
    • 코딩테스트 점수를 150점 이상 받은 사람은 모두 몇 명인가?

    즉, 개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.

    * [조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?


    [문제]

    지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때,
    각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return 하도록 solution 함수를 완성해 주세요.

    [제한사항]

    • info 배열의 크기는 1 이상 50,000 이하입니다.
    • info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
      • 개발언어는 cpp, java, python 중 하나입니다.
      • 직군은 backend, frontend 중 하나입니다.
      • 경력은 junior, senior 중 하나입니다.
      • 소울푸드는 chicken, pizza 중 하나입니다.
      • 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
      • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
    • query 배열의 크기는 1 이상 100,000 이하입니다.
    • query의 각 문자열은 "[조건] X" 형식입니다.
      • [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
      • 언어는 cpp, java, python, - 중 하나입니다.
      • 직군은 backend, frontend, - 중 하나입니다.
      • 경력은 junior, senior, - 중 하나입니다.
      • 소울푸드는 chicken, pizza, - 중 하나입니다.
      • '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
      • X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인 지를 의미합니다.
      • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
      • 예를 들면, "cpp and - and senior and pizza 500"은 "cpp로 코딩테스트를 봤으며, 경력은 senior 이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 500점 이상 받은 사람은 모두 몇 명인가?"를 의미합니다.

    [입출력 예]

    infoqueryresult

    ["java backend junior pizza 150","python frontend senior chicken 210","python frontend senior chicken 150","cpp backend senior pizza 260","java backend junior chicken 80","python backend senior chicken 50"] ["java and backend and junior and pizza 100","python and frontend and senior and chicken 200","cpp and - and senior and pizza 250","- and backend and senior and - 150","- and - and - and chicken 100","- and - and - and - 150"] [1,1,1,1,2,4]

    입출력 예에 대한 설명

    지원자 정보를 표로 나타내면 다음과 같습니다.

    언어직군경력소울 푸드점수

    java backend junior pizza 150
    python frontend senior chicken 210
    python frontend senior chicken 150
    cpp backend senior pizza 260
    java backend junior chicken 80
    python backend senior chicken 50
    • "java and backend and junior and pizza 100" : java로 코딩테스트를 봤으며, backend 직군을 선택했고 junior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 100점 이상 받은 지원자는 1명 입니다.
    • "python and frontend and senior and chicken 200" : python으로 코딩테스트를 봤으며, frontend 직군을 선택했고, senior 경력이면서 소울 푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 200점 이상 받은 지원자는 1명 입니다.
    • "cpp and - and senior and pizza 250" : cpp로 코딩테스트를 봤으며, senior 경력이면서 소울푸드로 pizza를 선택한 지원자 중 코딩테스트 점수를 250점 이상 받은 지원자는 1명 입니다.
    • "- and backend and senior and - 150" : backend 직군을 선택했고, senior 경력인 지원자 중 코딩테스트 점수를 150점 이상 받은 지원자는 1명 입니다.
    • "- and - and - and chicken 100" : 소울푸드로 chicken을 선택한 지원자 중 코딩테스트 점수를 100점 이상을 받은 지원자는 2명 입니다.
    • "- and - and - and - 150" : 코딩테스트 점수를 150점 이상 받은 지원자는 4명 입니다.

     

    문제접근1. 단순 조건문 접근

    처음 문제를 접근했을 때는 단순 조건문으로 접근했다. 당연하게도 정확도는 패스했지만, 효율성에서 4개의 Test Case에서 전부 시간초과를 확인했다. 따라서, 단순 조건문으로는 해당 문제를 풀 수 없는 것을 확인했다.


    문제접근2. Lower Bound로 접근

    단순한 아이디어에서 시작을 했다. Info에 대한 전체 정보를 점수에 대해 오름차순으로 Sorting 한 후, 해당 점수보다 높은 구간을 Lower Bound로 Binary Search로 Index를 찾은 후, 그 Index보다 뒷쪽에 있는 데이터들에서만 값을 찾으면 어떨까?라는 생각이었다. 

    Binary Search는 한 Index를 찾는데 O(logN)이기 때문에 확실히 시간은 줄었다. 정확도를 판별하는 모든 Test Case에서 시간이 대략 절반 정도 줄어드는 것을 확인했다. 그렇지만 효율성 4개 Test Case는 모두 Fail 되었다.

    파이썬, Lower Bound 및 Upper Bound 구현


    문제접근3. Lower Bound + Dictionary 접근

    접근2에서 경우를 나누어서 찾아보아야 할 영역을 최소화 할 경우, 시간이 비약적으로 감소하는 것을 확인했다. 그렇다면 효율성 해결을 위해서 내가 해야할 일은 찾아보아야 할 영역을 잘게 쪼개서 최소화 해두는 것이었다. 영역을 더 쪼개기 위해서 딕셔너리를 사용하기로 했다.

    딕셔너리를 선언한 후, 각 경우의 수를 가지는 딕셔너리를 추가로 선언했다. 예를 들어 java, python, cpp, javabackend, javapizz라는 이름을 가지는 딕셔너리에 아무것도 없는 list를 추가 선언했다.

    초기화가 완료된 다음에는 Info에 들어오는 정보를 각 리스트들에 빠짐없이 집어넣었다. 예를 들어 첫번째 예시에서 java, javabackend, javabackendjunior, javabackendjuniorpizza, javapizza, 등등의 딕셔너리에 '100'이라는 값을 넣었다. 이렇게 모든 경우의 수를 딕셔너리 안에 리스트로 선언하고, 그 때의 점수 값을 넣었다.

    넣은 후에는 각 딕셔너리를 점수의 오름차순으로 정렬했다. 이는 이진 검색을 통해 Lower Boundary를 찾기 위함이다. Lower Boundary를 찾은 후에는 간단하다. Lower Boundary 윗쪽의 값들은 모두 조건을 만족하기 때문에 딕셔너리 내의 리스트의 길이에서 현재 Index를 빼주면 된다. 

    코드는 아래와 같다. 

    #Lower Boundary 찾는 함수. 이진 검색으로 접근
    def binary_search(value,left,right,my_list) :
        while left < right :
            mid = (left + right) // 2
            if int(my_list[mid]) < value :
                left = mid + 1
            else :
                right = mid
        mid = (left + right) // 2
        if my_list[mid] >= value :
            return mid
        else :
            return -1
    
    #각 경우의 수에 대한 Dictionary에 빈 List를 선언해주며 초기화 한다.
    def init(info_dict) :
        for abc in ['cpp', 'java', 'python']:
            for bcd in ['backend', 'frontend']:
                for efg in ['junior', 'senior']:
                    for ggg in ['chicken', 'pizza']:
                        info_dict[abc] = []
                        info_dict[bcd] = []
                        info_dict[efg] = []
                        info_dict[ggg] = []
                        info_dict[abc + bcd] = []
                        info_dict[abc + efg] = []
                        info_dict[abc + ggg] = []
                        info_dict[bcd + efg] = []
                        info_dict[bcd + ggg] = []
                        info_dict[efg + ggg] = []
                        info_dict[abc + bcd + efg] = []
                        info_dict[abc + bcd + ggg] = []
                        info_dict[abc + efg + ggg] = []
                        info_dict[bcd + efg + ggg] = []
                        info_dict[abc + bcd + efg + ggg] = []
        return info_dict
    
    #Info에 들어있는 정보를 각 경우의 수 Dictionary에 넣어준다.
    def init2(info,info_dict) :
        for k in info :
            a,b,c,d,e = k.split()
            e = int(e)
            temp = [a,b,c,d]
            info_dict['-'].append(e)
            for i in range(len(temp)) :
                info_dict[temp[i]].append(e)
                for k in range(i+1,len(temp)) :
                    info_dict[temp[i] + temp[k]].append(e)
                    for j in range(k+1, len(temp)) :
                        info_dict[temp[i] + temp[k] + temp[j]].append(e)
                        for p in range(j+1, len(temp)) :
                            info_dict[temp[i] + temp[k] + temp[j] + temp[p]].append(e)
        return info_dict
    
    #각 Ditionary에 들어있는 점수를 오름차순으로 정렬해준다.
    def sort_fun(info_dict) :
        for k in info_dict :
            info_dict[k] = sorted(info_dict[k])
        return info_dict
    
    
    def solution(info, query):
        info_dict = {}
        init(info_dict)
        #초기화 과정에서 '-'에 대한 dict는 선언되지 않으니, 따로 만들어준다.
        
        info_dict['-'] = []
        init2(info,info_dict)
        sort_fun(info_dict)
    	answer = []
    
        for k in query :
            a,b,c,d = k.split(' and ')
            d,e = d.split()
    
    		#temp2는 현재 검색 조건을 나타냄.
            temp2 = ''
            if a != '-' :
                temp2 += a
            if b != '-' :
                temp2 += b
            if c != '-' :
                temp2 += c
            if d != '-' :
                temp2 += d
            if temp2 == '' :
                temp2 = '-'
    
    		#temp2의 딕셔너리의 리스트 길이가 0이면, 만족하는 값이 없다.
            if len(info_dict[temp2]) == 0 :
                answer.append(0)
                continue
    		
            #딕셔너리 리스트 길이가 1이상이라면, Lower Boundary Index를 찾는다.
            index = binary_search(int(e),0,len(info_dict[temp2])-1,info_dict[temp2])
            #만약 Index가 1이면, Lower Boundary가 구간 내에 존재하지 않는다는 것.
            if index == -1 :
                answer.append(0)
                continue
            #Index가 존재한다면, 딕셔너리에 있는 리스트의 전체 길이에서 Index를 뺀 값을 추가한다.
            answer.append(len(info_dict[temp2]) - index )
        return answer

    댓글

    Designed by JB FACTORY