본문 바로가기

SQL/SQL 코딩테스트

[mysql] 멸종위기의 대장균 찾기

728x90

문제 설명

대장균들은 일정 주기로 분화하며, 분화를 시작한 개체를 부모 개체, 분화가 되어 나온 개체를 자식 개체라고 합니다.

다음은 실험실에서 배양한 대장균들의 정보를 담은 ECOLI_DATA 테이블입니다. ECOLI_DATA 테이블의 구조는 다음과 같으며, ID, PARENT_ID, SIZE_OF_COLONY, DIFFERENTIATION_DATE, GENOTYPE 은 각각 대장균 개체의 ID, 부모 개체의 ID, 개체의 크기, 분화되어 나온 날짜, 개체의 형질을 나타냅니다.

Column name Type Nullable

ID INTEGER FALSE
PARENT_ID INTEGER TRUE
SIZE_OF_COLONY INTEGER FALSE
DIFFERENTIATION_DATE DATE FALSE
GENOTYPE INTEGER FALSE

최초의 대장균 개체의 PARENT_ID 는 NULL 값입니다.


문제

각 세대별 자식이 없는 개체의 수(COUNT)와 세대(GENERATION)를 출력하는 SQL문을 작성해주세요. 이때 결과는 세대에 대해 오름차순 정렬해주세요. 단, 모든 세대에는 자식이 없는 개체가 적어도 1개체는 존재합니다.


예시

예를 들어 ECOLI_DATA 테이블이 다음과 같다면

ID PARENT_ID SIZE_OF_COLONY DIFFERENTIATION_DATE GENOTYPE

1 NULL 10 2019/01/01 5
2 NULL 2 2019/01/01 3
3 2 100 2020/01/01 4
4 2 16 2020/01/01 4
5 2 17 2020/01/01 6
6 4 101 2021/01/01 22
7 4 101 2022/01/01 23
8 6 1 2022/01/01 27

각 세대별 대장균의 ID는 다음과 같습니다.

1 세대 : ID 1, ID 2

2 세대 : ID 3, ID 4, ID 5

3 세대 : ID 6, ID 7

4 세대 : ID 8

이 때 각 세대별 자식이 없는 대장균의 ID는 다음과 같습니다.

1 세대 : ID 1

2 세대 : ID 3, ID 5

3 세대 : ID 7

4 세대 : ID 8

따라서 결과를 세대에 대해 오름차순 정렬하면 다음과 같아야 합니다.

COUNT GENERATION

1 1
2 2
1 3
1 4

 

with recursive e_chain as
(
select id, parent_id, 1 as generation
from ECOLI_DATA 
where parent_id is null
    
    union all
    select ed.id, ed.parent_id, ec.generation + 1 as generation
    from ECOLI_DATA ed join e_chain ec on ed.parent_id = ec.id
)

select count(ec2.id) as count, generation
from e_chain ec2  left join ecoli_data ed2 on ec2.id = ed2.parent_id
where ed2.id is null
group by generation
order by generation

 

먼저 재귀함수를 이용해서 generation 세대를 만들어준다.

 

with recursive e_chain as
(
select id, parent_id, 1 as generation  (비반복 쿼리)
from ECOLI_DATA 
where parent_id is null
    
    union all
    select ed.id, ed.parent_id, ec.generation + 1 as generation (반복쿼리)
    from ECOLI_DATA ed join e_chain ec on ed.parent_id = ec.id
)

 

비반복 되는 최상위계층 하나 지정해놓고 쿼리가 반복 될 때 마다 + 1 씩 되게 했음

그럼 현재 id, parent_id, generation 생성 완료

 

select count(ec2.id) as count, generation
from e_chain ec2  left join ecoli_data ed2 on ec2.id = ed2.parent_id
where ed2.id is null
group by generation
order by generation

 

앞 쿼리에서 id 와 뒷쿼리에서의 parent_id를 left join 하면 자삭이 없는 id는 null로 찍히게 됨

뒷쿼리.id is null로 조건 걸어주면 끝

 

 

728x90