OTT 등장에 따른 K-DRAMA의 변화 | 코드스테이츠 PMB 14기
최근 충격적인 기사를 봤다. 국내 OTT 서비스 웨이브 오리지널 연애 예능 '잠만 자는 사이' 프로그램에 대한 내용으로 MZ세대를 겨냥한 프로그램이라고 한다. 티저라서 자극적인 것일수도 있지만 프로그램 설명부터 경악스럽다. (MZ세대는 도대체 어떤 삶을 살고 있는건지 다소 걱정스럽다..)
👇👇 관련 내용이 궁금하다면? 👇👇
돌싱글즈, 메리퀴어, 남의 연애 등 과거엔 절대 방영불가였을 연애 프로그램들이 줄줄이 나오고 있다. 예능 뿐 아니라 드라마의 수위도 점점 올라가고 있다. 문득 드라마를 더 이상 정규 방송이 아닌 OTT 서비스를 이용하는 비율이 커짐에 따라 제작의 자유도가 높아져서 자극적인 콘텐츠들이 쏟아져 나오는 것이 아닌지 궁금증이 생겼다. 그래서 이번 데이터 시각화 과제로 Kaggle에서 한국 드라마 관련 데이터를 찾아보았다!
1단계. 가설 세우기
- 정규 방송이 아닌 OTT 서비스를 통해 드라마를 소비하는 비중이 커짐에 따라 최근들어 한국 드라마의 콘텐츠 등급 중 '18세 이상' 등급 드라마의 비율이 높아졌을 것이다.
- 첫번째 가설이 성립되기 위해 2019년 이후 방영 드라마 중 OTT에서만 방영되는 드라마의 비율이 동시 방영 중인 드라마의 수보다 클 것이다.
* 정규 방송 중인 드라마는 모두 OTT 서비스에서 동시방영 중이다. - OTT 서비스로 드라마 시청 채널이 바뀌며 수위나 소재에 대한 제한이 줄어들어 과거에 비해 드라마의 장르가 더 다양해졌을 것이다.
2단계. 데이터 시각화 (내 가설이 맞았을까?)
Kaggle에서 원하는 데이터의 CSV 파일을 다운로드 받았다. 데이터 파일을 열었는데 온통 글자라 혼란스러웠지만 엑셀 파일 또는 Google BigQuery로 열어보니 표로 잘 정리되어 보인다.😮💨
나는 다양한 데이터 시각화 툴인 Data Studio와 연동되는 Google BigQuery를 사용하여 데이터를 추출하였다.
(다운로드 받았던 CSV 파일을 테이블로 등록하는 과정에서 문제가 있었는데 빈 셀들을 모두 삭제해주니 제대로 테이블이 형성되었다.)
인사이트를 얻기엔 너무 방대한 데이터이므로 한 눈에 알아보기 쉽도록 해당 데이터를 시각화하였다.
1. 정규 방송이 아닌 OTT 서비스를 통해 드라마를 소비하는 비중이 커짐에 따라 최근들어 한국 드라마의 콘텐츠 등급 중 '18세 이상' 등급 드라마의 비율이 높아졌을 것이다.
- 2018년 이후 '18세 이상' 등급의 드라마의 갯수가 늘어나긴 했지만 유의미한 결과라고 하기엔 다소 부족해 보인다. 그럼에도 아래 그래프를 통해 2018년 이후 ‘18세 이상' 등급의 드라마가 지속적으로 방영되었다는 점은 눈여겨 볼만한 데이터다. 2003년은 청소년 시청 가능한 드라마가 있었으나 요즘 드라마는 대부분 '15세 이상' 시청 가능으로 바뀐 것도 꽤 의미있는 결과다.
모든 드라마 리스트가 포함된 데이터가 아니었으며, 본격적으로 OTT 서비스들의 오리지널 콘텐츠 싸움이 시작된 2021~2022년 데이터가 포함되어 있지 않아 다소 불분명한 결과가 나오지 않았을까 한다.
2. 첫번째 가설이 성립되기 위해 2019년 이후 방영 드라마 중 OTT에서만 방영되는 드라마의 비율이 동시 방영 중인 드라마의 수보다 클 것이다. (정규 방송 중인 드라마는 모두 OTT 서비스에서 동시방영 중이다.)
- 아직까진 방송사와 OTT 서비스에서 동시방영 중인 드라마가 주를 이루고 있으므로 두번째 가설은 틀렸다. 다만 Netflix 오리지널 드라마를 뜻하는 보라색 항목이 2019년에 비해 2020년에는 증가했다는 점에서 매년 증가할 것으로 추측할 수 있을 듯 하다.
아쉬운 점은 모든 한국 드라마의 리스트가 담긴 데이터 세트가 아니며 왓챠, 웨이브, 티빙과 같은 국내 OTT 서비스는 포함하고 있지 않아 제대로 된 인사이트를 얻기엔 역부족이다.
3. OTT 서비스로 드라마 시청 채널이 바뀌며 수위나 소재에 대한 제한이 줄어들어 과거에 비해 드라마의 장르가 더 다양해졌을 것이다.
- 모든 데이터에 장르가 표기되어있었는데 그래프화하니 결과가 누락되었다. 아래 결과만 놓고 본다면 2020년 이후로 장르가 다양해져서 그래프의 색이 다채롭게 표현되었으므로 3번째 가설은 어느정도 맞아 떨어진다고 생각한다! (왜 누락된 데이터가 있는지는 추가적으로 알아봐야겠다🥲)
과제를 마치며.
Data Studio로 원하는 형태의 그래프를 만드는 것이 아직은 어렵다. 중간에 그냥 엑셀로 작업할까 하다가 낑낑거리며 성공하긴 했다. 단순한 그래프는 뚝딱 만들어지는데 비해 복잡한 형태의 그래프는 그래프화 하는 데 너무 많은 시간이 걸렸다😥 중간중간 누락된 데이터 값으로 인해 결과에 신뢰가 다소 떨어진다는 점이 마음에 걸리는데, 이 부분은 툴을 조금 더 다뤄보며 문제를 해결해야 할 듯하다!
다양한 그래프를 활용하고 싶었는데 내가 세운 3가지 가설이 모두 막대그래프로 표현하기 좋은 가설이었다는게 조금 아쉽다.