독서 이야기/기술 서적

[서평] 실전 시계열 분석

가마뫼 2021. 12. 26. 21:30

흔히 말하는 교과서의 전형적인 그리고 다소 인위적인 데이터 (설명을 위해서 다소 비약이 들어간 형태의)가 아니라 우리가 실생활에서 접하는 데이터는 크게 볼륨의 확장과 시간에 따른 변화가 큰 특징이라고 할 수 있다. 점점 더 큰 볼륨의 데이터를 수집하고 그것을 전처리하고 최종적으로 프로덕트에 녹이는 작업은 빅데이터라는 용어를 통해서 많이 알려졌지만, 시간이 지남에 따라서 그 때는 맞았지만 지금은 틀리것과 같은 시계열 데이터 처리에 대한 관심은 상대적으로 덜했던 것 같다.

점점 더 사람들의 니즈가 변하고 비지니스가 빠르게 변하는 만큼 시계열 데이터 분석에 대한 중요성은 더 강조해도 지나침이 없고, 해당 책은 시계열 분석에 대한 어느 정도의 이론을 안다는 전제하에 실제 프로그래밍 언어로 어떻게 분석하는 지 설명하는 책이라고 할 수 있다. 이론적인 부분은 아주 간략하게 필요한 만큼 설명하고 우선 코드 우선으로 데이터 분석의 프로세스를 보여주는 점이 개인 취향에 따라서 호불호가 다소 있을 것으로 보인다.

따라서 필요하다면 이론적인 부분은 https://otexts.com/fpp2/ 와 같은 이론서를 통해서 같이 보강하면서 해당 책을 읽는다면 더 좋은 시너지가 날 것으로 보인다. 추가로 아쉬운 점은 Python과 R을 혼용해서 책의 전개를 하고 있는데 TensorFlow나 PyTorch 모두 현 시점 (2021년 말) 기준으로는 R 에서도 충분히 지원하고 있기 때문에 이런 부분은 조금 아쉽다고 생각된다 (아마 번역서다보니 어쩔 수 없는 부분도 있었겠지만...) 요약해서 정리하자면 시계열 데이터 처리의 이론적인 부분을 어떻게 실제 코드로 적용할 지 코드 레벨로 상세한 설명이 필요하다면 추천한다. 다만 이 책 한권으로 시계열 데이터 분석을 완벽하게 하기는 조금 부족하며, 여러가지 통계적 가정 등을 보조 교재를 통해서 공부하는 것이 바람직하다고 생각한다.

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다