[서평] 실전 시계열 분석
[서평] 실전 시계열 분석
2021.12.26흔히 말하는 교과서의 전형적인 그리고 다소 인위적인 데이터 (설명을 위해서 다소 비약이 들어간 형태의)가 아니라 우리가 실생활에서 접하는 데이터는 크게 볼륨의 확장과 시간에 따른 변화가 큰 특징이라고 할 수 있다. 점점 더 큰 볼륨의 데이터를 수집하고 그것을 전처리하고 최종적으로 프로덕트에 녹이는 작업은 빅데이터라는 용어를 통해서 많이 알려졌지만, 시간이 지남에 따라서 그 때는 맞았지만 지금은 틀리것과 같은 시계열 데이터 처리에 대한 관심은 상대적으로 덜했던 것 같다. 점점 더 사람들의 니즈가 변하고 비지니스가 빠르게 변하는 만큼 시계열 데이터 분석에 대한 중요성은 더 강조해도 지나침이 없고, 해당 책은 시계열 분석에 대한 어느 정도의 이론을 안다는 전제하에 실제 프로그래밍 언어로 어떻게 분석하는 지 설..
[서평] fastai와 파이토치가 만나 꽃피운 딥러닝
[서평] fastai와 파이토치가 만나 꽃피운 딥러닝
2021.09.22대부분의 딥러닝 관련 코스의 시작은 기본적인 선형대수, 확률통계 지식으로 시작해서 선형회귀, 로지스틱 회귀를 거쳐 MLP, CNN, RNN과 같은 순서로 진행하는 것이 일반적이다. 이런 바텀업 방식의 교습은 어느 정도 궤도에 오른 사람 또는 백과사전식으로 레퍼런스를 찾아볼 때는 유용하지만 소프트웨어 엔지니어가 익숙한 방식은 아니라고 생각한다. 소프트웨어 엔지니어는 코드를 이렇게 저렇게 바꿔도 보고, 코드를 일부러 동작하지 않게도 만들어가면서 동작 원리를 파악하는 접근 방식에 대체로 익숙한 경우가 많다. 이 책은 이런 소프트웨어 엔지니어들이 딥러닝 애플리케이션을 탑다운 방식으로 배울 수 있도록 구조화되어있다. 동명의 코스웍이 굉장히 유명한데 ( https://course.fast.ai/ ) 그것을 책으로 ..
[서평] 리눅스 입문자를 위한 명령어 사전
[서평] 리눅스 입문자를 위한 명령어 사전
2021.08.22대부분의 컴퓨터 사용자들이 GUI 환경에 익숙해져있는 2021년이지만, 소프트웨어 엔지니어는 여전히 까만 바탕의 Terminal 환경에서 작업할 일이 많다. 주기적인 배치 작업을 위한 Crontab이나 심볼릭 링크 등 사전에 알고 있었다면 일의 효율성이 높아지는 유용한 명령어들이 다수 존재한다. 이 책은 그런 유용한 명령어들을 말 그대로 사전식으로 정리해놓은 책이다. 책 내용 자체는 아주 기본적인 명령어부터 생각보다 고급 명령어 (나도 처음 보는 명령어들도 꽤 있었다)까지 망라하고 있으며, 단순히 사전식 나열이 아니라 필요하다면 운영체제 개념 (프로세스, 스레드 등)도 짤막하게 같이 소개하고 있는 점은 독자들이 기본 개념을 리마인드하기에 아주 적합한 구성으로 보인다 다만, 책의 두께가 생각보다 두꺼운 편..
[서평] 파이썬으로 살펴보는 아키텍처 패턴
[서평] 파이썬으로 살펴보는 아키텍처 패턴
2021.06.20한국에서의 Back-end 개발은 타국가와 다르게 Spring 프레임워크에 굉장히 의존적인 것이 특이사항이라고 볼 수 있다. 전자정부프레임워크를 위시한 Java Spring 기반의 엔지니어가 2000년대 초반부터 많았기 때문에 유지보수도 용이하고 성능 측면에서도 나쁘지 않은 Spring 프레임워크가 대세가 될 수 밖에 없었다고 생각한다. 당연히 그에 대한 영향으로 각종 기술서적 역시 Java와 Spring 기반으로 한 책들이 많을 수 밖에 없었다. 위 책의 아키텍처나 TDD, DDD와 같은 책도 현재 한국에서 출간된 서적 중 많은 비율은 Java와 Spring을 대상으로 설명하고 있다. 그러나 2021년 기준, 스타트업처럼 빠르게 프로덕트를 만들어야하거나 규모가 있는 회사에서도 린하게 움직이기 위해 Sp..
[서평] 쓰면서 익히는 알고리즘과 자료구조
[서평] 쓰면서 익히는 알고리즘과 자료구조
2021.05.23최근 개발자 채용이 늘어나면서 덩달아 많은 관심을 받게된 컴퓨터 과학의 한 갈래는 단연 자료구조와 알고리즘일 것이다. 대부분의 기업에서 코딩 테스트를 여러가지 목적으로 필수적으로 진행하고 있기 때문에 테스트에서 활용하는 자료구조와 알고리즘은 취업 준비생 또는 이직을 준비하는 사람들에게 필수불가결한 내용이 되었다. 단순히 자료구조와 알고리즘에 대해서 다루는 것이 아니라 아예 코딩테스트를 타겟으로 출판된 책들도 다수 있다. 그러면 기존에 출판된 코딩테스트 대비 또는 자료구조/알고리즘 책과 본 도서의 차이는 무엇일까? 책에서 다루는 주제는 기존의 출판된 책들과 크게 다르지 않거나 오히려 책의 두께가 얇은 편이므로 일부 빠지는 내용도 있는 것으로 보인다. 물론 자주 출제되는 유형은 대부분 다루고 있으므로 그 부..
[서평] 친절한 딥러닝 수학
[서평] 친절한 딥러닝 수학
2021.04.18이전 서평에서 잠깐 언급했었지만, Python 언어의 인기 상승에는 Deep Learning의 유행이 크게 기여했다고 생각한다. 유행에 따라 많은 소프트웨어 개발자와 학생들이 Deep Learning 공부에 시간을 투자하기 시작했고, 가장 처음 어려움을 맞이하는 부분이 '수학'이었을 것이다. 분명히 세부적인 벡터의 내적, 합성함수의 미분 등은 고등학교 또는 대학교에서 어렴풋이나마 배우고 지나갔을 텐데, 이것을 엮어서 Deep Learning이 학습하는 과정을 '수식'으로 압축해서 설명하면서 어려움을 겪었던 경험은 나를 포함해서 다들 있었을 것이라고 본다. 이런 어려움으로 인해서 수학적 이해 없이 단순히 TensorFlow, PyTorch 같은 라이브러리를 단순 사용하게 된다면 내가 풀고자 하는 도메인의 ..
[서평] 진지한 파이썬
[서평] 진지한 파이썬
2021.02.212021년 기준 파이선은 가장 인기 있는 입문자용 프로그래밍 언어라고 할 수 있다. 간결한 문법 체계와 풍부한 표준 내장 라이브러리, 그리고 커뮤니티는 프로그래밍에 익숙하지 않은 사람이라도 빠르게 애플리케이션이나 서비스를 구현할 수 있을 정도이다. 특히 TensorFlow를 위시한 Deep Learning의 인기와 취업 준비생의 코딩 테스트에서의 파이선 선택자의 좋은 성적이 여러 파이선 입문서, Deep Learning, 그리고 코딩 테스트를 다루는 서적의 출간에 많은 영향을 줬다고 생각한다. 이 책은 위와 같은 인기와는 조금 다르게 어떻게 파이선 기반의 'Product'를 더 잘 만들 수 있을지에 대해서 다루고 있는 책이라고 생각한다. 이러한 유형의 도서 중 하나는 Effective Python인데 해..
데이터 엔지니어의 2020년 회고
데이터 엔지니어의 2020년 회고
2020.12.302020 회고 올해도 어김없이 반성과 내년에 대한 준비를 위한 이 시간이 돌아왔습니다. 4년째 회고 글을 작성하지만 100% 만족스러운 적은 없었던 것 같네요. 올해도 역시 아쉬운 점들이 많이 있었지만, 반대로 생각하면 더 발전할 수 있는 여지가 남았다고 위로하며 2020년 회고를 시작해봅니다. 매년 포맷이 조금씩 달라지는데, 올해 회고는 몇 가지 소주제별로 나눠서 정리해봤습니다. COVID-19와 원격 근무 올해 회고라면 역시 COVID-19를 제외하고는 얘기하기 어려울 것 같다. 글을 작성하는 2020년의 끝자락에서도 매일매일 심각하게 확진자가 늘어나고 있고, 해외의 사정도 크게 다르지 않아 더욱 걱정되는 바이다. 화제를 돌려서, 올해 1월 초에 입사했는데 정확한 수치는 모르겠지만 회사에 출근한 날보..
데이터 엔지니어의 2019년 회고
데이터 엔지니어의 2019년 회고
2019.12.312019년은? 항상 회고 글은 작년 글을 작성한 것이 엊그제 같은 데라는 말로 시작하는 것 같습니다. 1년이 또 이렇게 쏜 화살처럼 지나갔네요. 2019년은 많이 행복했지만, 정신적으로는 꽤 힘든 해였습니다. 우선 1분기를 제외하고는 각 프로젝트의 산출물을 실제 Coupang의 실제 서비스에 반영해서 고객 경험을 향상할 수 있었던 것은 결과적으로는 꽤 행복했습니다. 그러나 시간 관리를 잘하지 못했고, 생각지 못한 업무 역할의 변경이 있으면서 엔지니어로서 목표했던 공부량을 많이 채우지 못한 것이 가장 아쉽습니다. 엔지니어로서는 아쉬웠지만, 프로젝트 Lead를 하면서 아키텍처 설계, 우선순위 조정, Task 할당 등 그전까지 신경 쓰지 않았던 부분도 많이 배울 수 있었습니다. 1분기 가장 놀랄만한 소식은 역..
AI for Everyone Week1
AI for Everyone Week1
2019.03.10AI-for-Everyone-week1-a4611943-749d-4acd-b210-1a2a373559cc AI for Everyone week1 Introduction 2030년까지 $13 trillion 가치 소프트웨어 분야 뿐만 아니라 여행, 물류, 전장 사업 등 다양한 분야에 영향 ANI → 최근 몇 년간 많은 발전을 결과로 보여줌 (이미지 인식, 음성 합성 등) ANI / AGI가 아니라 약 인공지능 / 강 인공지능으로 표현하는 경우도 있음 Machine learning Supervised Learning 교과서나 튜토리얼 등에서 가장 흔하게 볼 수 있는 Machine learning의 유형! 입력 (A)를 출력 (B)로 가장 잘 설명할 수 있는 관계 (또는 함수)를 찾는 것 프로그래밍을 통해 명..
Spark 환경에서 Sentiment analysis를 해보자 (1)
Spark 환경에서 Sentiment analysis를 해보자 (1)
2019.02.24spark-sentiment-analysis Spark 환경에서 Sentiment analysis를 해보자 (1) Sentiment Analysis는 자연 언어처리 필드에서 오랫동안 연구되어 온 주제입니다. 고전적인 방법 (Naive Bayes)부터 비교적 최근에 많이 사용하는 Neural Network 계열 방법까지 다양한 방법이 존재하는데요. 대용량 데이터가 쌓이고 있는 현재 Spark 환경에서 Sentiment Analysis를 End-to-End로 예제를 들어 진행하려고 합니다. 분량 조절을 위해 이번 포스트에서는 데이터의 전처리까지, 다음 포스트에서는 Classifier 생성 및 평가로 나눠서 포스트를 작성하겠습니다. 환경 Spark 2.3.2 Scala 2.11.x Zeppelin 0.8 In..
[서평] 인공지능 마케팅
[서평] 인공지능 마케팅
2019.01.27인공지능 마케팅짐 스턴 저/김현정 역인공지능이 삼킨 미래 시장, 유효한 차세대 마케팅 툴은 무엇인가 견고한 타깃 마케팅 전략의 초석이 되는 데이터 기반을 제공한다. 이러한 도구를 잘 활용하는 기업만이 미래 시장에서 성공을 거둘 수 있다. 하지만 끊임없이 발표되는 데이터 과학의 최신 연구 결과를 따라가기란 벅찬 일이다. 이 책은 자연어 처리, 음성 인식, 머신러닝 등 마케터가 알아야 할 최소한의 인공지능 지식을 훑어보고, 이를 어떻게 실용적이고 전술적으로 십분 활용할 수 있는지 살펴본다. 인터넷의 마케팅적 가치를 포착한 최초의 전문가로 평가받는 저... 책소개 및 추천대상 AI는 이미 마케팅에 많은 영향을 미치고 있고, 또 그 중요성이 점점 더 커질 것이 자명하므로 마케팅 전문가라면 AI에 대해 잘 이해하..