데이터 분석

분석가의 정리공간

전체 글 11

혼란한 배달 시장과 나의 경험에 대하여

합류와 즐거운 회사생활작년 5월 요기요라는 배달 플랫폼을 운영하는 위대한상상에 합류하였습니다. 사장님향의 분석을 진행하는 Merchant Growth 본부에서 영업리드 개발, 신규 요금제와 관련된 기획 참여, 운영에서 발생할 수 있는 오류 탐색, 데이터 마트 구축 등에 참여했습니다. 전 직장이던 컨설팅 업체와는 다르게 분석에 대한 결과가 눈에 보이고 수치화할 수 있어 성장에 기여했다는 생각에 즐거운 회사생활을 보내고 있었습니다.  긍정적인 회사생활과 긍정적이지 못한 회사상황하지만 저의 즐거운 회사생활과는 다르게 시장에서 요기요는 좋은 평가를 받고 있지 못했습니다. 강력한 배달업계의 지배자와 모기업의 강력한 지원을 받는 신규 플레이어는 지속적으로 시장을 뒤흔드는 출혈 정책들을 발표했습니다. 이어 우리도 발..

업무회고 2024.10.09

만화책에서 일반서적으로: 시간 확보와 독서 습관의 전환

씹기 어려운 껌 올해 초, 책 10권을 읽겠다는 목표를 세웠다. 그 목표는 1인당 독서량이 약 5권 내외로 확인됐고 그 두 배인 10권을 읽어보자는 취지에서 결정되었다. 나름 라이트노벨과 웹소설, 만화책으로 단련된 덕력(?)을 기반으로 10권은 껌이라는 생각이 들었다. 그러나 그 껌은 생각보다 씹기 어려운 껌이었는데, 막상 독서를 시작하니 쉽지 않았던 것이다. 나의 독서를 어렵게 만든 두 가지 요소는 다음과 같다.1. 시간2. 이해정말 시간이 없어? 그럼 만들어! 출퇴근이 왕복 2시간이 걸리는 나는 시간을 내기가 생각보다 어려웠다. 그리고 독서 외에도 운동, 스터디, 청춘사업 등 핑계 댈 것들이 너무 많았다. 시간 확보를 위해 나는 여러 가지 시도를 해보았는데,그 중 첫 번째는 출퇴근 시간을 이용하는 것..

당신이 자주 사용하는 앱은 무엇인가요? - 네이버 시리즈

들어가기 전에 본 포스트는 단순 유저입장에서 작성되었으며 네이버 시리즈에 대한 어떠한 의도(홍보, 비방 등) 도 갖고 있지 않습니다. 재밌게 읽어주시고 비슷한 경험이나 반대되는 경험이 있다면 마음껏 의견 주시면 감사하겠습니다.  신작과 프로모션 네이버 시리즈에서 시리즈 단독 신작을 공개할 때는 첫날 10화를 공개한 후 41일간 매일 1화씩 공개합니다. 최초 공개 후 42일이 지나면 유료화가 되는 것이죠. 유료화 전까지 두 번의 프로모션이 있으며, 유료화 직후에는 한 번의 프로모션이 있습니다.찾아라 인생작유료 전환 임박특정 작품 단독의 매열무 (매일 10시 무료)첫 번째 '찾아라 인생작'은 최초 10화가 공개된 후 신작들을 모아 7일간 프로모션 배너에 걸어두고, 그중 50화를 읽으면 쿠키를 지급하는 형식입..

당신이 자주 사용하는 앱은 무엇인가요? - 개요

들어가기 전에 우리는 수많은 앱을 사용하여 하루를 보냅니다. 카카오톡, 유튜브, 네이버 등등.. 개인적으로 저는 네이버 시리즈를 애용하는데요, 웹소설과 전자책을 제공하는 플랫폼입니다. 출퇴근 시간이 길어 웹소설을 읽으며 시간을 보내죠. 작년 한해(2023년)에만 163개 작품, 11,839회차를 읽었는데, 적지 않죠? 더보기네이버 시리즈는 가벼운 소설들을 연재하는 웹소설 플랫폼(물론, 웹툰과 e-book도 있습니다.) 입니다. 연재되는 작품들은 기본적으로 처음 25화가 무료이고, 이후의 회차는 대여권 혹은 '쿠키'를 사용해 읽을 수 있습니다. 쿠키는 네이버 웹툰에서와 마찬가지로 1쿠키에 100원입니다.(앱에서 결제할 경우 20%의 수수료가 부과되어 120원이 결제되니 이점 유의하세요!)  신작은 10화부..

[발제] 실무로 통하는 인과추론 - ③ 그래프 인과 모델

3.1 인과관계에 대해 생각해보기  이번 장에서 배울 그래프 모델은 인과관계의 기본 언어 중 하나로 그래프 모델은 인과추론 문제를 구조화하여 식별 가정을 명쾌하고 시각적으로 표현하는 강력한 방법임 교차 판매 이메일이 전환에 미치는 영향을 다시 한번 추정해보자 데이터만 보고 독립성 가정이 성립한다고 이야기할 수 없어 실험 대상에게 처치 배정에 관한 메커니즘 정보가 있어야 독립성 가정이 유지됨 3.1.1. 인과관계 시각화 인과관계를 그래프로 표현할때는 어떤것이 원인인지 작성자의 의견이 담기게된다. 측정되지 않은 변수를 그래프에 추가할 수 있으며 이 모든것을 U 노드에 묶어서 표현할 것이다.  교차판매 이메일을 생각해보자 단순히 랜덤하게 대상을 선택하고 이메일을 보내서 성공적으로 전환을 이루어냈지만 그것은 이..

카테고리 없음 2024.05.06

[발제] 실무로 통하는 인과추론 - ② 무작위 실험과 기초 통계 리뷰

3줄 요약 무작위 통제 실험으로 편향을 줄여 실험군과 대조군에서 처치의 효과를 측정할 수 있음 그러나 표본의 수가 적으면 우연(혹은 편향)이 개입할 확률이 높음 그러므로 두 집단의 추정값(평균)의 차이가 있는지 통계적 방법으로 검증해야함 1. 독립성의 가정과 무작위 실험 1.1. 독립성의 가정 실험을 시작하기 전에 실험군과 대조군이 비슷한 조건을 가지고 있어야 한다는 것을 의미합니다. 이를 통해 어떤 차이가 발생했을 때, 그 차이가 우리가 적용한 처치 때문인지 확신할 수 있습니다 이것을 우리는 독립성의 가정이라고 부르며 이를 확보하기 위해 우리는 RCT(Randomized Control Trial: 무작위 통제 실험)를 사용합니다. 우리는 할인을 N월 1일부터 진행할 예정이다. 그렇다면 두 집단의 N월 ..

카테고리 없음 2024.04.21

[발제] 실무로 통하는 인과추론 - ① 인과추론 소개

1. 인과추론이 필요한 이유 (1.1 ~ 1.2) 기업 A의 매출이 한달 사이에 3배 이상 올랐습니다. 계절성을 고려한다고 해도 3배 이상 오른것은 조금 이상합니다. 유튜브 쇼츠에 최근 기업 A의 상품이 많이 보입니다. 이에 대한 결과로 기업 A의 상품 매출이 증가한 것으로 보입니다. 이처럼 원인을 알아야만 원인에 개입하여 원하는 결과를 만들어 낼 수 있습니다. 이와 같은 방식이 인과추론이며 인과추론은 인과관계를 추론하고 언제, 그리고 왜 다른지 이해하는지 이해하는 과학이라고 할 수 있습니다. 2. 인과관계를 정의하고 추론하는 과정 그러나 인과관계를 추론하는 과정에서 언제나 혼동되는 개념이 있습니다. 바로 연관관계입니다. 현실에서의 어떤 변수가 원인이되어 변화가 일어난다면 인과관계, 그것이 아닐때 연관관..

카테고리 없음 2024.04.07

데이터 분석가를 위한 위치 정보 - ② 행정 구역

개요 역삼동의 1월 한달간 지역별 Acquistion 산출해주실래요? 특정 행정구역을 기준으로 이런 요청이 종종 발생하는데. 이는 기본적으로 지역별로 시장점유율이 다르기 때문입니다. 그 때문에 지역별로 다르게 전략을 설계할 수도 있죠 그런데 문제는 이 때 발생합니다. 어.. 그럼 역삼동의 1월 (주민등록)인구랑 보고 싶은데 같이 뽑아주실래요? 언뜻 보았을때는 이상한점이 없습니다. 역삼동의 주민등록인구를 보는게 뭐가 문제지? 결론부터 말하자면 행정안전부에서 제공하는 주민등록인구는 "행정동" 기준으로 제공되며 요청받은 역삼동은 "법정동" 체계이기 때문입니다. 두 체계는 어떤 차이가 있는지 알아보겠습니다. 더보기 그럼 예시로 제시한 역삼동을 네이버 지도에 검색해보겠습니다. 역삼동이라고 표시된 영역에 역삼1동과..

데이터 분석가를 위한 위치 정보 - ① 좌표 체계

위치 정보는 생각보다 많은 것을 이야기해준다. 1. 개요 1.1. 위치 정보란 물리적 공간 내에서의 특정 지점이나 객체의 위치를 정의하고 설명하는 데이터입니다. 이 정보는 주로 지리적 좌표계를 사용하여 표현됩니다. 이러한 위치정보는 데이터 분석가에게 매력적인 정보로 단순히 테이블로 확인하는 것보다 직관적이고 효과적입니다. 제가 업무적으로 사용해본 위치정보는 다음과 같습니다. 휴대폰 위치정보 고객의 버스 승하차 정보 카드사 결제 매장 정보 배달앱의 가게 위치 정보 부동산 호가 정보 및 실거래가 정보 1.2. 왜 위치정보를 확인해야할까? 위치가 비슷하면 상대적으로 특성이 비슷합니다. 당장 우리에게 익숙한 것으로 이야기해보겠습니다. 서울 내의 아파트 가격과 경기도의 아파트 가격이 비슷할까요? 토블러의 지리학 ..

[후기] 데분생 - 오프라인 Meet up

개요 이번주 일요일 강남역에서는 데이터 분석과 관련된 이야기를 나누는 데분생 - 오프라인 Meet up이 있었습니다. 광고, 이커머스, 물류, 게임, 금융 등등 다양한 산업군의 사람들이 모여 자기소개, 발표, 개인 고민에 대한 자유 토론을 진행하였습니다. 3시간이라는 시간이 짧게 느껴질 정도로 의미있는 시간이었습니다. 데분생 오프라인 Meet up을 간단히 요약하고 느낀점들을 작성해보았습니다. - 발표 원문은 하단에링크로 첨부해두었습니다. 문제시 삭제하겠습니다. 세션 1. 자기 소개 약 20명의 자기소개와 각각의 참가자들에게 궁금한 내용들을 질문하는 시간이었습니다. 데분생 혹은 그 외의 채널(데이터야놀자 등)에서 연결된 참가자들과 기존 네트워킹이 강화되고 처음보시는 분들과 새로이 연결될 수 있는 의미있는..

업무회고 2024.02.25