-
[비공개] Regularization: 복잡도를 다스리는 법
개인적으로 전문용어가 어색하게 한글화되는 것을 별로 좋아하지 않는데, regularization도 그런 경우에 속합니다. 적당한 한글 용어를 찾기가 어렵습니다. 인터넷에 검색해보면 '규제화'라고 번역한 경우를 봤는데 페널티로 모델 복잡도를 제어하는 방식에는 유효하지만 다른 방식에는 조금 어색한 표현입니다. '일반화'는 그냥 generalization를 번역한 것 같지만 또 한편으론 학습오류와 테스트오류를 합친 generalization error를 줄인다는 의미처럼 보여서 나름 합당한 면이 있습니다. '정규화'라고 번역한 경우도 있는데 개발자들이 많이 사용하는 regular expression을 정규식이라고 부르니 정규화도 타당한 번역이지만 데이터를 정규 분포를 따르도록 만드는 normalization, 특히 N(0, 1) 분포로 만드는 standardization을 뜻하는 것 같은 느낌이 강합니다. 적당한 한글 용어가 ..추천 -
[비공개] 워드 임베딩과 팩토라이제이션, 그리고 개인화
Word Embedding, Factorization, and Personalization 여러 가지 개념이 혼재돼있습니다. 단어의 원래 뜻과 다르게 해석한 여지가 있습니다. 이 글에서 설명한 것이 절대적으로 맞다고 생각하면 위험합니다. 저는 제게 필요한 것으로 아전인수격으로 정의, 사용했을 개연성이 높음을 미리 경고합니다. 한글화된 용어를 별로 좋아하지 않지만 필요에 따라서 (국내에서 통상적으로 사용하는 경우) 일부 용어는 한글화했습니다. 2017년은 나름 공부하는 해로 정하고 그동안 미뤄놨던 논문들을 읽기 시작했습니다. 벌써 4주차가 됐는데도 여전히 논문을 읽고 있으니 지금의 흐름은 나름 오래 갈 것 같습니다. 한동안은 업무에 필요하거나 주목받은 논문 한두편을 짧게 읽은 적은 있지만, 연구실에 있을 때처럼 그냥 손에 잡히는 논문이나 엮인 논문들을 계속 읽어가는 것은 참..추천 -
[비공개] 2016년 신용카드 사용 실태 점검
또 다시 돌아온 연말정산 시즌입니다. 지난 1년동안 사용했던 카드 내역을 점검했습니다. - 2015http://bahnsville.tistory.com/1100 - 2014http://bahnsville.tistory.com/1056 - 2013http://bahnsville.tistory.com/944 총 사용 기간은 2015년 12월 16일부터 2016년 12월 15일까지입니다. 카드회사에서 제공하는 월별 결제내역을 기준으로 데이터를 뽑았습니다. 작년까지는 사용처의 종류를 '기타' 포함 총 12개로 했었는데, 올해는 '공과금' '교통' '레저' 항목을 추가했습니다. 공과금은 카카오페이를 이용해서 전기세를 납부하는 것이 올해부터 반영됐기 때문입니다. 향후에 카카오페이의 간편결제로 더 다양한 공과금을 납부할 가능성이 높아서 일단 공과금 항목을 추가했습니다. 두번째로 '교통'은 재작년까지는 서울 등에 출장갈 일도 별로 없고 또 신용카드 칩에 문제가 있어서 교통카드..추천 -
[비공개] 자기강화와 GAN: 부족한 정답세트를 극복하는 방법
데이터 마이닝이나 머신러닝, 인공지능 AI 등에 관한 심도깊은 얘기는 다루지 않는다. 내가 그런 심도깊은 일을 하고 있지 않기 때문이기도 하거니와 그런 내용은 학교에서 정식으로 배우거나 많은 연구 논문을 읽으면서 터득해야할 영역이다. 개인적인 요청이 있다면 그걸 위해서 가이드해줄 수는 있지만 이 티스토리에서 그걸 해결해줄 수는 없다. 하지만 2017년에는 공부 좀 하기로 마음을 먹었으니 필요하면 특별한 주제에 맞춰서 또는 머신러닝 알고리즘의 전반적인 것에 대해서 종종 다루려 한다. 계획이 그렇다는 것이지 몇 번을 다룰지는... 최근이라 적고 작년 2016년에 가장 큰 이슈가 됐던 강화학습과 GAN (Generative Adversarial Networks)에 대한 소개 또는 개념적 이해를 돕기 위해서 글을 적는다. 남들이 이해하도록 돕는다기보다는 스스로 정리하고 넘..추천 -
[비공개] [Q&A] 빅데이터 전공과 전망
블로그 방명록을 통해서 또 질문이 들어왔습니다. 개별적으로 답변할 수도 있지만 비슷한 고민/의문을 가진 분들을 위해서 공개적으로 글을 적습니다. 질문을 요약하면 아래와 같습니다. 1. 빅데이터 분야로 진출하기 위해서 인문학부생으로서 컴퓨터공학과와 통계학(수학) 중에서 어느 쪽으로 전과/복수전공하면 좋을까요?2. '빅데이터'에 대한 부정적 시각도 많은데 관련된 미래 직업/산업에 대해서 어떻게 전망하시나요? 한줄 답변컴퓨터 공학과표지가 바뀐 고전인지 세련된 표지의 잡지인지는 책자을 열어봐야 안다. 그리고 고전도 시대정신을 따른다.개인이 처한 모든 상황과 배경을 모르기 때문에 원하는 답변이 아닐 수도 있고, 또 여러 생각으로 길게 적다보니 중언부언할 수 밖에 없음을 양해바랍니다. 철저한 계획이 아닌 어쩌다 보니 지금에 ..추천 -
[비공개] 공부하자 (나 논문 좀 읽어봤어요)
새해가 되면 으레 없던 새해결심이 생기기 마련입니다. 현실성이 없지만 가장 현실적인 소망으로 운동하자 (다이어트, 금연, 금주 등 포함)와 공부하자 (기술, 취미, 경력 등 포함)일 것입니다. 오늘은 두번째 특히 연구와 관련해서 어떤 것을 어떻게 읽을 것인가에 대해서 적으려 합니다. 기술직군에 속하지만 프로그래밍은 제 전문 영역이 아니니, 더 구체적으로 일단 데이터마이닝이나 머신러닝을 공부하는 것이라고 가정하고 글을 적습니다. 어떤 것을 읽어야할까? 또는 어떤 것을 읽지 말아야할까? 지극히 주관적인 생각입니다. 1. 한글 문서는 피한다. 블로그 등에 소개된 가벼운 글이나 급하게 한글문서를 찾아볼 수는 있지만, 장기적으로 한 분야를 마스터하는 것이 목표라면 어렵고 지루하더라도 가급적이면 영문 (논문이나 책)으로 공부하기를 ..추천 -
[비공개] 보이지 않는 길
2016년도 마지막 날인 지난 토요일 이른 아침에 일어나서 한라산 사라오름을 다녀왔습니다. 보통 사람들은 12월 31일에 일년에 단 한번만 개방되는 한라산 저녁 산행을 선택해서 새해 첫날의 해돋이를 백록담에서 보는 걸 선택했겠지만 저는 그럴 마음이 전혀 없었습니다. 그저 사라오름에 올라서 파란 하늘을 배경으로 한 새하얀 상고대의 모습을 사진으로 남기고 푼 마음 뿐이었습니다. 결론적으로 전날의 포근한 날씨 때문에 기대했던 상고대는 놓쳤습니다. 그리고 오랜만의 산행으로 지친 몸으로 2017년 새해를 맞이했습니다. 여섯시에 맞춰둔 알람이 울릴 때 고민을 많이 했습니다. 날씨를 체크했더니 흐림으로 나옵니다. 비록 사라오름에 상고대가 있더라도 날씨가 흐리다면 그저 짙은 안개 속의 상고대만 보고 내려올 것이 뻔하기 때문입니다. 역으..추천 -
[비공개] 월간 정부환 (2016.12호)
2016년도 하고도 12월달도 오늘로 마지막입니다. 내일이면 2017년인데 그저 시간이 바뀌고 달력이 넘어간다고 해서 새로운 세상이 오는 것은 아닙니다. 제가 정치에 지대한 관심을 가지고 사는 사람은 아니지만 정치적으로 꿈이 하나 있다면... 제가 더 나이가 들어서 지금보다 보수적으로 변하기 전에 대한민국와 전 세계가 더 바르고 진보적으로 변했으면 하는 것입니다. 지금과 같은 부정과 편법이 유지되는 세상에서 제가 나이가 들고 보수화되면 어쩌면 저도 지금의 이 체계를 그대로 받아들이게 되는 것이 아닌가하는 두려움이 있습니다. 이전의 많은 선배들의 배신을 보면서 이런 두려움과 바람이 생겼습니다. 설령 제가 나이가 들고 보수화됐을 때 진보된 세상이 마음에 들지 않아서 욕을 하는 일이 벌어지더라도 그렇게 욕하면서 늙어가는 것이 오..추천 -
[비공개] 2016 메모리즈
어느덧 2016년도 달력의 마지막 장도 떼내야할 시간이 됐습니다. 이틀을 남기고 2016을 정리하려 하지만 아직 정리되지 않은 그 문제가 마음에 걸립니다. 지난 1년을 참 숨가뿌게 달려왔지만 아직 이땅의 민주주의는 요원합니다. 여전히 주말이면 광장에 모이는 많은 사람들 그리고 그들 아니 우리의 염원은 언제쯤이면...1월. 제주의 평화소녀상졸솔적으로 한일위안부협상이 진행됐습니다. 그래서 새해 첫날부터 마침 제주에 세워진 평화소녀상을 보러 찾아갔습니다. 올해의 마지막 날인 12월 31일도 토요일이니 다시 찾아가봐야겠습니다.2월. 1100고지의 상고대눈덮인 한라산에 오르는 것이 제주 겨울을 즐기는 거의 유일한 낙이었는데, 차츰 등산도 힘들어지고 때론 귀찮아졌습니다. 그래서 대안으로 찾은 것이 1100고지까지 차를 몰고 가서 상고대를 보고 ..추천 -
[비공개] 기계를 닮아가는 인간
최근에는 한달에 한번꼴로 판교로 출장가지만 지하철을 이용하는 경우는 극히 드뭅니다. 김포공항에 내려서 공항셔틀로 서현역까지 이동하고, 서현역에서 다시 택시로 사무실로 이동합니다. 사무실에서 예약해둔 숙소로 이동할 때도 그냥 택시를 타거나 버스를 이용합니다. 주초에 출장갔다가 강남역 일대로 나갈 일이 있어서 오랜만에 지하철을 이용했습니다. 그때 조금 신기한 현상을 목격했습니다. 일상적으로 지하철을 이용하는 분들은 이게 뭐가 신기한 현상이냐라고 생각하겠지만 시골에 살다가 가끔 지하철을 이용한 저에게는 바로 눈에 띄었습니다. 러시아워를 지난 이후의 한산한 지하철 안에 갑자기 사람들이 한 곳으로 몰립니다. 방금 전까지 의자에 편히 앉아있던 분들이 지하철이 정차하기 직전에 출입문 쪽으로 몰립니다. 이것만으로..추천