.
블로그"nthought"에 대한 검색결과884건
  • [비공개] 추천 시스템의 설계 (PR시리즈.18)

    추천 시스템에 대한 세부적인 내용은 대부분 다뤘습니다. 오늘은 실제 추천 시스템을 설계할 때 중요한 포인트만 다시 집고 넘어가겠습니다. 설명을 단순화하기 위해서 메모리 기반의 CF만을 사용한다고 가정하겠습니다. 어떤 데이터를 어떻게 쌓을 것인가? 가장 먼저 고민해야할 문제는 추천에 필요한 데이터 — 유저-아이템 레이팅/피드백 — 을 어떻게 구성할 것인가를 결정해야 합니다. 명시점수를 사용할 것인가 아니며 암묵피드백을 사용할 것인가를 정해야 합니다. 명시점수를 사용하면 미싱값은 어떻게 처리할 것인가도 고려해야 하고, 바이어스되고 불완전한 데이터를 어떻게 정형화할 것인가도 중요한 문제입니다. 암묵점수를 사용하는 경우라면 단순히 0/1로만 할 것인지 아니면 사용자 engagement 정도에 따른 차등점수를 줄 것인지도 고려되..
    nthought|2013-12-31 01:20 pm|추천

    추천

  • 미리보기 이미지

    [비공개] 제주의 12월. 우리의 2013년은 이렇게 흘러갑니다.

    아직 하루가 남았지만, 내일은 산행을 한다면 DSLR은 들고가지 않을 예정이고, 그렇지 않다면 그냥 조용히 2013년을 마무리할 듯합니다. 내일 새로운 사진이 업데이트되지 않을 듯하니 그냥 오늘 12월의 모습을 정리합니다. 12월은 추워서 조용히 보냈다고 생각했는데, 또 약 1600장의 사진들이 제 MBP 하드디스크의 용량만 차지하고 있습니다. 가급적 이미 공유되었던 사진들은 피해서 20장의 사진을 골랐습니다. 10장정도로 정리하려고 했는데 하나씩 넣다보니 욕심이 생기고, 이미 추가한 사진을 다시 빼는 것은 너무 힘든 일이라서 그냥 20장을 선택했습니다. 중복을 피하고 싶었지만, 특정 장소 특정 시점의 느낌을 전하기 위해서 어쩔 수 없이 중복된 사진들도 있습니다. 하루의 사진을 정리하면서 그날 가장 괜찮은 것들을 공유했기 때문에 한달의 사진을 ..
    nthought|2013-12-30 06:18 pm|추천

    추천

  • 미리보기 이미지

    [비공개] 눈길 발자국 이정표 그리고 결단

    눈이 온다는 예보처럼 일어나니 많은 눈이 내렸습니다. 장비를 모두 챙겨서 밖으로 나갑니다. 오늘 눈이 오면 주변을 돌아다니며 사진을 찍기로 마음 먹었습니다. 설마 눈오는 오전에 사람들이 나보다 먼저 산책을 했겠어라는 생각을 가지고 집 뒤에 쏟은 삼의악오름으로 향했습니다. 지난 밤에 일찍 잠들어서 보지 못했던 응사를 아침에 다시보기 하느라 조금 늦게 출발했더니, 벌써 몇 분이 저보다 먼저 눈밭에 발자국을 남겨놓았습니다. 조금 아쉬운 마음도 들었지만, 또 그 자국을 보면서 생각을 합니다.누군가가 나보다 먼저 이 길을 걸었고, 자국을 남겨놓았다는 것은 내가 그것을 따라가면 안전하게 정상에 도달할 수 있다는 의미입니다. 발자국에 맞춰서 걷기 시작합니다. 그런데 어느 순간부터 마음이 급해졌는지 걸음걸이 속도가 빨라졌습니다...
    nthought|2013-12-28 09:18 pm|추천

    추천

  • [비공개] 데이터 매니페스토: 데이터 기반의 실행조직

    (새벽에 문득 잠에서 깨어 이 글을 적는다.) 최근 데이터 또는 데이터 기반 접근법에 대한 관심이 뜨겁다. 어쩌면 내가 밥벌어먹고 살려고 또 내 몸값을 올리려고 이런 표현을 사용/전파하고 있는지도 모르겠다. 관련 뉴스를 보면서 과연 데이터 기반의 실행조직이라는 것이 실체가 있는 것인지? 아니면 그들도 자기들을 세일즈하기 위해서 억지로 기사를 쏟아내고 있는 것은 아닌지? 또는 구글이나 몇몇 잘 나가는 기업들이 데이터를 가지고 돈을 잘 벌고 있으니 그걸 부각시키고 과대포장하고 있는 것은 아닌지? 등에 대한 의문이 들기는 한다. 그런 의심은 일단 뒤로 하고, 데이터가 공기처럼 편재하고 있다는 것은 사실이다. 많은 기업들이 스스로 좀 더 가치있는 데이터를 생산해내거나 고객들로부터 그런 데이터를 수집하려고 노력중이다. 그러나 ..
    nthought|2013-12-27 03:09 pm|추천

    추천

  • [비공개] 커뮤니케이션 문제는 커뮤니케이션으로 해결된다.

    12월이 되니 여러 가지 이슈로 많은 글을 적게 됩니다. 개인의 취미 생활에서부터 사회 문제까지 적고 싶은, 그것보다 적어야하는 글들이 쏟아집니다. 일전에 다음인들에 의한 제주사진전@한남에 대한 글을 올렸는데 (참고. 다송밤을 준비하며... (제주 사진전 at 한남)), 그것의 경과/결과에 대한 글도 적어야 하는데, 다른 글들 때문에 미뤄지거나 취소될 듯합니다. 어쨌든 지금 글은 사진전의 연장선에서 나온 얘기이고, 그리고 더 근본적인 대한민국의 현실에 관한 얘기입니다. 사진전을 준비하면서 저는 제주에서 있으면서 사진을 좋아하는 동료들에게 사진 기부를 독려하고 모아서 서울로 보내주는 역할을 했습니다. 나머지 전시 관련 사항은 서울에서 알아서 하기로 했습니다. 처음 기획 단계에는 개별 회의실에 개인별로 전시를 하는 것으로 준비되..
    nthought|2013-12-27 11:05 am|추천

    추천

  • 미리보기 이미지

    [비공개] 추천 시스템의 유사도에 대한 심화이해 (PR시리즈.17)

    이 글은 이전에 다뤘던 글들에 비해서 조금 더 관념적이면서 기술적인 글을 담고 있습니다. 그렇다고 해서 수식이나 프로그래밍 코드가 포함된 것은 아닙니다. 추천 시스템 (CF방식)에서 어떤 유사도 similarity measure를 사용하느냐에 따라서 추천 시스템의 성능에 큰 영향을 준다고 설명했습니다.일반적으로 Euclidean distance, jacard index, correlation coefficient, cosine 등의 유사도를 많이 사용하고 있다고 말했습니다. 그리고, 추천 시스템에 따른 예측값과 실측값의 Error term이나 이들의 correlation의 정도로 추천 시스템의 정확도를 평가한다고 말씀 드렸습니다. (하단 링크 참조) 이 글에서는 유사도 또는 성능평가 측도에 대해서 좀더 깊게 생각해볼까 합니다. 유사도 또는 성능평가 측도는 간격 Gap 또는 경향성 Tendency 두가지 term으로 구성되어있습니다. 현재 대..
    nthought|2013-12-27 10:51 am|추천

    추천

  • [비공개] 학과/전공에 따른 데이터마이닝 구분

    최근 빅데이터 Big Data, 스마트 데이터 Smart Data, 데이터분석 Data Analytics, 예측분석 Predictive Analytics, 데이터 사이언티스트 Data Scientist 등과 같은 용어가 범람하는 것은 그만큼 데이터마이닝 Data Mining에 대한 수요와 인기가 높아졌다는 반증일 것입니다. 이전글에서 데이터마이너가 되기 위해서 이런 학과에 진학하거나 수업을 들으면 된다는 류의 Q&A를 몇 차례 다뤘습니다. 일반적인 의미에서 그런 진학/진로 상담이 별로 어렵지는 않습니다. 하지만 세부적으로 들어가면 각 학과마다 조금씩 관점의 차이가 있기 때문에 단순히 이런 수업을 수강하면 된다 식의조언으로는 충분치 못한 것같아서, 오늘은 학과/전공별로 데이터마이닝이 어떻게 다른지에 대한 글을 적으려 합니다. 데이터마이너가 되기 위한 테크트리는 일반적인 마이닝 수업을 들으면 충분하..
    nthought|2013-12-26 04:50 pm|추천

    추천

  • [비공개] 추천 시스템과 다중인격 (PR시리즈.16)

    추천 시스템 관련 이야기는 이제 그만 하려고 했는데, 미처 다루지 못했던 이슈가 계속 떠오릅니다. 제목은 조금 이상하게 정했지만, 추천이 개인화를 목적으로 두지만 경우에 따라서 반개인화가 목적이 될 때도 있고 또 지나친 개인화는 추후에 프라이버시 문제와 연결될 수가 있습니다. 여기서 말하는 프라이버시 문제는 일반적인 개인정보 수집 및 사용에 관한 것이 아니라, 다양한 페르소나를 가지는 개인을 하나로 합쳐서 보여줄 때 발생하는 문제를 의미합니다. 한 사람을 하나의 페르소나로 정의하지 못합니다. 여러 가지 특성을 가지고 있습니다. 저는 직장인이고, 30대 남성이고, 제주에 살고 있습니다. 그 외에 사진을 많이 찍고 데이터마이닝에 관심을 가지고 있습니다. 주말에는 교회를 나가고 또 축구하는 것도 좋아합니다. 정치 사회적 문제..
    nthought|2013-12-26 09:38 am|추천

    추천

  • [비공개] 2014년에는 어떤 책들을 읽을까?

    2013년을 되돌아보며 후회되는 것 중에 하나가 독서량이 많이 줄었다는 거다. 독서할 시간이 없었다기보다는 독서할 의욕이 없었다가 맞다. 왜 의욕이 부족했느냐?고 묻는다면 — 이미 몇 번 밝힌 듯하지만 — 재미있는 책을 읽지 못했다는 것이다. 분수에 맞지 않게 어려운데 두꺼운 책을 한 두번 읽기 시작하면 재미도 떨어지고 독서속도도 떨어진다. 자연스레 책은 뒤로 미루로 TV나 인터넷으로 눈을 돌리게 된다. 평소와 다름없는 방식으로 책을 선정했다고 생각했지만, 2013년에는 책선정에 실패한 경우가 많았었다. 굳이 또 변명하자면 올해는 유독 500페이지 이상의 두꺼운 책을 많이 구입했던 것같기도 하다. 글의 제목은 마치 내가 2014년에 어떤 책을 읽을지 미리 알려주는 것같지만, 실은 경험을 바탕으로 이런 책을 읽어라라는 가이드를 해주려고 ..
    nthought|2013-12-25 03:34 pm|추천

    추천

  • [비공개] 개인 우연 창발 그리고 창의

    문득 서구의 개인주의가 창의력의 원천일 수도 있겠다는 생각이 들었습니다.여전히 사실인지 아니면 그냥 신화인지는 확인할 길이 없으나 Pixar스튜디오에는 화장실이 건물 중앙에 한 곳에만 있다고 합니다. 누구나 생리현상은 해결해야 하고, 그럴려면 중앙에 있는 화장실로 모여야 합니다. 그렇게 모이고 부딪히면서 서로 얘기를 하다보면 다양한 이야기들이 오갈 것입니다. 때로는 자신이 가지고 있는 문제를 토로하는 경우도 있을테고, 때로는 최근에 자신이 했던 프로젝트나 잘 된 일을 뽐내기도 할 것입니다. 그렇게 우연히 마주친 이들과 이야기를 나누다 보면 자신이 가지고 있는 문제를 해결해줄 사람과 대화하기도 하고, 또는 그런 이를 연결해주기도 합니다. 이렇게 우연에 의한 창발을 기대하며 화장실은 하나만 만들었다는 얘기가 있습니다...
    nthought|2013-12-24 10:42 am|추천

    추천

이전  31 32 33 34 35 36 37 38 39 ... 89  다음
셀로거는 비즈니스/마케팅 관련 블로그중 대중에게 RSS를 제공하는 블로그의 정보만 수집 및 정리하여 소개하는 비상업적 메타블로그 사이트입니다.
수집된 내용에 대한 모든 블로그의 저작권은 모두 해당 블로거에게 있으며 공개되는 내용에 대해서는 Sellogger의 입장과 무관합니다.
셀로거에서는 원글의 재편집 및 수정을 하지 않으며 원문링크를 제공하여 전문확인을 위해서는 저작권자의 블로그에서만 확인가능합니다.
Copyright (c) Sellogger. All rights reserved. 피드등록/삭제요청 help@sellogger.com