suyeongpark

지성을 추구하는 디자이너/ suyeongpark@abyne.com

전체를 보는 방법

복잡함(복잡계)의 원리를 대중적으로 설명하는 책. 환원주의를 비판하고 복잡함의 원리로 세상을 바라 보는 내용인데, 개인적으로는 이미 다른 곳에서 접했던 내용이 많아 그냥 저냥이었다.

개인적으로는 복잡함의 원리를 좋아하여 끝까지 읽긴 하였으나, 복잡계에 대한 대중적인 책을 찾는다면 다른 책을 보는게 좀 더 낫지 않을까 싶었음. 마크 뷰캐넌의 <우발과 패턴>, <사회적 원자> 나 렌 피셔의 <보이지 않는 지능> 을 추천.

그나저나 예전에 읽었던 복잡계에 대한 책이나 요즘 나오는 복잡계에 대한 책의 내용이 크게 다르지 않은데, 이 분야가 아직은 더디구나 하는 생각이 들었음.

Machine Learning/ 로지스틱 회귀

주의) 이 페이지에서는 공식의 유도 과정 같은 것은 정리하지 않는다. 공식의 유도 과정은 <코세라 강의> 참조.

로지스틱 회귀 (Logistic Regression)

http://www.puzzlr.org/write-your-own-logistic-regression-function-in-r/

  • 데이터를 분류하기 위한 방법
    • 메일이 스팸인지 아닌지, 종양이 양성인지 음성인지를 구분한다.
  • 특정 데이터를 분류하는 기준(threshold)을 바탕으로 기준을 넘어서면 분류에 속하고 아니면 분류에 속하지 않는 것으로 판별한다.
    • 분류에 속하느냐 아니냐이기 때문에 값은 0이냐 1이냐로 나온다. 보다 정확히 말하면 결과값이 0에 가까우냐 1에 가까우냐를 가지고 0 또는 1로 값을 매긴다.
    • 분류의 종류가 여러개일 경우 각각의 분류 마다 분류에 속하는지 아닌지를 판별한다.
  • 분류 문제에 선형회귀를 쓰는 것은 좋은 방법이 아닌데, outlier 값이 선의 기울기를 크게 바꾸기 때문.

Continue reading

Machine Learning/ 선형 회귀

주의) 이 페이지에서는 공식의 유도 과정 같은 것은 정리하지 않는다. 공식의 유도 과정은 <코세라 강의> 참조.

선형 회귀 (Linear Regression)

https://en.wikipedia.org/wiki/Linear_regression

  • 연속적인 속성의 값을 예측하기 위한 방법.
    • 집의 크기가 얼마이고 위치가 어디일 때 집값을 얼마일 것인가에 대한 예측한다.
  • 분포된 데이터의 결과값을 표현하는 선을 긋고 –위 이미지의 빨간색 선– 그 선을 통해 새로운 데이터가 입력 되었을 때 그 결과값을 예측한다.

Continue reading

Machine Learning/ 개요

개요

  • 지도 학습 & 비지도 학습
    • 지도 학습(Supervised Learning)
      • 답이 있는 것을 학습 시키는 것 ex) 고양이 사진을 학습 시켜서 새로운 사진을 보고 고양이인지 아닌지를 판별하는 것
    • 비지도 학습(Unsupervised)
      • 답이 없는 것에서 패턴을 찾아 분류하는 것
  • 회귀 & 분류
    • 회귀 (Regression)
      • 연속적인 속성의 값을 예측하는 것으로 선형 회귀가 대표적. ex) 집 값이 얼마냐
    • 분류 (Classification)
      • 이산적인 속성의 값을 예측 하는 것으로 로지스틱 회귀가 대표적. ex) 양성이냐 음성이냐, 해킹을 당했느냐 안 당했느냐
      • 사실 이산적인 속성도 양이 많아지면 연속적인 것으로 보이기 때문에 이 둘 사이에는 모호한 지점이 있다.
  • Clustering & Non-Clustering
    • Clustering
      • 비지도 학습 중에서 비슷한 분류가 될 수 있는 것 –거리가 가깝거나 비슷한 의미거나 등– 끼리 묶는 것
    • Non-Clustrering
      • 비지도 학습 중에서 혼돈 속에서 패턴을 찾아내는 것. 강의의 예에서는 소음 속에서 개별 목소리를 뽑아내는 예가 있다.
  • 머신러닝에서 사용하는 개념들
    • 가설 함수(Hypothesis)
      • 선형 회귀나 로지스틱 회귀, 인공신경망에서 사용하는 모델 자체를 의미.
    • 비용 함수(Cost Function)
      • 가설함수와 실제 데이터의 차이 값을 의미.
      • 비용함수의 값이 0이라는 것은 모델로 세운 가설함수가 실제 데이터와 정확히 일치한다는 것을 의미한다.
      • 머신러닝은 결국 최저의 비용을 갖도록 가설함수를 만드는 과정이다.
    • Gradient Descent
      • 가설함수의 비용을 줄이는 알고리즘.
      • 가설함수의 각 파라미터 별로 비용함수를 편미분한 후 이전 파라미터 값에서 빼는 식으로 가설함수의 파라미터 값을 조절하면서 가설함수의 비용을 줄이는 방식을 사용한다.
      • 각 파라미터의 크기에 차이가 있기 때문에 그것을 보정하는 Feature Scaling과 파라미터의 값을 추가로 조절하는 Regularization 가 추가로 사용된다.
    • 과소적합(Underfitting) vs 과적합(Overfitting)
      • 가설함수가 실제 데이터의 값을 제대로 반영하지 못하는 경우 과소적합(Underfitting) 편향이 높다(High Bias)고 하며, 가설함수가 시험용 데이터에는 부합하지만, 다른 데이터 셋에는 부합하지 못하는 경우 과적합(Overfitting) 분산이 높다(High Variance)고 한다.
  • 위 내용은 사실 머신러닝 이전에 이미 각 분야에서 사용되던 통계적인 분석 방법이다. 머신러닝은 통계적인 분석 방법을 기계에 학습 시켜서 사용하는 것.
    • 물론 인공신경망 같은 것은 컴퓨터의 등장으로 가능해진 방법.

복잡성의 과학

제목 그대로 복잡성(복잡계)에 대한 책. 그간 물리학이나 생물학, 경제학을 전공으로 하는 사람이 쓴 복잡성에 대한 책과 달리 수학을 전문으로 하는 사람이 쓴 –그것도 한국인– 책은 처음이었는데, 흥미로운 내용이 많아 좋았다.

일반적인 과학이 인간 세계 보다 미시적인 세계 –원자, 분자, 세포 수준– 를 밝히는데 관심을 두는 반면, 나는 인간 세계 보다 거시적인 세계 –ex) 경제– 에 관심을 갖는데 –그렇다고 내가 전일주의(holism)는 아님– 복잡성 이론은 미시 세계의 원리를 근간으로 하여 거시 세계의 모습을 이해하는데 적합한 분야라고 생각해서 개인적으로 좋아함.

Continue reading

사람들은 어떻게 광장에 모이는 것일까?

사람들이 광장에 모이는 이유는 ‘공유 지식’[1] 때문이라고 주장하는 책. 예를 들자면 나만 부당한 대우를 받는게 아니란 걸 서로 깨달았을 때 힘을 합쳐서 집단 행동이 가능하다는 것.

집단 행동을 이끌 수 있기 때문에 집단 행동을 이끌려는 입장에서는 공유 지식을 형성하는 것이 중요하고 –책에서는 예로 의례, 집회, 이벤트 등을 든다– 집단 행동을 막으려는 입장에서는 공유지식의 형성을 방해하는 것이 중요하다 –집회를 방해하거나 파놉티콘 같은 구조로 서로 간에 의사 소통이 안되게 하는 것 등– 는 내용.

더불어 약한 (혹은 느슨한) 네트워크가 강한 네트워크에 비해 광범위한 의사소통에는 유리하지만 공유 지식에는 불리하다 –잘 아는 사람끼리 있을 때 행동이 더 잘 되기 때문. 집회 참여 예측의 중요한 변수는 집회에 참가한 친구가 있는지 여부다– 는 내용도 흥미롭다.

전체적으로 흥미로운 내용이긴 하지만 광고 효과를 공유 지식으로 설명하는 것과 같은 동의하기 어려운 부분도 좀 있었다. 그래도 책이 얇아서 관심 있다면 한 번쯤 읽어봐도 괜찮을 듯하다.


[1]: ‘내가 안다는 사실을 당신이 알고 당신이 안다는 사실을 내가 알고, 나도 알고 당신도 안다는 사실을 서로가 아는 상태’를 의미하는 일종의 메타 지식

2018

이성은 장기 전략이고, 감성은 단기 전략이다.
— 1월 4일

 

가격은 수요-공급의 원리가 아니라 협상력에 의해 결정된다. 수요-공급은 협상력에 영향을 미치는 요인일 뿐.
협상력에 의한 가격 결정은 수요-공급의 원리와 정보 비대칭 이론을 하나로 엮을 수 있다.
— 1월 1일

[영화] 1987

진정 용기 있는 사람들의 눈과 가슴 뜨겁게 하는 이야기.

방관자에 머무르려 하던 연희가 버스 위에 올라서서 광장의 사람들과 함께 구호를 외치는 엔딩 장면은 올해 본 영화들 중 최고의 장면이라 생각 함.

맛의 원리

바로 전에 읽은 <Flavor, 맛이란 무엇인가>의 저자인 최낙언씨의 맛에 대한 2번째 이야기.

기본적인 내용은 맛이란 무엇인가와 거의 비슷한데, –특히 책의 전반부에는 거의 같은 내용이 많이 나온다– 후각에 집중했던 전작에 비해 좀 더 다양한 내용을 담고 있다. 책 자체는 역시나 추천할 만 하지만, 전작과 유사한 내용이 많아서 둘 중에 하나만 보는게 좋을 것 같다.

개인적으로는 이 책이 전작에 비해 좀 더 대중적인 느낌이 드는데, 그점을 고려하여 각자의 취향에 맞게 읽으면 될 듯.

Flavor, 맛이란 무엇인가

개인적으로 신뢰하는 최낙언씨의 음식의 맛에 대한 과학 이야기. 음식의 맛을 찾아가는 인문학적인 내용이 아니고 상당히 깊이 –전문가가 보기에는 대중적인 수준이라고 볼지 모르겠지만– 들어가기 때문에 쉬운 책은 아니다.

대략적인 내용을 훑자면 맛이란 결국 뇌가 좌우하는 것인데,[1] 우리의 감각 기관 중에 후각이 가장 큰 영향을 미친다는 것.[2] 때문에 후각과 뇌에 대한 내용을 많이 다루고 있는데, 화학[3]에 대해 무지했던 나에게 참 많은 도움이 되었다.

Continue reading