19.09.22

‘얼굴 인식’ 인공지능으로 암흑물질 탐색

‘약한 중력 렌즈(weak gravitational lensing)’로 알려진 이 효과는 은하들의 이미지를 매우 미묘하게 왜곡한다. 이는 마치 뜨거운 날 먼 곳에 있는 물체가 흐리게 보이는 것과 같은 이치다. 빛이 온도가 다른 공기층을 통과할 때 왜곡되기 때문이다. (중략)

이들은 논문 제1저자이자 레프리기아 교수실 박사과정생 야니스 플루리(Janis Fluri) 연구원과 함께 심화 인공신경망으로 불리는 기계학습 알고리즘을 사용해 암흑 물질 지도에서 가능한 한 최대치의 정보량을 추출하도록 학습시켰다. (중략)

이 훈련 결과는 매우 고무적이었다. 신경망은 사람이 만든 통계 분석에 기초한 전통적인 방법으로 얻은 값보다 30% 더 정확한 값을 산출했다. 연구자들에게 이는 커다란 개선으로서, 마치 망원경 수를 두 배로 늘리고 비용과 시간을 많이 들여 관측의 정확성을 높이는 것과 같다.

자동차도 증기기관으로 달리는 차가 나오고(1776년), 사람이 탈만한 속도가 나오는 가솔린 차가 벤츠에서 출시되기까지(1886년) 무려 100년이 더 걸렸다. AI도 지금은 이미지 인식 정도지만 수십 년 후에는 누구나 일상적으로 AI –보다 엄밀히 말하면 좀 더 복잡한 영역에 대한 자동화– 의 도움을 받는 시대가 될 것이다.

50대 사건으로 보는 돈의 역사

현직 이코노미스트가 쓴 돈과 관련한 경제 역사 요양서.

개인적으로 문명화 후 인류의 역사는 먹고 사는 문제, 다시 말해 부의 흐름 –이념이 아니라– 이었다고 생각하기 때문에, 부를 통한 역사를 이해가 중요하다고 생각하는데, 내 생각에 딱 맞는 책이 없어서 아쉽다. –예전에 읽었던 <금융으로 본 세계사>도 아쉬웠음.

이 책도 네덜란드에서 주식 시장이 열렸던 시점 이후를 주로 다루고 있기 때문에, 그 이전 시기의 부의 대해 기대한다면 아쉬울 수 있음. 

그래도 개괄적이고 나름 의미 있는 내용들이 담겨 있기 때문에 가볍게 본다면 괜찮은 책이라고 생각 됨.

OpenCV 4로 배우는 컴퓨터 비전과 머신 러닝/ OpenCV 주요 기능

  • (각 함수의 상세한 파라미터에 대해서는 이전의 <OpenCV로 배우는 영상처리 및 응용>에서 정리하였으므로 생략)

카메라와 동영상 파일 다루기

VideoCapture 클래스

  • 동영상이란 일련의 정지 영상을 압축하여 파일로 저장한 형태
    • 이때 동영상에 저장되어 있는 정지 영상을 프레임(frame)이라고 함.
    • 동영상을 처리하는 작업은 동영상에서 프레임을 추출한 후, 각각의 프레임에 영상 처리 기법을 적용하는 형태로 이루어짐.
  • OpenCV에서는 VideoCapture라는 클래스를 이용하여 카메라 또는 동영상 파일로부터 정지 영상 프레임을 받아올 수 있음.
  • VideoCapture 클래스에서 동영상 파일을 불러오려면 처음 VideoCapture 객체를 생성할 때 동영상 파일 이름을 지정하거나 기본 생성자로 VideoCpature 객체를 생성한 후 VideoCapture::open() 멤버 함수를 호출해야 함.
  • 하나의 동영상 파일 대신 일련의 숫자로 구분되는 이름의 정지 영상 파일을 가지고 있고, 이 파일을 불러오고 싶을 때에도 VideoCapture 클래스를 이용할 수 있음.
    • 예컨대 img0001.jpg, img0002.jpg, img0003.jpg 라는 파일이 있을 때 filename 인자에 ‘img%04d.jpg”라고 입력하면 일련의 영상 파일을 차례로 불러올 수 있음.
    • 또한 filename 인자에 ‘protocol://host:port/script_name?script_params|auth’ 형태의 비디오 스트림 URL을 지정하여 인터넷 동영상을 사용할 수도 있음.
  • apiPreference 인자에는 아래 표와 같은 VideoCaptureAPIs 열거형 상수 중 하나를 사용하여 동영상 파일을 불러오는 방법을 지정할 수 있음.
    • 대부분의 경우 apiPreference 인자를 생략하거나 기본값인 CAP_ANY를 지정하는데, 이 경우 시스템이 알아서 적절한 방법을 선택하여 사용 함.
열거형 상수 설명
CAP_ANY 자동선택
CAP_V4L, CAP_V4L2 V4L/V4L2(리눅스)
CAP_FIREWIRE, CAP_IEEE1394 IEEE 1394 드라이버
CAP_DSHOW 다이렉트쇼(DirectShow)
CAP_PVAPI PvAPI, Prosilica GigE SDK
CAP_OPENNI OpenNI
CAP_MSMF 마이크로소프트 미디어 파운데이션
CAP_GSTREAMER GStreamer
CAP_FFMPEG FFMPEG 라이브러리
CAP_IMAGES OpenCV에서 지원하는 일련의 영상 파일
CAP_OPENCV_MJPEG OpenCV에 내장된 MotionJPEG 코덱

 

  • 컴퓨터에 연결된 카메라 장치를 열 때에도 VideoCapture 생성자 혹은 VideoCapture::open() 함수를 이용하는데, 이때 함수의 인자에 문자열이 아닌 정수 값을 전달 함.
    • 카메라 장치를 사용하려 할 때 VideoCapture 클래스의 생성자 혹은 VideoCapture::open() 함수에 전달하는 정수 값 index는 다음과 같은 형태로 구성됨
index = camera_id + domain_offset_id
  • 만일 컴퓨터에 한 대의 카메라만 연결되어 있다면 이 카메라의 camera_id는 0이 된다.
    • 만일 두 대 이상의 카메라가 연결되어 있다면 각각의 카메라는 0보다 같거나 큰 정수를 ID로 갖는다.
  • domain_offset_id는 카메라 장치를 사용하는 방식을 표현하는 정수 값이며 VideoCaptureAPIs 열거형 상수 중 하나를 지정한다.
    • 대부분의 경우 domain_offset_id는 자동 선택을 의미하는 0(CAP_ANY)을 사용하기 때문에 index 값은 결국 camera_id와 같은 값으로 설정한다.
  • 카메라 또는 동영상 파일 열기를 수행한 후에는 VideoCapture::isOpened() 함수를 이용하여 열기 작업이 성공적으로 수행되었는지를 확인하는 것이 좋다.
  • 카메라 장치 또는 동영상 파일의 사용이 끝나면 VideoCapture::release()를 호출하여 사용하던 자원을 해제해야 한다.
    • 참고로 VideoCapture 클래스의 소멸자에도 VideoCapture::release() 함수와 마찬가지로 사용하고 있던 자원을 모두 해제하는 코드가 들어가 있어서 VideoCapture 객체가 소멸할 때 자동으로 열려 있던 카메라 장치 또는 동영상 파일이 닫히게 된다.
  • VideoCapture 클래스를 이용하여 카메라 또는 동영상 파일을 정상적으로 열었다면 그 후에 공통의 멤버 함수를 사용하여 프레임을 받아올 수 있다.
    • VideoCapture 클래스에서 한 프레임을 받아 오기 위해서는 VideoCapture::operator >>() 연산자 재정의 함수 또는 VideoCapture::read() 함수를 사용한다.
  • >> 연산자 재정의와 VideoCapture::read() 함수는 모두 카메라 또는 동영상 파일로부터 다음 프레임을 받아 와서 Mat 클래스 형식의 변수 image에 저장한다.
    • 사실 >> 연산자 재정의는 함수 내부에 명시적으로 VideoCapture::read() 함수를 호출하는 형태로 구성되어 있기 때문에 그 둘은 완전히 같다.
VideoCapture cap(0);

Mat frame1, frame2;
cap >> frame1; // 1st frame
cap.read(frame2); // 2nd frame
  • 현재 열려 있는 카메라 장치 또는 동영상 파일로부터 여러 정보를 받아 오기 위해서는 VideoCapture::get() 함수를 사용한다.
    • VideoCapture::get() 함수는 인자로 지정한 속성 ID(propID)에 해당하는 속성 값을 반환한다.
    • VideoCapture::get() 함수의 인자로 지정할 수 있는 속성 ID는 VideoCaptureProperties 열거형 상수 중 하나를 지정할 수 있으며, 자주 사용되는 상수를 아래 표에 정리.
    • VideoCapture::get() 함수는 속성을 double 타입으로 반환한다.
VideoCaptureProperties 열거형 상수 설명
CAP_PROP_POS_MSEC 비디오 파일에서 현재 위치(밀리초 단위)
CAP_PROP_POS_FRAMES 현재 프레임 위치 (0-기반)
CAP_PROP_POS_AVI_RATIO [0, 1] 구간으로 표현한 동영상 프레임의 상대적 위치(0: 시작, 1: 끝)
CAP_PROP_FRAME_WIDTH 비디오 프레임의 가로 크기
CAP_PROP_FRAME_HEIGHT 비디오 프레임의 세로 크기
CAP_PROP_FPS 초당 프레임 수
CAP_PROP_FOURCC fourcc 코드(코덱을 표현하는 정수 값)
CAP_PROP_FRAME_COUNT 비디오 파일의 전체 프레임 수
CAP_PROP_BRIGHTNESS (카메라에서 지원하는 경우) 밝기 조절
CAP_PROP_CONTRAST (카메라에서 지원하는 경우)  명암비 조절
CAP_PROP_SATURATION (카메라에서 지원하는 경우) 채도 조절
CAP_PROP_HUE (카메라에서 지원하는 경우) 색상 조절
CAP_PROP_GAIN (카메라에서 지원하는 경우) 감도 조절
CAP_PROP_EXPOSURE (카메라에서 지원하는 경우) 노출 조절
CAP_PROP_ZOOM (카메라에서 지원하는 경우) 줌 조절
CAP_PROP_FOCUS (카메라에서 지원하는 경우) 초점 조절
VideoCapture cap(0);

int w = cvRound(cap.get(CAP_PROP_FRAME_WIDTH));
int h = cvRound(cap.get(CAP_PROP_FRAME_HEIGHT));
  • VideoCapture::get() 함수와 반대로 현재 열려 있는 카메라 또는 비디오 파일 재생과 관련된 속성 값을 설정할 때는 VideoCapture::set() 함수를 사용한다.
    • VideoCapture::set() 함수의 속성 ID도 위의 표에 정리한 VideoCaptureProperties 열거형 상수를 지정한다.
    • 만일 video.mp4 파일을 열어서 100번째 프레임으로 이동하려면 다음과 같은 코드를 작성하면 된다.
VideoCapture cap("video.mp4");
cap.set(CAP_PROP_POS_FRAMES, 100);

카메라 입력 처리하기

  • (앞서 나온 내용을 이용한 예제 코드와 설명이라 생략)

동영상 파일 처리하기

  • (앞서 나온 내용을 이용한 예제 코드와 설명이라 생략)

동영상 파일 저장하기

  • (앞서 나온 내용을 이용한 예제 코드와 설명이라 생략)

다양한 그리기 함수

직선 그리기

  • line()은 영상 위에 직선을 그리는 함수
    • 영상 위에 pt1 좌표부터 pt2 좌표까지 직선을 그린다.
    • 이때 선의 색상, 밝기는 color로 지정할 수 있고, thickness를 이용하여 두께를 지정할 수 있다.
    • lineType인자는 그리는 방식을 지정할 수 있는데, LineTypes 열거형 상수 중 하나를 지정할 수 있다.
LineTypes 설명
FILLED -1 내부를 채움(직선 그리기 함수에는 사용 불가)
LINE_4 4 4방향 연결
LINE_8 8 8방향 연결
LINE_AA 18 안티에일리어싱

 

  • 화살표 형태의 직선을 그려야 하는 경우에는 arrowedLine()을 이용하면 된다.
    • arrowedLine() 함수는 영상 위에 pt1 좌표부터 pt2 좌표까지 직선을 그리고 끝점인 pt2에 화살표 모양의 직선 두 개를 추가로 그린다.
    • 이때 화살표 모양의 직선 길이는 arrowedLine() 함수의 마지막 인자인 tipLength를 이용하여 조절할 수 있다.
  • drawMarker()는 직선 그리기 함수를 이용하여 다양한 모양의 마커를 그린다.
    • drawMarker() 함수는 img 영상의 position 좌표에 color 색상을 이용하여 마커를 그리는데, 마커의 종류는 markerType 인자로 지정할 수 있다. 기본값으로는 십자가 모양의 MARKER_CROSS 가 지정되어 있다.
MarkerTypes 설명
MARKER_CROSS 십자가 모양 (+)
MARKER_TILTED_CROSS 45도 회전된 십자가 모양 (x)
MARKER_STAR 별 모양 (*)
MARKER_DIAMOND 마름모 모양
MARKER_SQUARE 정사각형 모양
MARKER_TRIANGLE_UP 위로 뾰족한 삼각형
MARKER_TRIANGLE_DOWN 아래로 뾰족한 삼각형

도형 그리기

  • rectangle()은 사각형을 그리는 함수
    • rectangle(0 함수 인자 중 thickness는 도형 외곽선의 두께를 지정하는데, 만일 thickness에 -1 을 지정하거나 FILLED 열거형 상수를 지정하면 내부를 채운 사각형을 그린다.
  • circle()은 원을 그리는 함수
    • 원을 그리기 위해서는 원의 중심점 좌표와 반지름을 지정해야 한다.
  • ellipse()는 타원을 그리는 함수. 타원을 그리는 방식은 원을 그리는 방식보다 복잡하다.
    • ellipse() 함수는 다양한 형태의 타원 또는 타원의 일부인 호를 그릴 수 있다.
    • 타원의 크기는 axes 인자를 통해 지정하는데, axes 인자는 size 자료형을 사용하며, x축 방향 타원과 반지름과 y축 방향 반지름을 지정한다.
    • angle에 0이 아닌 값을 전달하면 회전된 타원을 그릴 수 있다.
    • startAngle과 endAngle 인자를 적절하게 이용하면 호를 그리는 용도로도 사용할 수 있다.
    • 예컨대 startAngle에 0을 지정하고 endAngle에 360을 지정하면 완전한 타원을 그리지만 startAngle에 0을 지정하고 endAngle에 180을 지정하면 타원에 반에 해당하는 호를 그린다.
    • thickness는 타원 외곽선 두께를 나타내는데, -1 또는 FILLED를 지정하면 내부를 채운 타원이나 호를 그린다.
  • polylines() 함수는 임의의 다각형을 그리는 함수
    • polylines()에는 다각형의 꼭지점 좌표를 전달해야 하며, 꼭지점 좌표는 vector<Point> 자료형에 저장하여 전달한다.

문자열 출력하기

  • 영상 위에 정해진 폰트로 문자열을 출력하려면 putText() 함수를 이용하면 된다.
    • putText() 함수는 img 영상의 org 위치에 text로 지정된 문자열을 출력한다.
    • 이때 사용할 폰트는 fontFace 인자로 지정할 수 있고, faceScale 인자를 이용하여 폰트 크기를 조절할 수 있다.
    • fontFace 인자에는 HersheyFonts 열거형 상수 값을 지정할 수 있다. HersheyFonts 열거형 중 FONT_ITALIC 상수는 논리합 연산자(|)를 이용하여 다른 상수와 함께 사용한다.
HersheyFonts 설명
FONT_HERSHEY_SIMPLEX 일반 크기의 산세리프 폰트
FONT_HERSHEY_PLAIN 작은 크기의 산세리프 폰트
FONT_HERSHEY_DUPLEX 일반 크기의 산세리프 폰트 (FONT_HERSHEY_SIMPLEX 보다 복잡)
FONT_HERSHEY_COMPLEX 일반 크기의 세리프 폰트
FONT_HERSHEY_TRIPLEX 일반 크기의 세리프 폰트 (FONT_HERSHEY_COMPLEX보다 복잡)
FONT_HERSHEY_COMPLEX_SMALL FONT_HERSHEY_COMPLEX 보다 작은 폰트
FONT_HERSHEY_SCRIPT_SIMPLEX 필기체 스타일의 폰트
FONT_HERSHEY_SCRIPT_COMPLEX 필기체 스타일의 폰트(FONT_HERSHEY_SCRIPT_SIMPLEX 보다 복잡한 형태)
FONT_ITALIC 이탤릭체를 위한 플래그

 

  • OpenCV는 문자열 출력을 위해 필요한 사각형 영역 크기를 가늠할 수 있는 getTextSize() 함수를 제공하는데, 이 함수를 잘 이용하면 문자열이 한쪼긍로 치우치지 않고 적당한 위치에 출력되도록 설정할 수 있다.
    • putText(0 함수를 이용하여 특정 위치 좌표에 문자열을 출력하면, 보통 문자열 길이와 크기에 따라 문자열이 차지하는 영역 크기가 달라지기 때문에 문자열이 한쪽에 치우쳐서 나타날 수 있다. 그러나 getTextSize() 함수가 반환하는 문자열 영역 크기 정보를 이용하면 문자열 출력 위치를 적절하게 조절할 수 있다.
Mat img(200, 640, CV_8UC3, Scalar(255, 255, 255));

const String text = "Hello, OpenCV";
int fontFace = FONT_HERSHEY_TRIPLEX;
double fontScale = 2.0;
int thickness = 1;

Size sizeText = getTextSize(text, fontFace, fontScale, thickness, 0);
Size sizeImg = img.size();

// 텍스트의 크기를 이용해서 적절한 위치를 계산
Point org((sizeImg.width - sizeText.width) / 2, (sizeImg.Height + sizeText.height) / 2);

putText(img, text, org, fontFace, fontScale, Scalar(255, 0, 0), thickness);

이벤트 처리

키보드 이벤트 처리

  • waitKey() 함수는 키보드 입력을 처리하는 OpenCV의 기본 함수
    • waitKey() 함수는 delay에 해당하는 밀리초 시간 동안 키 입력을 기다리다가 키 입력이 있으면 해당 키의 아스키 코드(ASCII code) 값을 반환한다. 만일 지정 시간 동안 키 입력이 없었으면 -1을 반환한다.
  • Window 운영체제에서 waitKey()는 일반적인 키보드 입력은 처리할 수 있지만, 함수키(F1, F2 등) 또는 화살표키 등 특수키 입력은 처리하지 못한다. 만일 키보드의 특수 키에 대한 처리를 하고 싶다면 waitKey() 대신 waitKeyEx()를 사용하면 된다.

마우스 이벤트 처리

  • OpenCV 에서 마우스 이벤트를 처리하려면 먼저 마우스 콜백 함수를 등록하고, 이후 마우스 콜백 함수에 마우스 이벤트를 처리하는 코드를 추가해야 한다.
    • OpenCv에서 특정 창에 마우스 콜백 함수를 등록할 때는 setMouseCallback() 함수를 사용한다.
    • setMouseCallback() 함수는 winname 창에서 마우스 이벤트가 발생하면 onMouse로 등록된 콜백 함수가 자동으로 호출되도록 설정한다.
    • userdata 인자에는 사용자가 마우스 콜백 함수에 전달하고 싶은 데이터를 void* 형식으로 전달할 수 있다.
    • 마우스 콜백 함수는 다음과 같이 정의되어 있다.
typedef void (*MouseCallback)(int event, int x, int y, int flags, void* userdata);
  • 마우스 콜백함수의 event 인자에는 MouseEventTypes로 정의된 열거형 상수가 전달된다.
MouseEventTypes 설명
EVENT_MOUSEMOVE 0 마우스가 창 위에서 움직임
EVENT_LBUTTONDOWN 1 마우스 왼쪽 버튼 누름
EVENT_RBUTTONDOWN 2 마우스 오른쪽 버튼 누름
EVENT_MBUTTONDOWN 3 마우스 가운데 버튼 누름
EVENT_LBUTTONUP 4 마우스 왼쪽 버튼 뗌
EVENT_RBUTTONUP 5 마우스 오른쪽 버튼 뗌 
EVENT_MBUTTONUP 6 마우스 가운데 버튼 뗌
EVENT_LBUTTONDCLICK 7 마우스 왼쪽 버튼 더블 클릭
EVENT_RBUTTONDCLICK 8 마우스 오른쪽 버튼 더블 클릭 
EVENT_MBUTTONDCLICK 9 마우스 가운데 버튼 더블 클릭
EVENT_MOUSEWHEEL 10 마우스 휠을 앞으로 돌림
EVENT_MOUSEHWHEEL 11 마우스 휠을 좌우로 돌림

 

  • 마우스 콜백함수의 flags 인자에는 MouseEventFlags 열거형 상수의 논리합이 전달된다.
MouseEventFlags 설명
EVENT_FLAG_LBUTTON 1 마우스 왼쪽 버튼이 눌려 있음
EVENT_FLAG_RBUTTON 2 마우스 오른쪽 버튼이 눌려 있음
EVENT_FLAG_MBUTTON 4 마우스 가운데 버튼이 눌려 있음
EVENT_FLAG_CTRLKEY 8 ctrl 키가 눌려있음
EVENT_FLAG_SHIFTKEY 16 shift 키가 눌려있음
EVENT_FLAG_ALTKEY 32 alt 키가 눌려있음

트랙바 사용하기

  • OpenCV에는 Window, Linux, Mac OS에서 공통으로 사용할 수 있는 트랙바(trackbar)라는 인터페이스를 제공함.
    • 트랙바는 슬라이더 컨트롤(slider control)이라고도 부르며, 영상 출력 창에 부착되어 프로그램 동작 중에 사용자가 지정된 범위 안의 값을 선택할 수 있음.
    • 트랙바는 사용자가 지정한 영상 출력 창의 상단에 부착되며, 필요한 경우 창 하나에 여러 개의 트랙바를 생성할 수 있음. 각각의 트랙바에는 고유한 이름을 지정해야 하며, 이 이름은 트랙바 왼쪽에 나타남.
    • 트랙바 위치는 사용자가 마우스를 이용하여 이동시킬 수 있고, 트랙바의 현재 위치는 트랙바 이름 옆에 함께 표시 됨.
  • OpenCV에서 트랙바를 생성하려면 createTrackbar() 함수를 이용하면 된다.
    • createTrackbar(0 함수는 winname 이름의 창에 trackbarname 이름의 트랙바를 부착하고, 트랙바가 움직일 때마다 onChange에 해당하는 트랙바 콜백 함수가 호출되도록 설정함.
    • 사용자가 트랙바 콜백 함수에 전다랗고 싶은 데이터가 있다면 userdata 인자를 통해 void* 형식으로 전달할 수 있음.
    • onChange에 지정하는 트랙바 콜백 함수는 트랙바 위치가 변경될 때 자동으로 호출되는 함수로 다음과 같이 정의되어 있음.
typedef void (*TrackbarCallback)(int pos, void* userdata);
  • 트랙바 콜백 함수의 첫 번째 인자에는 현재 트랙바의 위치 정보가 전달되고, 두 번째 인자에는 createTrackbar() 함수에서 지정한 사용자 데이터 포인터 값이 전달 됨.
  • 트랙바를 생성한 후 트랙바의 현재 위치를 알고 싶다면 getTrackbarPos() 함수를 사용하면 된다.
  • 프로그램 동작 중에 트랙바 위치를 강제로 옮기고 싶다면 setTrackbarPos()를 사용하면 된다.

OpenCV 데이터 파일 입출력

  • OpenCV에서 제공하는 FileStorage 클래스는 Mat 클래스 객체 뿐만 아니라 일반적인 C/C++ 자료형 데이터를 XML, YAML, JSON 등 파일 형식으로 저장하는 기능을 제공한다.

FileStorage 클래스

  • OpenCV에서 데이터 파일 입출력은 FileStorage가 담당하는데, FileStorage 클래스는 데이터의 파일 입출력 기능을 캡슐화하여 지원하는 클래스이다.
  • FileStorage 클래스를 이용하여 OpenCV 데이터를 저장하거나 읽어오려면 먼저 FileStorage 클래스를 생성한 후 FileStorage::open() 함수를 이용하여 실제 사용할 파일을 열어야 한다.
    • FileStorage::open() 함수의 첫 번째 인자 filename에는 데이터 파일 이름을 지정하는데, FileStorage 클래스는 XML, YAML, JSON 형식의 파일 입출력을 지원하며, 사용할 파일 형식은 filename의 확장자에 의해 자동으로 결정된다.
    • 만약 파일 이름 뒤에 .gz를 추가하면 데이터 파일을 압축하여 저장한다. 예컨대 filename을 “mydata.xml.gz”로 설정하면 XML 파일 형식으로 데이터를 저장한 후 gzip 형식으로 압축한다.
    • 두 번째 인자 flags는 파일 열기 모드를 결정하는데, FileStorage::mode 열거형 상수를 지정할 수 있다.
FileStorage::mode 열거형 상수 설명
FileStorage::READ 읽기 모드
FileStorage::WRITE 쓰기 모드 (새로 생성)
FileStorage::APPEND 추가로 쓰기 모드
FileStorage::MEMORY 논리합 연산자(|)를 이용하여 FileStorage::READ 또는 FileStorage::WRITE 상수와 함께 사용될 경우, 실제 파일 입출력 대신 메모리 버퍼를 이용한 입출력을 수행함

 

  • FileStorage::open() 이후 파일이 정상적으로 열렸는지 확인하는 함수는 FileStorage::isOpened()이다.
  • 일반적으로 FileStorage 클래스를 이용하여 파일에 데이터를 저장할 때는 << 연산자 재정의 함수를 사용하고, 파일로부터 데이터를 읽어올 때는 >> 연산자 재정의 함수를 사용한다.
  • FileStorage 객체를 이용하여 파일 입출력 작업이 완료되면 FileStorage::release() 함수를 호출해서 객체를 해제해야 한다.

데이터 파일 저장하기

  • 예제 코드
String name = "Jane";
int age = 10;
Point pt1(100, 200);
vector<int> scores = { 80, 90, 50 };
Mat mat1 = (Mat_<float>(2, 2) << 1.0f, 1.5f, 2.0f, 3.2f);

FileStorage fs("mydata.json", FileStorage::WRITE);

if (!fs.isOpened())
{
cerr << "File open failed!" << endl;
return;
}

fs << "name" << name;
fs << "age" << age;
fs << "point" << pt1;
fs << "scores" << scores;
fs << "data" << mat1;

fs.release();

데이터 파일 불러오기

  • 예제 코드
String name;
int age;
Point pt1;
vector<int> scores;
Mat mat1;

FileStorage fs("mydata.json", FileStorage::READ);

if (!fs.isOpened())
{
cerr << "File open failed!" << endl;
return;
}

fs["name"] >> name;
fs["age"] >> age;
fs["point"] >> pt1;
fs["scores"] >> scores;
fs["data"] >> mat1;

fs.release();

유용한 OpenCV 기능

마스크 연산

  • OpenCV에서는 임의의 모양을 갖는 ROI를 설정하기 위하여 일부 행렬 연산 함수에 대하여 마스크 연산을 지원한다.
    • 마스크 연산을 지원하는 OpenCV 함수는 보통 입력 영상과 크기가 같고 깊이가 CV_8U인 마스크 영상을 함께 인자로 전달 받는다.
    • 마스크 영상이 주어질 경우, 마스크 영상의 픽셀값이 0이 아닌 좌표에 대해서만 연산이 수행된다.
    • 일반적으로 마스크 영상은 사람의 눈으로도 구분이 쉽도록 픽셀 값이 0 또는 255로 구성된 흑백 영상이 사용된다.
  • Mat::setTo() 함수는 마스크 연산을 지원하는 함수로 함수의 두 번째 인자 mask에 마스크 영상을 지정할 수 있다.
    • 기본값으로 설정되어 있는 noArray()를 mask 인자로 지정하면 입력 행렬의 모든 원소 값을 value 값으로 설정하고 적절한 마스크 영상을 mask 인자로 지정하면 특정 영역에 대해서만 픽셀 값을 설정할 수 있다. 이때 마스크 영상은 Mat::setTo()를 호출하는 대상 행렬과 크기가 같아야 한다.
Mat src = imread("lenna.bmp", IMREAD_COLOR);
Mat mask = imread("mask_smile.bmp", IMREAD_GRAYSCALE);

if (src.empty() || mask.empty())
{
cerr << "Image load failed!" << endl;
return;
}

src.setTo(Scalar(0, 255, 255), mask);
  • 마스크 연산을 지원하는 또 다른 함수로 Mat::copyTo() 라는 함수가 있다.
    • 마스크 연산을 지원하는 Mat::copyTo() 함수는 mask 영상의 픽셀 값이 0이 아닌 위치에서만 *this 행렬 원소 값을 행렬 m으로 복사한다.
    • 만약 Mat::copyTo() 함수를 호출하는 *this 행렬과 인자로 전달된 m 행렬이 서로 크기 또는 타입이 같지 않을 경우, Mat::copyTo() 함수 내부에서 m.create() 함수를 호출하여 대상 영상 m을 새롭게 생성한 후 마스크 영상을 고려하여 픽셀 값을 복사한다.
    • 만약 *this 행렬과 m 행렬이 서로 크기와 타입이 같다면 m 행렬 원소 값을 그대로 유지한 상태에서 *this 행렬의 픽셀 값을 복사한다.
Mat src = imread("airplane.bmp", IMREAD_COLOR);
Mat mask = imread("mask_plane.bmp", IMREAD_GRAYSCALE);
Mat dst = imread("field.bmp", IMREAD_COLOR);

if (src.empty() || mask.empty())
{
cerr << "Image load failed!" << endl;
return;
}

src.copyTo(dst, mask);

연산 시간 측정

  • OpenCV 라이브러리는 정밀한 시간 측정 방법을 제공한다. 본래 특정 프로그램의 동작 시간을 측정하는 C/C++ 소스 코드 작성 방법은 운ㄷ영 체제마다 각기 다르지만 OpenCV 라이브러리를 이용하면 운영 체제에 상관 없이 통일된 인터페이스 함수를 사용하여 연산 시간을 측정할 수 있다.
  • OpenCV에서는 getTickCount() 함수와 getTickFrequency() 함수를 사용하여 특정 연산의 수행 시간을 측정한다.
    • getTickCount() 함수는 컴퓨터 시스템의 특정 시점부터 현재까지 발생한 틱(tick) 횟수를 반환한다. 여기서 틱 횟수는 컴퓨터 시스템에서 발생하는 클럭처럼 매우 빠르게 증가하는 성능 측정 계수를 의미하며, 컴퓨터의 성능에 따라 빠르게 증가할 수도 있고, 느리게 증가할 수도 있다.
    • 틱 횟수 차이 값은 사용하고 있는 컴퓨터의 시스템 성능에 따라 다르게 측정되므로 실제 연산 시간을 알아내기 위해서는 틱 횟수 차이를 시스템의 틱 주파수(tick frequency)로 나누는 작업이 동반되어야 한다.
    • 틱 주파수란 1초 동안 발생하는 틱 횟수를 의미하며 getTickFrequency()를 이용하여 시스템의 틱 주파수를 구할 수 있다.
int64 t1 = getTickCount();

my_func(); // do something

int64 t2 = getTickCount();
double ms = (t2 - t1) * 1000 / getTickFrequency();
  • getTickCount()와 getTickFrequency() 를 조합하는 것이 번거롭기 때문에 OpenCV 3.2.0 버전부터 연산 시간 측정을 위한 TickMeter 라는 이름의 클래스를 새롭게 제공한다.
    • 사용법은 아래와 같다.
TickMeter tm;
tm.start();

my_func(); // do something

tm.stop();
double ms = tm.getTimeMilli();

유용한 OpenCV 함수 사용법

sum() 함수와 mean() 함수

  • OpenCV에서 Mat 행렬의 원소 합을 구하고 싶을 때는 sum() 함수를 사용하고, 평균을 구하고 싶을 때는 mean() 함수를 사용한다.
    • 이 두 함수는 4채널 이하의 행렬에 대해서만 동작하며, 합과 평균을 Scalar 타입으로 반환한다.
  • mean() 함수는 마스크 연산을 지원하므로 필요한 경우 mask 영상을 지정하여 특정 영역의 원소 평균을 구할 수도 있다.
Mat img = imread("lenna.bmp", IMREAD_GRAYSCALE);

int sumVal = (int)sum(img)[0];
int meanVal = (int)mean(img)[0];

minMaxLoc() 함수

  • minMaxLoc() 함수는 행렬 또는 영상에서 최솟값, 최댓값, 그리고 최솟값과 최댓값의 위치를 찾을 때 사용한다.
    • minMaxLoc() 함수는 마스크 연산을 지원하므로 행렬 일부 영역에서의 최솟값, 최댓값과 그 위치를 구할 수 있다.
double minVal, maxVal;
Point minPos, maxPos;
minMaxLoc(img, &minVal, &maxVal, &minPos, &maxPos);

normalize() 함수

  • 행렬의 노름(norm) 값을 정규화하거나 원소 값 범위를 특정 범위로 정규화할 때 normalize() 함수를 사용한다.
  • normalize() 함수는 norm_type 인자에 따라 동작이 결정된다.
    • norm_type이 NORM_INF, NORM_L1, NORM_L2인 경우에는 \|dst\|_{L_{p}} = alpha(p = Inf, 1, 2) 수식을 만족하도록 입력 행렬 원소 값의 크기를 조정한다. 

\|dst\|_{L_{\infty}} = max_{i} |dst_{i}| = alpha

\|dst\|_{L_{1}} = \sum_{i} |dst_{i}| = alpha

\|dst\|_{L_{2}} = \sqrt{\sum_{i} dst_{i}^{2}} = alpha

  • 만약 norm_type 인자가 NORM_MINMAX인 경우에는 src 행렬의 최솟값이 alpha, 최댓값이 beta가 되도록 모든 원소 값 크기를 조절한다.
  • 많은 OpenCV 예제 코드에서 NORM_MINMAX 타입으로 normalize() 함수를 사용하고 있으며, 특히 실수로 구성된 행렬을 그레이스케일 영상 형태로 변환하고자 할 때 normalize() 함수를 사용하면 유용하다.
Mat src = Mat_<float>({1, 5}, {-1.f, -0.5f, 0.f, 0.5f, 1.f});

Mat dst;
normalize(src, dst, 0, 255, NORM_MINMAX, CV_8UC1);

cvRound() 함수

  • OpenCV에서 실수 갑의 반올림 연산을 위해 cvRound() 함수를 제공한다.
  • 이와 더불어 실수의 올림을 수행할 때는 cvCeil() 함수를 사용하고, 내림을 수행할 때는 cvFloor() 함수를 사용한다.

이상엽/ 물리적 벡터

벡터와 좌표계

평면벡터

R^{2} 에서 크기(스칼라)와 방향의 의미를 모두 포함하는 표현 도구

  • 벡터는 크기와 방향만 고려하므로 위치가 다르더라도 크기와 방향이 같으면 같은 것으로 인정한다. 고로 아래 이미지상 v와 동일한 벡터는 d가 된다.

공간벡터

R^{3} 에서 크기와 방향의 의미를 모두 포함하는 표현 도구

n차원 벡터

R^{n} 상의 벡터 v = (v_{1}, v_{2}, ... , v_{n}) = \vec{AB} = (b_{1} - a_{1}, b_{2} - a_{2}, ... , b_{n} - a_{n})

  • 영벡터 \vec{0} = 0 = (0, 0, ... , 0)
  • 두 벡터 v = (v_{1}, v_{2}, ... , v_{n}), w = (w_{1}, w_{2}, ... , w_{n}) 가 같다
    • \Leftrightarrow v_{1} = w_{1}, v_{2} = w_{2}, ... , v_{n} = w_{n}

벡터의 연산

노름

  • 벡터의 크기 (또는 길이) 라고 한다.
    • \|v\| = \sqrt{v_{1}^{2} + v_{2}^{2} + ... + v_{n}^{2}}
  • 노름이 1인 벡터를 단위벡터라고 한다.
    • 정규화: 벡터의 단위 벡터 (크기를 1)로 만드는 과정.
      • {v \over \|v\|} = \hat{v}
  • e_{1} = (1, 0, 0, ... , 0), e_{2} = (0, 1, 0, ... , 0) 등을 표준 단위벡터라고 한다.
    • 벡터를 표준단위 벡터를 이용하여 아래와 같이 표현 가능
    • v = (v_{1}, v_{2}, ... , v_{n}) = v_{1} e_{1} + v_{2} e_{2} + ... + v_{n} e_{n}

선형결합

  • 선형이라는 의미는 선으로 그려지는 것 보다는 –축소된 의미– ‘예측 가능한’ 이라는 의미로 이해하는 것이 좋다.
    • 역으로 비선형이라는 말은 ‘예측 불가능한’ (확률적인) 이라는 의미로 이해하는 것이 좋음.

벡터의 덧셈과 뺄셈

v \pm w = (v_{1} \pm w_{1}, v_{2} \pm w_{2} + ... + v_{n} \pm w_{n})

벡터의 실수배

kv = (kv_{1}, kv_{2}, ... , kv_{n})

선형(일차) 결합

R^{n} 의 벡터 w 가 임의의 실수 k_{1}, k_{2}, ... k_{r} 에 대하여

w = k_{1}v_{1}, k_{2}v_{2}, ... k_{r}v_{r} 의 형태로 쓰여지면 w v_{1}, v_{2}, ... v_{r} 의 선형(일차)결합이라 한다.

스칼라 곱

한 벡터가 다른 벡터의 방향에 대해 가한 힘에 의해 변화된 스칼라(크기), 점곱 또는 내적

  • 스칼라 결과를 얻어 내기 위한 벡터 곱
  • 점 곱(dot product) 또는 내적이라고도 한다.

v \cdot w = \|v\| \|w\| cos \theta = v{1}w_{1} + v_{2}w_{2} + ... + v_{n}w_{n}

(\theta 는 두 벡터 v, w 가 이루는 각)

  • 개념적으로 봤을 때 두 벡터의 스칼라 곱은 두 벡터의 크기를 곱한 것으로 정의한다.
  • 다만 벡터는 방향이라는 개념이 있기 때문에 단순 곱만이 아니라 추가적인 정의가 필요한데,
    • 일단 두 벡터 v, w가 같은 방향일 경우 스칼라 곱은 두 벡터의 곱으로 정의해 볼 수 있다.
      • \vec{v} \cdot \vec{w} = \|\vec{v}\| \times \|\vec{w}\|
    • 만일 두 벡터 v, w가 다른 방향일 경우, w를 v와 동일한 방향과 그렇지 않은 방향으로 분해해서 v와 곱할 수 있다.
      • 위 그림에서 w는 v와 일치하는 방향과 v와 수직인 방향으로 분해할 수 있는데, v와 일치하는 방향의 크기와 v를 곱한게 최종적인 벡터의 스칼라 곱으로 정의가 된다. (w의 크기보다 줄어드는데 이는 w의 수직 방향의 힘이 v와 같은 방향의 힘을 줄이기 때문이라고 이해할 수 있다.)
      • w를 v와 같은 방향의 벡터인 a와 v와 직교하는 방향의 벡터인 b로 분해하면 다음과 같은 수식으로 표현할 수 있다.
      • \vec{v} \cdot \vec{w} = \|\vec{v}\| \times \|\vec{a}\| = \|\vec{v}\| \times \|\vec{w}\| \times cos \theta
        • \vec{a} 의 크기는 \vec{w} 의 크기에 cos \theta 를 곱한 것과 같다.

벡터의 연산 성질

R^{n} 상의 벡터 u, v, w 와 스칼라 k, m 에 대하여 다음이 성립한다.

  • u + v = v + u
  • (u + v) + w = u + (v + w)
  • u + \vec{0} = \vec{0} + u = u
  • u + (-\vec{u}) = \vec{0}
  • k(u + v) = ku + kv
  • (k+m)u = ku + mu
  • k(mu) = (km)u
  • 1u = u
  • 0u = \vec{0}, k\vec{0} = \vec{0}
  • u \cdot v = v \cdot u
  • \vec{0} \cdot u = u \cdot \vec{0} = \vec{0}
  • u \cdot (v + w) = u \cdot v + u + \cdot w
  • (u + v) \cdot w = u \cdot w + v + \cdot w
  • k(u \cdot v) = (ku) \cdot v = u \cdot (kv)

벡터 곱

방향은 두 벡터에 동시에 수직이고 크기는 두 벡터의 평행사변형의 면적인 R^{3} 상의 벡터, 가위곱, 또는 외적

  • 벡터 결과를 얻어 내기 위한 벡터 곱
    • 같은 맥락에서 텐서 결과를 얻어 내기 위한 벡터 곱은 텐서 곱이라고 한다.
  • 가위 곱(cross product) 또는 외적 이라고도 한다.
    • 사실 외적이라는 표현은 적절하지 못한 표현인데, 텐서 곱이 외적이기 때문.
  • 벡터 곱은 오로지 3차원에서만 정의 되며, 2차원, 4차원 이상에서 정의 불가.
    • 반면 스칼라 곱은 N 차원에 대해 정의 가능.

v \times w = ( \left| \begin{array}{rr} v_{2} & v_{3} \\ w_{2} & w_{3} \end{array} \right|, -\left| \begin{array}{rr} v_{1} & v_{3} \\ w_{1} & w_{3} \end{array} \right|, \left| \begin{array}{rr} v_{1} & v_{2} \\ w_{1} & w_{2} \end{array} \right| )

  • 벡터 곱의 크기는 두 벡터의 크기의 곱이 되고 (평행사변형의 면적), 방향은 두 벡터에 동시에 수직인 방향이 된다.
    • 벡터 곱은 순서가 중요한데, 순서에 따라 벡터 곱의 방향이 바뀐다.
    • 위 예시에서 v \times w 는 위로, w \times v 는 아래로 가는 벡터가 된다.
  • 벡터 곱 연산은 두 벡터의 행렬식으로 계산된다.

벡터 곱의 성질

R^{3} 상의 벡터 u, v, w 와 스칼라 k 에 대하여 다음이 성립한다.

  • u \times v = -(v \times u)
    • 벡터 곱 순서를 바꾸면 방향이 반대가 된다.
  • u \times (v + w) = (u \times v) + (u \times w)
  • (u + v) \times w = (u \times w) + (v \times w)
  • k(u \times v) = (ku) \times v = u \times (kv)
  • u \times \vec{0} = \vec{0} \times u = \vec{0}
  • u \times u = \vec{0}
    • 자기 자신과 벡터 곱을 하면 영벡터가 된다.

벡터의 응용

직선의 표현

R^{2} 또는 R^{3} 에서 위치벡터가 a 인 점 A 를 지나며 방향벡터가 v 인 직선 상의 임의의 점 X 의 위치벡터 x

x = a + kv

을 만족한다. (단, k 는 임의의 실수)

  • 직선의 방정식이 아니라 벡터 –위치벡터와 방향벡터– 를 통해서도 직선을 표현할 수 있다는 뜻.
    • 위치벡터란 원점을 시점으로 하는 벡터를 뜻한다.
    • 방향벡터란 직선이 늘어나는 방향을 지시하는 벡터를 뜻한다.
  • y = x + 2 라는 직선의 방정식을 벡터를 이용해서 표현하면 (x, y) = (-1+k, 1+k) 의 꼴이 된다.

평면의 표현

R^{3} 에서 위치벡터가 a 인 점 A 를 지나며 법선벡터가 v 인 평면 상의 임의의 점 X 의 위치벡터 x

(x - a) \cdot v = 0

을 만족한다. 

  • 법선벡터는 평면상의 서로 다른 두 직선의 방향벡터들의 벡터 곱으로써 구하면 용이하다.
    • 법선벡터란 평면에 수직인 벡터를 뜻한다.

  • x - 2 + y + z = 0 라는 평면의 방정식을 벡터를 이용해서 표현하면 (x-2, y, z) 의 꼴이 된다.

19.09.15

뇌의 백업방식은 뉴런에 ‘중복저장’

이것은 어떤 사람이 길고 복잡한 이야기를 예컨대 5명에게 설명하는 것에 비유할 수 있다. 후에 다섯 명 중 한 사람 이이야기를 잊어버렸을 경우라도, 다른 사람이 기억하고 있을 수 있다. 

곤잘레스 박사는 “그 이야기를 다시 할 때마다 새로운 친구들을 데려오면, 원래의 이야기를 보존하고 기억을 강화하는 데 도움을 준다. 비슷한 방법으로 신경세포도 시간이 지나도 잘 기억할 수 있도록 서로 돕는다.”고 말했다.

나는 뇌란 정보 네트워크의 구현체라고 믿고, 뇌에서 사용하는 방식은 모든 네트워크에 통요오디는 것이라 믿는다. 하나의 정보를 하나의 노드(뉴런)이 아니라 여러 노드(뉴런)이 협력해서 다룬다는게 정보 네트워크의 기본 사양일 것이라 생각 함.

망각이란 무엇인가

지난 10년 동안 밝혀진 사실들은 망각이 수동적으로 잃어나는 현상이 아님을 보여줍니다. 오히려, 망각은 뇌에서 일상적으로 일어나는 능동적인 활동의 결과입니다. 어쩌면 거의 모든 동물은 기본적으로 능동적인 망각 기능을 활성화한 상태일 수 있습니다. (중략)

하지만 이에 비해 뇌가 어떻게 기억을 잊는지에 대해서는 오랜 시간동안 누구도 관심을 가지지 않았습니다. 캠브리지 대학의 인지 뇌과학자인 마이클 앤더슨은 이를 일리있는 지적이라 이야기합니다. “기억 능력이 있는 모든 생명체는 망각 능력 또한 가지고 있습니다. 여기에 어떠한 예외도 없습니다. 아주 작은 유기체라도 마찬가지입니다. 경험에서 교훈을 얻는 생명체는, 그 교훈을 잊을 수 있습니다. 그런 면에서, 나는 뇌과학자들이 망각을 그저 부수적인 현상으로 생각했다는 것이 무척 놀랍습니다.”

“진화는 기억의 미덕과 망각의 미덕 사이에 우아한 균형을 만들었습니다. 이는 영속성과 탄력성 사이의 균형인 동시에 불필요한 것을 제거할 수 있는 능력입니다.” 앤더슨의 말입니다.

놀라운 이야기. 정보는 편평하지 않으며, 정보에서 핵심을 차지하는 부분은 따로 있다. 우리는 그 나머지 불필요한 부분을 굳이 기억해서 에너지를 소모할 필요가 없고, 핵심 부분만을 추려서 일반화하면 보다 올바른 모형을 만들 수 있기 때문에 망각을 능동적으로 하는게 아닐까?

망각이 안 되면 (일반 모형을 만들 수 없기 때문에) 예측이 안 된다.

왜 “큰 언어”의 문법이 덜 복잡할까?

하지만 수많은 언어를 체계적으로 비교한 언어학자들은 이 통념과 반대되는 결론에 이르렀습니다. 이른바 “큰 언어”, 그러니까 넓은 지역에서 많은 사람들이 사용하는 언어가 소수의 고립된 집단이 사용하는 언어보다 단순하다는 것이죠. 이러한 결론이 나온 것은 언어학자들이 어휘보다는 문법에 집중했기 때문이기도 합니다. (중략)

2010년 수천 개의 언어를 대상으로 한 한 연구는 “작은 언어”의 단어에 이처럼 다양한 변화형이 더 많다는 사실을 밝혀내습니다. 반대로 영어나 표준 중국어와 같은 “큰 언어”는 단어의 변화형이 그리 많지 않습니다. 그 이유는 정확히 알 수 없지만, 언어가 넓은 지역에 걸쳐 널리 쓰이기 때문이라는 설이 유력합니다.

재미있는 이야기. 아무래도 널리 쓰여져야 하다보니 배우기가 쉬워야 하고, 덕분에 문법 구조가 단순해진게 아닐까?

말이 빠른 언어는 정보 효율도 좋을까

각 언어의 원어민들이 말하는 속도에서도 큰 차이가 난다. 말이 빠른 이탈리아 사람들은 초당 9음절을 발음한다. 비교적 또박또박 말하는 독일인들의 발음 속도는 초당 5~6 음절 정도라고 한다. 그렇다면 말이 빠른 언어를 쓰는 사람들은 다른 언어를 쓰는 사람들보다 더 빨리 정보를 주고받는 것일까? 그렇지 않다는 연구 결과가 나왔다. 말하는 속도는 언어마다 다르지만, 정보를 전달하는 속도는 거의 똑같다는 것이다.

의문을 풀기 위해 프랑스, 한국 등 4개국 공동연구진은 한국어를 비롯해 영어, 이탈리아어, 일본어, 베트남어 등 9개 언어군 17개 언어로 작성한 문서를 이용해, 말하는 속도와 정보 전달 속도의 관계를 측정했다. 이는 언어의 정보 밀도와 관련이 있다. 앞서 2011년 <랭귀지 매거진>에 발표된 7개 언어(영어 프랑스어 독일어 이탈리아어 일본어 만다린어 스페인어) 비교 연구 결과를 보면, 일본어는 정보 밀도가 가장 낮다. 이는 같은 양의 정보를 전달할 때 다른 언어보다 더 말을 많이 해야 한다는 걸 뜻한다. 영어는 일본어보다 정보 밀도가 두배나 높다. 반면 음절 속도(1초당 발음하는 음절 수)는 일본어가 가장 빠르다. 정보 밀도가 낮은 언어는 좀더 빨리 말하는 경향이 있다는 얘기다.

지난 4일 공개 과학저널 <사이언스 어드밴시스>(Science Advances)에 발표된 논문을 보면, 연구진은 이번 연구에서 각 언어의 정보 밀도를 비트 단위로 계산했다. 언어의 정보성은 보통 음절 단위로 계산하는데, 이를 비트로 표현하는 것. 언어에서의 1비트는 정보의 불확실성을 반으로 줄이는 정보량을 가리키는 개념이다. 예를 들어 한 음절을 입 밖으로 말했다고 치자. 이 음절을 말함으로써 내가 가리킬 수 있는 사물의 범위가 사물 전체에서 그 절반으로 줄었다면, 그 음절은 1비트의 정보를 전달하는 것이 된다.

재미있는 내용. 결론적으로 보면 언어가 가진 정보량이 낮기 때문에 같은 정보를 전달하기 위해 더 많은 말을 했고, 그 결과 말이 빨라졌다는 이야기. 전세계 언어에 대해서는 잘 모르지만 좀 더 미루어 짐작해 보면 정보 밀도가 낮은 언어는 말을 빨리 하기 위해 발음이 좀 더 평탄할까?

같은 경험을 해도 남녀 기억은 왜 다를까

이와 관련해 지금까지 발표된 많은 심리학 연구들이 대체로 여성의 기억력이 남성보다 높다는 발견을 보고해왔다. 그렇다고 모든 종류의 기억력이 여성에게서 높게 나타나는 것은 아니다. 여성은 ‘언어 기억’(verbal memory)이 남성에 비해 뛰어나다고 한다. 언어 처리 능력이 언어와 의미부여와 관련한 기억에 큰 영향을 끼치기 때문에, 과거의 사건과 사물 등을 여성이 더 잘 기억할 수 있다는 것이다. (중략)

일부 과학자들은 남녀가 같은 정보를 서로 다르게 받아들이고 처리하는 이유를 서로 다른 뇌 연결망의 특성에서 찾기도 한다. 2014년 미국 펜실베이니아대학 라기니 베르마(Ragini Verma) 교수 연구팀은 여성 뇌에서는 좌뇌와 우뇌의 상호 연결이 발달한 데 반해 남성 뇌에서는 좌뇌와 우뇌 각각의 내부 연결이 발달하는 특징이 나타난다고 보고했다. 이는 여성은 언어와 같은 특정 정보를 양쪽 뇌를 모두 써서 처리하며 남성은 한쪽 뇌를 주로 사용하는 경향이 있음을 의미한다. 이런 뇌 연결성의 특성 차이 때문에 여성은 뛰어난 언어 능력과 의미부여 능력을 지니고 이를 기억 과정에 적극 활용할 수 있다는 얘기다. (중략)

다른 한편으로, 예전부터 여성이 우월한 기억력을 갖고 있다는 연구 결과가 이어진 것은 그동안 연구자들 사이에서 비교적 쉽고 정확하게 측정할 수 있는 연구 대상으로 ‘언어와 의미화에 의존하는 기억들’이 주목받아왔기 때문일 수도 있다. 측정 방법이 확립되지 않은 다른 종류의 정보 또한 인간의 기억 형성에 중요하게 작용할 수 있으며, 이를 밝힌다면 남녀의 기억 차이에 대한 새로운 시각을 얻을지도 모른다.

흥미로운 내용이 많아서 정리. 남녀의 신체적 차이가 분명한 만큼 남녀 뇌의 구조나 기능이 다른 것은 매우 자연스러운 일이다. 그것을 부정하는 것은 오히려 현실을 부정하는 것. 

남녀의 분업 –남자는 사냥을 나가고, 여자는 채집하면서 공동체와 육아를 담당– 의 차이로 남녀의 두뇌가 그 분업된 환경에 맞게 적응된 것이 올바른 설명이겠지. 역할이 다른데 차이가 없다는게 더 이상하잖아? 차이가 없으면 남자도 임신할 수 있어야지.

‘휴면 상태’ 뇌 줄기세포도 되살릴 수 있다

한때 의학계의 논란거리였던 적도 있지만, 인간의 뇌에도 줄기세포가 생겨나 새로운 신경세포(뉴런)를 계속해서 만들어낸다는 게 현재의 정설이다.

그러나 이런 줄기세포는, 줄기세포의 재생과 분화를 신호로 제어하는 뇌의 특정 영역에만 존재한다. 게다가 나이가 들면 뇌 줄기세포의 활동성이 점차 떨어지다가 결국 ‘휴지 상태’에 들어가는데 지금까지 그 이유는 밝혀지지 않았다.

스위스 바젤대 의대의 페르돈 타일로어 줄기세포 생물학 교수팀이 뇌 줄기세포의 분열을 제어하는 신경 신호 경로를 발견해 저널 ‘셀(Cell)’에 연구 보고서를 발표했다. (중략)

뇌가 노화하면 노치2-Id4 신호전달 경로가 ‘활동 항진(hyperactivity)’ 상태로 바뀌어, 줄기세포 활동과 뉴런 생성을 강력히 억제하는 ‘분자 브레이크(molecular brake)’처럼 작용했다.

반대로 이 경로가 비활성 상태로 전환하면 분자 브레이크가 풀려, 늙은 생쥐의 뇌에도 새로운 뉴런이 생성됐다.

이런 결과는, 포유류 뇌의 줄기세포가 ‘휴지 상태’로 전환해도, 노치2-Id4 신호전달 경로를 제어하면 ‘활동 상태’로 되돌릴 수 있다는 걸 시사한다. 똑같이 이 경로를 조작하면 새로운 뉴런의 생성도 자극할 수 있을 것으로 연구팀은 기대한다.

신기한 내용이라 정리. 근데 왜 노화가 되면 뉴런 생성을 억제할까? 노화가 되면 에너지 소모를 아끼기 위해 마치 멍게가 그러하듯 뇌에 들어가는 에너지를 줄이기 위해 뉴런 생성을 억제 하는 것일까?

동성애 결정하는 ‘단일 유전자’는 없다

연구팀은 동성애 성향과 연관성이 강한 5개 변이유전자를 새로 찾아냈다.

이 변이유전자들은 오로지 동성과만 성관계를 갖는다고 대답한 사람과 대부분 이성과 성관계를 갖지만, 동성과 성관계를 가질 때도 있다고 대답한 사람들이 공통적으로 가지고 있었다.

이 밖에 지금까지 발견된 것을 포함해 수천 개의 동성애 관련 변이유전자들이 환경적 요인과 상호작용을 통해 동성애 성향을 유도하는 것으로 보이지만 누가 동성애자가 될 것인지를 예측할 수 있는 결정적 변이유전자는 없었다고 연구팀은 밝혔다.

유전자로 개개인의 성적 성향을 예측한다는 것은 사실상 불가능하지만, 유전자가 동성애에 상당히 중요한 역할을 하는 것만은 사실이라고 닐 박사는 설명했다.

키도 유전적으로 결정되지만, 키를 결정하는 단일 유전자는 없다. 나는 이것이 비단 지능, 키, 동성애 뿐만 아니라 대단히 많은 성향이 공통적일 것이라 생각하며, 이것은 네트워크 구조를 갖는 모든 것들이 같은 원리를 갖고 있으리라 생각한다. 다만 아직 아무도 그 ‘원리’가 무엇인지 모를 뿐.

온라인 통한 결혼이 이혼율 더 낮아

이 연구에서는 온라인에서 배우자를 만난 커플들이 헤어지는 비율이 오프라인에서 만난 커플들보다 25% 낮은 것으로 조사됐다. 연구진은 온라인 데이트앱이 오프라인에 비해 훨씬 많은 잠재적 배우자 후보군을 제안해 더 많은 가능성과 선택권을 제공하기 때문일 것이라고 설명했다. (중략)

드렉슬러 박사는 온라인 데이트 사이트 이용자를 5년간 연구해온 사회학자 제스 카비노의 발견도 소개했다. 카비노는 “온라인 데이트를 하는 사람들은 오프라인 관계에 비해 훨씬 바람 피는 경향이 많다는 것을 발견했다. 배우자 아닌 다른 사람도 쉽게 만날 수 있다는 점 때문”이라며 “온라인 데이트는 정착된 게 아니라 여전히 ‘학습중’”이라고 말했다.

신기하군 하고 읽어보니 마지막 연구 내용은 전혀 이상한데? 상호 합의 하에 바람을 피는 것도 아니고, 바람 피는데 이혼율은 낮다니?

OpenCV 4로 배우는 컴퓨터 비전과 머신 러닝/ OpenCV 주요 클래스

  • (각 자료형의 상세한 파라미터에 대해서는 이전의 <OpenCV로 배우는 영상처리 및 응용>에서 정리하였으므로 생략)

기본 자료형 클래스

Point_ 클래스

  • Point_ 클래스는 2차원 평면 위에 있는 점의 좌표를 표현하는 템플릿 클래스
  • 2차원 좌표를 나타내는 x와 y라는 이름의 멤버변수를 갖고 있다.
// 생성 및 초기화
Point pt1; // pt1 = (0, 0)
pt1.x = 5; pt1.y = 10; // pt1 = (5, 10)
Point pt2(10, 30); // pt2 = (10, 30)

// 연산
Point pt3 = pt1 + pt2; // pt3 = [15, 40]
Point pt4 = pt1 * 2; // pt4 = [10, 20]
int d1 = pt1.dot(pt2); // d1 = 350
bool b1 = (pt1 == pt2); // b1 = false

Size_ 클래스

  • 영상 또는 사각형의 크기를 표현하는 클래스.
  • 사각형 영역의 가로와 세로 크기를 나타내는 width, height 멤버 변수를 갖고 있다.
// 생성 및 초기화
Size sz1, sz2(10, 20);  // sz1 = [0 x 0], sz2 = [10 x 20]
sz1.width = 5; sz1.height = 10;  // sz1 = [5 x 10]

// 연산
Size sz3 = sz1 + sz2;  // sz3 = [15 x 30]
Size sz4 = sz1 * 2;  // sz4 = [10 x 20]
int area1 = sz4.area();  // area1 = 200

Rect_ 클래스

  • 사각형의 위치와 크기를 표현하는 클래스
  • 사각형의 좌측 상단 점의 좌표를 나타내는 x, y와 가로 세로 크기를 나타내는 width, height 멤버 변수를 갖고 있다.
// 생성 및 초기화
Rect rc1;  // rc1 = [0 x 0 from (0, 0)]
Rect rc(10, 10, 60, 40);  // rc2 = [60 x 40 from (10, 10)]

// 연산
Rect rc3 = rc1 + Size(50, 40);  // rc3 = [50 x 40 from (0, 0)]
Rect rc4 = rc2 + Point(10, 10);  // rc4 = [60 x 40 from (20, 20)]

// 논리연산
Rect rc5 = rc3 & rc4; // rc5 = [30 x 20 from (10, 10)]
Rect rc6 = rc3 | rc4; // rc6 = [80 x 60 from (0, 0)]

RotatedRect 클래스

  • 회전된 사각형을 표현하는 클래스
  • 사각형의 중심 좌표를 나타내는 center, 가로 및 세로 크기를 나타내는 size, 회전 각도를 나타내는 angle 멤버 변수를 갖고 있다.
// 생성 및 초기화
RotatedRect rr1(Point2f(40, 30), Size2f(40, 20), 30.f);  // 아래 그림 a 참조

// 사각형의 바운딩 영역 확인
Rect br = rr1.boundingRect();  // 아래 그림 b 참조

Range 클래스

  • 범위 또는 구간을 표현하는 클래스.
  • 범위의 시작과 끝을 나타내는 start와 end 멤버 변수를 갖고 있다.
// 생성 및 초기화
Range r1(0, 10);

String 클래스

  • 문자열을 다루는 클래스
  • 본래 OpenCV에서는 자체적인 String을 정의하여 사용하였음. String 클래스는 std::string 클래스와 완전히 호환되도록 설계되어서 std::string 클래스를 다루는 방식과 유사하게 사용할 수 있었음.
  • 그러다가 OpenCV 4.0 버전부터는 자체적인 String 클래스를 삭제하고 C++ 표준 라이브러리의 std::string 클래스를 String 클래스로 재정의함.
// 생성 및 초기화
String str1 = "Hello";
String str2 = "world";
String str3 = str1 + " " + str2;  // str3 = "Hello world";

bool ret = (str2 == "WORLD");  // ret = false, == 연산자는 대소문자를 구분하므로

Mat 클래스

Mat 클래스 개요

  • Mat 클래스는 일반적인 2차원 행렬뿐만 아니라 고차원 행렬을 표현할 수 있으며, 한 개 이상의 채널(channel)을 가질 수 있음.
  • Mat 클래스에는 정수, 실수, 복소수 등으로 구성된 행렬 또는 벡터(vector)를 저장할 수 있고, 그레이스케일 또는 컬러 영상을 저장할 수도 있음.
  • 경우에 따라 벡터 필드(vector field), 포인트 클라우드(point cloud), 텐서(tensor), 히스토그램(histogram) 등 정보를 저장하는 용도로 사용 됨.
  • Mat 클래스에서 행렬이 어떤 자료형을 사용하는지에 대한 정보를 깊이(depth)라고 하는데, OpenCV에서 Mat 행렬의 깊이는 다음과 같은 형식의 매크로 상수를 이용하여 표현 함.
CV_<bit_depth>{U|S|F}
  • 깊이 표현 매크로 상수 형식의 처음에 나타나는 CV_는 OpenCV를 나타내는 접두사
  • 그 뒤의 <bit_depth>에는 8, 16, 32, 64의 숫자를 지정할 수 있으며, 이는 원소 값 하나의 비트 수를 나타냄
  • 그 다음의 {U|S|F} 부분에는 U, S, F 세 문자 중 하나를 지정할 수 있는데, U는 부호 없는 정수형, S는 부호 있는 정수형, F는 부동 소수형을 의미함
  • OpenCV 라이르러리는 행렬의 깊이 표현을 위해 다음과 같은 매크로 상수를 정의하여 사용함
#define CV_8U  0  // uchar, unsigned char
#define CV_8S  1  // schar, signed char
#define CV_16U 2  // ushort, unsigned short
#define CV_16S 3  // signed short
#define CV_32S 4  // int
#define CV_32F 5  // float
#define CV_64F 6  // double
#define CV_16F 7  // float16_t
  • Mat 행렬 원소는 하나의 값을 가질 수도 있고, 여러 개의 구성된 값을 가질 수도 있다.
  • Mat 행렬 원소를 구성하는 각각의 값을 채널(channel)이라고 한다.
    • 즉, Mat 행렬은 하나의 채널을 가질 수도 있고, 여러 개의 채널을 가질 수도 있다.
    • 이때 하나의 행렬을 구성하는 각 채널은 모두 같은 자료형을 사용해야 함.
  • OpenCV에서는 Mat 행렬의 깊이 정보와 채널 수 정보를 합쳐서 Mat 객체의 타입(type)이라고 부른다. OpenCV 행렬의 타입은 다음과 같은 형식의 매크로 상수로 표현한다.
CV_<bit_depth>{U|S|F}C(<number_of_channels>)
  • 즉, Mat 행렬의 깊이 표현 매크로 뒤에 C1, C3 같은 채널 정보가 추가로 붙어 있는 형태이다.
    • 예컨대 CV_8UC1 타입은 8비트 unsigned char 자료형을 사용하고 채널이 한 개인 행렬 또는 영상을 의미한다.
    • B, G, R 세 개의 색상 성분을 가지고 있는 컬러 영상은 unsigned char 자료형을 사용하고 세 개의 채널을 가지고 있기 때문에 CV_8UC 타입이다.
    • 복소수처럼 두 개의 실수 값을 사용하는 행렬은 CV_32FC2 타입으로 만들 수 있다.

행렬의 생성과 초기화

// 생성 및 초기화
Mat img1;
Mat img2(480, 640, CV_8UC1);
Mat img3(480, 640, CV_8UC3);  // unsigned char, 1-channel
Mat img4(Size(640, 480), CV_8UC3);  // unsigned char, 3-channels
  • 행렬의 크기와 타입을 지정하여 Mat 객체를 생성하는 경우 Mat 행렬의 모든 원소는 쓰레기값(garbage value)이라고 부르는 임의의 값으로 채워지게 된다. 고로 모든 원소 값을 특정 값으로 초기화하여 사용하는 것이 안전하다.
Mat img5(480, 640, CV_8UC1, Scalar(128));  // initial values, 128
Mat img6(480, 640, CV_8UC3, Scalar(0, 0, 255));  // initial values, red
  • 새로운 행렬을 생성할 때 모든 원소 값을 0으로 초기화하는 경우가 많기 때문에 OpenCV에서는 모든 원소가 0으로 초기화된 행렬을 만드는 함수로써 Mat::zeros()를 제공한다.
Mat mat1 = Mat::zeros(3, 3, CV_32SC1);  // 0's matrix
  • 비슷하게 행렬의 모든 원소가 1로 초기화된 행렬을 생성하려면 Mat::ones()를 이용하면 되고, 단위 행렬(identity matrix)를 생성하려면 Mat:eye() 함수를 이용하면 된다.
Mat mat2 = Mat::ones(3, 3, CV_32FC1);  // 1's matrix
Mat mat3 = Mat::eye(3, 3, CV_32FC1);  // identity matrix

mat1 = \left[ \begin{array}{rrr} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array} \right]

mat2 = \left[ \begin{array}{rrr} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \end{array} \right]

mat3 = \left[ \begin{array}{rrr} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{array} \right]

  • Mat 객체를 생성할 떄, 행렬 원소를 저장할 메모리 공간을 새로 할당하는 것이 아니라 기존에 이미 할당되어 있는 메모리 공간의 데이터를 행렬 원소 값으로 사용할 수 있다.
    • 이는 외부 메모리 공간을 참조하는 방식이기 때문에 객체 생성이 빠르다는 장점이 있다. 이러한 용도의 Mat 클래스 생성자 형식은 다음과 같다.
float data[] = { 1, 2, 3, 4, 5, 6 };
Mat mat4(2, 3, CV_32FC1, data);
  • 외부 배열을 행렬 원소 값으로 사용하는 경우 외부 배열 크기와 생성할 행렬 원소 개수는 같아야 하고, 서로 사용한느 자료형도 같아야 한다.
    • 위와 같은 코드의 경우 mat4 행렬의 1행은 data 배열의 처음 세 개의 원소로 채워지고, 2행은 data 배열의 나머지 원소로 채워진다.

mat4 = \left[ \begin{array}{rrr} 1 & 2 & 3 \\ 4 & 5 & 6 \end{array} \right]

  • 사용자가 지정한 원소 값을 이용하여 Mat 객체를 생성하는 방법 중에 Mat_ 클래스를 사용하는 방법도 종종 사용된다. Mat_ 클래스는 Mat 클래스를 상속하여 만든 템플릿 클래스로 Mat_ 클래스 객체와 Mat 객체는 상호 변환이 가능하다.
    • 그런데 Mat_ 클래스는 << 연산자와 , 를 이용하여 간단하게 행렬 원소 값을 설정하는 인터페이스를 제공한다.
    • 그래서 일단 Mat_ 객체를 만들어서 << 연산자로 행렬을 지정한 후 이를 Mat 객체로 변환하여 사용하기도 한다.
Mat_<float> mat5_(2, 3);
mat5_ << 1, 2, 3, 4, 5, 6;
Mat mat5 = mat5_;

// 다음과 같이 한 줄로도 표현 가능
Mat mat5 = (Mat_<float>(2, 3) << 1, 2, 3, 4, 5, 6);

mat5 = \left[ \begin{array}{rrr} 1 & 2 & 3 \\ 4 & 5 & 6 \end{array} \right]

  • OpenCV 4.0에서는 C++ 11의 초기화 리스트(initializer list)를 이용한 행렬 초기화 방법을 사용할 수 있다.
    • Mat 클래스 또는 Mat_ 클래스의 생성자에 행렬 크기와 초깃값을 중괄호를 이용한 리스트 형태로 전달하는 방식.
    • 다만 생성된 Mat 객체의 타입을 명시적으로 지정하기 위해 Mat_ 클래스 형식으로 생성한 후 Mat 타입으로 변경하는 것이 좋다.
Mat mat6 = Mat_<float>({2, 3}, {1, 2, 3, 4, 5, 6});
  • 비어 있는 Mat 객체 또는 이미 생성된 Mat 객체에 새로운 행렬을 할당하려면 Mat 클래스의 Mat::create() 멤버 함수를 사용할 수 있다.
    • 이미 행렬 데이터가 할당되어 있는 Mat 객체에서 Mat::create() 함수를 호출할 경우, 만약 Mat::create() 함수의 인자로 지정한 행렬 크기와 타입이 기존 행렬과 모두 같으면 Mat::create() 함수는 별다른 동작을 하지 않고 그대로 함수를 종료한다.
    • 반면 새로 만들 행렬의 크기 또는 타입이 기존 행렬과 다른 경우, Mat::create() 함수는 일단 기존 메모리 공간을 해제한 후 새로운 행렬 데이터 저장을 위한 메모리 공간을 할당한다.
mat4.create(256, 256, CV_8UC3);  // 256 x 256, uchar, 3-channels
mat5.create(4, 4, CV_32FC1);  // 4 x 4, float, 1-channels
  • Mat:create() 함수는 새로 만든 행렬의 원소 값을 초기화하는 기능이 없기 때문에 행렬을 생성한 후 행렬 전체를 초기화하고 싶다면 = 연산자 재정의 또는 Mat::setTo() 멤버 함수를 이용하여 행렬 전체 원소 값을 한꺼번에 설정할 수 있다.
    • Mat:setTo() 함수는 두 개의 인자를 가지고 있지만 두 번째 인자 mask는 기본값을 가지고 있으므로 생략할 수 있다.
mat4 = Scalar(255, 0, 0);
mat5.setTo(1.f); 

행렬의 복사

  • Mat 클래스 객체에 저장된 영상 또는 행렬을 복사하는 가장 간단한 방법은 복사 생성자 또는 대입 연산자를 사용하는 방법이다.
Mat img1 = imread("dog.bmp");

Mat img2 = img1;  // 복사 생성자 - 얕은 복사

Mat img3;
img3 = img1; // 대입 연산자 - 얕은 복사
  • 만일 복사본 영상을 새로 생성할 때 픽셀 데이터를 공유하는 것이 아니라 메모리 공간을 새로 할당하여 픽셀 데이터 전체를 복사하고 싶다면 Mat::clone() 또는 Mat::copyTo() 함수를 사용해야 한다.
    • Mat::clone() 함수는 자기 자신과 동일한 Mat 객체를 완전히 새로 만들어서 반환한다. 
    • Mat::copyTo() 함수는 인자로 전달된 m 행렬에 자기 자신을 복사한다. 만약 Mat::copyTo() 함수를 호출한 행렬과 인자로 전달된 행렬 m이 서로 크기와 타입이 같으면 원소 값 복사만 수행한다.
    • 반면 서로 크기 또는 타입이 다르면 Mat::copyTo() 함수 내부에서 행렬 m을 새로 생성한 후 픽셀 값을 복사한다.
Mat img4 = img1.clone();  // 깊은 복사

Mat img5;
img1.copyTo(img5);  // 깊은 복사

부분 행렬 추출

  • Mat 클래스로 정의된 행렬에서 특정 사각형 영역의 부분 행렬을 추출하고 싶을 때는 Mat 클래스에 저으이된 괄호 연산자 재정의를 사용한다.
Mat img1 = imread("cat.bmp");
Mat img2 = img1(Rect(220, 120, 340, 240)); // 220, 120 좌표부터 340 x 240 크기만큼의 사각형 부분 영상 추출
  • 부분 영상 추출은 얕은 복사이기 때문에 부분 영상을 추출한 후 부분 영상의 픽셀 값을 수정하면 원본 영상의 픽셀 값도 함께 변경 됨.
  • 영상의 반전은 Mat 클래스 타입의 변수 앞에 ~ 연산자를 붙이는 방식으로 할 수 있다.
img2 = ~img2;
  • Mat 클래스의 부분 영상 참조 기능은 입력 영상에 사각형 모양의 관심 영역 (ROI, Region Of Interest)을 설정하는 용도로 사용할 수 있다. 
    • ROI는 영상의 전체 영역 중에서 특정 영역에 대해서만 영상 처리를 수행할 때 설정하는 영역을 의미한다.
    • 사각형이 아닌 임의의 모양의 ROI를 설정하고 싶은 경우에는 마스크 연산을 응용할 수 있다.
  • 만약 독립된 메모리 영역을 확보하여 부분 영상을 추출하고자 한다면 괄호 연산자 뒤에 Mat::clone() 함수를 사용하면 된다.
Mat img3 = img1(Rect(220, 120, 340, 240)).clone();
  • Mat 행렬에서 특정 범위의 행을 추출하고자 할 때는 Mat::rowRange()를 이용하며 특정 열을 추출하고자 할 때는 Mat:colRange() 함수를 사용할 수 있다.
    • 행 또는 열의 범위는 두 개의 int 값으로 지정할 수도 있고, Range 클래스 객체를 이용하여 지정할 수도 있다.
    • 하나의 행 또는 열을 추출하여 1행짜리 또는 1열짜리 행렬을 만들고자 할때는 Mat::row() 또는 Mat::col() 함수를 사용할 수 있다.
  • Mat::rowRange(), Mat::colRange(), Mat::row(), Mat::col() 함수들은 모두 부분 행렬을 얕은 복사 형태로 반환한다.
    • 따라서 깊은 복사를 수행하려면 Mat::clone() 함수를 함께 사용해야 한다.

행렬의 원소 값 참조

Mat::at() 함수 사용 방법

  • OpenCV에서 제공하는 가장 직관적인 행렬 원소 접근 방법은 Mat::at() 멤버 함수를 사용하는 방법이다.
    • Mat::at() 함수는 보통 행과 열을 나타내는 두 개의 정수를 인자로 받아 해당 위치의 행렬 원소 값을 참조 형식으로 반환한다.
    • Mat::at() 함수는 템플릿 함수로 정의되어 있기 때문에 Mat::at() 함수를 사용할 때는 행렬 원소 자료형을 명시적으로 지정해야 한다.
Mat mat1 = Mat::zeros(3, 4, CV_8UC1);

for (int j = 0; j < mat1.rows; j++)
{
for (int i = 0; i < mat.cols; i++)
{
mat1.at<uchar>(j, i)++;
}
}
  • 위 코드에서 Mat::at() 함수가 참조하는 행렬 원소 위치는 아래 그림과 같다.

Mat::ptr() 함수 사용 방법

  • Mat:ptr() 함수는 Mat 행렬에서 특정 행의 첫 번째 원소 주소를 반환한다.
    • Mat::ptr() 함수도 템플릿으로 정의되어 있기 때문에 행렬 원소의 자료형을 명시적으로 지정해야 한다.
    • Mat::ptr() 함수는 지정한 자료형의 포인터를 반환하며, 이 포인터를 이용하여 지정한 행의 원소에 접근할 수 있다.
for (int j = 0; j < mat1.rows; j++)
{
uchar* p = mat1.ptr<uchar>(j);

for (int i = 0; i < mat.cols; i++)
{
p[i]++;
}
}

MatIterator_ 반복자 사용 방법

  • Mat 클래스와 함께 사용할 수 있는 반복자 클래스 이름은 MatIterator_ 이다.
    • MatIterator_ 클래스는 템플릿으로 정의된 클래스이므로 Mat 행렬 타입에 맞는 자료형을 명시하여 사용해야 한다.
    • MatIterator_ 클래스를 사용하는 방식은 C++의 반복자 사용 방법과 유사하다. Mat::begin() 함수를 이용하여 행렬의 첫 번째 원소 위치를 얻을 수 있고, Mat::end() 함수를 이용하여 마지막 원소 바로 다음 위치를 얻을 수 있다.
  • MatIterator_ 반복자를 사용하면 행렬의 가로, 세로 크기에 상관없이 모든 원소를 안전하게 방문할 수 있지만, Mat::ptr() 보다 느리고, Mat::at() 처럼 임의의 위치에 자유롭게 접근할 수 없기 때문에 사용성이 높지 않은 편이다.
for (MatIterator_<uchar> it = mat1.begin<uchar>(); it != mat1.end<uchar>(); ++it)
{
(*it)++;
}

행렬 정보 참조하기

  • (Mat 클래스의 멤버 변수들 설명. 생략)

행렬 연산

// mat1과 mat2 행렬 사이의 덧셈과 뺄셈 연산
mat3 = mat1 + mat2;
mat3 = mat1 - mat2;

// mat1 행렬의 각 원소와 슼라라 s1 사이의 덧셈 및 뺄셈 연산
mat3 = mat1 + s1;
mat3 = mat1 - s1;
mat3 = s1 + mat1;
mat3 = s1 - mat1;

// mat1 행렬의 각 원소에 -1을 곱함
mat3 = -mat1;

// mat1과 mat2 행렬의 곱셈 연산
mat3 = mat1 * mat2;

// mat1 행렬의 각 원소에 실수 d1을 곱함
mat3 = mat1 * d1;
mat3 = d1 * mat1;

// mat1과 mat2 행렬의 같은 위치 원소끼리 나눗셈
mat3 = mat1 / mat2;

// mat1 행렬의 각 원소와 실수 d1끼리 나눗셈 연산
mat3 = mat1 / d1;
mat3 = d1 / mat1;
  • 위의 연산 중 * 연산은 행렬의 수학적 곱셈 연산을 의미하며, 만일 두 행렬의 같은 위치에 있는 원소끼리 곱셈 연산을 수행하려면 Mat::mul() 함수를 사용해야 한다.
  • 행렬의 역행렬은 Mat::inv() 함수를 이용해서 구할 수 있다.
    • Mat::inv() 함수는 method 인자를 통해 역행렬 계산 방법을 지정할 수 있다.
    • 역행렬이 존재하는 일반적인 행렬이라면 가우스 소거법을 사용하는 DECOMP_LU를 사용할 수 있으며, 이 값은 기본값으로 지정되어 있으므로 생략할 수 있다.
    • 역행렬이 존재하지 않는 경우 DECOMP_SVD를 지정하면 특잇값 분해(singular value decomposition) 방법을 이용하여 의사 역행렬(pseudo-inverse matrix)를 구할 수 있다.
    • DECOMP_EIG와 DECOMP_CHOLESKY는 각각 고윳값 분해와 촐레스키(Cholesky) 분해에 의한 역행렬 계산을 의미한다.
  • 행렬의 전치행렬은 Mat::t()를 이용하여 구할 수 있다.

크기 및 타입 변환 함수

  • 행렬의 타입을 변경할 때는 Mat::convertTo() 함수를 사용한다.
    • Mat::convertTo() 함수는 행렬 원소의 타입을 다른 타입으로 변경하고 추가적으로 모든 원소에 일정한 값을 더하거나 곱할 수 있다.
    • Mat::convertTo() 함수에 의해 생성되는 출력 행렬 m의 원소 값은 다음 수식에 의해 결정된다.

m(x, y) = saturate_cast<rtype>(alpha \times (*this)(x, y) + beta)

  • 일반적으로 영상은 픽셀 값을 uchar 자료형을 이용하는데, 만일 일련의 복잡한 연산을 수행해야 하는 경우 연산의 정확도를 높이기 위해 픽셀 값을 float, double 같은 실수형으로 변환하여 내부 연산을 수행해야 하는 경우가 있을 수 있다.
  • 이러한 경우에 Mat::convertTo() 함수를 사용하여 CV_8UC1 타입의 행렬을 CV_32FC1 타입으로 변경할 수 있다.
Mat img1 = imread("lenna.bmp", IMREAD_GRAYSCALE);

Mat img1f;
img1.convertTo(img1f, CV_32FC1);
  • Mat::reshape() 함수는 주어진 행렬의 크기 또는 채널 수를 변경한다.
    • Mat::reshape() 함수는 행렬 원소 데이터를 복사하여 새로운 행렬을 만드는 것이 아니라 하나의 행렬 원소 데이터를 같이 참조하는 행렬을 반환한다. 그러므로 Mat::reshape() 함수에 의해 반환된 행렬 원소 값을 변경하면 원본의 값도 함께 바뀌게 된다.
uchar data1[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 };
Mat mat1(3, 4, CV_8UC1, data1);
Mat mat2 = mat1.reshape(0, 1);

// result
// mat1: [ 1, 2, 3, 4;
// 5, 6, 7, 9;
// 9, 10, 11, 12]
// mat2: [ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ]
  • 행렬의 모양이 아니라 단순히 행렬의 행 크기를 변경하고 싶을 때는 Mat::resize() 함수를 사용하면 된다.
    • Mat::resize() 함수는 행렬의 행 개수를 변경하는데, 입력된 개수가 기존 행 개수보다 작으면 아래쪽 행을 제거하고, 기존 행렬의 행 개수보다 크면 아래쪽에 행을 추가한다. 이때 추가하는 행 원소의 초기값을 지정할 수 있다.
mat1.resize(5, 100);

// result
// mat1: [ 1, 2, 3, 4;
// 5, 6, 7, 9;
// 9, 10, 11, 12;
// 100, 100, 100, 100;
// 100, 100, 100, 100]
  • 이미 존재하는 행렬에 원소 데이터를 추가하고 싶을 때는 Mat::push_back() 함수를 이용할 수 있다.
    • Mat::push_back() 함수 인자로 _Tp& 또는 std::vector<_Tp>& 타입을 사용할 경우, *this 행렬은 1열짜리 행렬이어야 한다.
    • 만약 Mat_<_Tp>& 또는 Mat& 타입을 인자로 사용할 경우에는 *this 행렬과 인자로 전달된 m 행렬의 열 개수가 같아야 한다.
Mat mat3 = Mat::ones(1, 4, CV_8UC1) * 255;
mat1.push_back(mat3);

// result
// mat1: [ 1, 2, 3, 4;
// 5, 6, 7, 9;
// 9, 10, 11, 12;
// 100, 100, 100, 100;
// 100, 100, 100, 100;
// 255, 255, 255, 255]
  • Mat::push_back()과 반대로 맨 아래에 있는 행을 제거할 때는 Mat::pop_back() 함수를 이용하면 된다.

Vec과 Scalar 클래스

Vec 클래스

  • 벡터는 같은 자료형을 가진 원소 몇 개로 구성된 데이터 형식이다.
// 생성 및 초기화
Vec<uchar, 3> p1, p2(0, 0, 255);
  • 매번 Vec<uchar, 3> 형태로 입력하는 것은 번거롭기 때문에, OpenCV에서는 자주 사용되는 자료형과 개수에 대한 Vec 클래스 템플릿의 이름을 재정의를 제공한다.
    • OpenCV 에서 제공하는 Vec 클래스 템플릿의 이름 재정의는 다음 형식을 따른다.
Vec<num-of-data>{b|s|w|i|f|d}
  • <num-of-data> 위치에는 2, 3, 4 등 숫자를 지정할 수 있고, {b|s|w|i|f|d} 부분에는 b, s, w, i, f, d 문자 중 하나를 지정한다.
    • OpenCV 라이브러리에 정의된 Vec 클래스의 이름 재정의는 다음과 같다.
typedef Vec<uchar, 2> Vec2b;
typedef Vec<uchar, 3> Vec3b;
typedef Vec<uchar, 4> Vec4b;

typedef Vec<short, 2> Vec2s;
typedef Vec<short, 3> Vec3s;
typedef Vec<short, 4> Vec4s;

typedef Vec<ushort, 2> Vec2w;
typedef Vec<ushort, 3> Vec3w;
typedef Vec<ushort, 4> Vec4w;

typedef Vec<int, 2> Vec2i;
typedef Vec<int, 3> Vec3i;
typedef Vec<int, 4> Vec4i;
typedef Vec<int, 6> Vec3i;
typedef Vec<int, 8> Vec4i;

typedef Vec<float, 2> Vec2f;
typedef Vec<float, 3> Vec3f;
typedef Vec<float, 4> Vec4f;
typedef Vec<float, 6> Vec4f;

typedef Vec<double, 2> Vec2d;
typedef Vec<double, 3> Vec3d;
typedef Vec<double, 4> Vec4d;
typedef Vec<double, 6> Vec4d;
  • Vec 클래스는 [ ] 연산자가 재정의되어 있기 때문에 [ ] 연산자를 이용하여 멤버 변수 val 배열에 쉽게 접근할 수 있다.

Scalar 클래스

  • Scalar 클래스는 4채널 이하의 영상에서 픽셀 값을 표현하는 용도로 자주 사용된다.
    • Scalar 클래스는 Scalar_ 라는 이름의 클래스 템플릿 이름 재정의이며, Scalar_ 클래스는 Vec 클래스를 상속받아 만들어졌다.
    • Scalar 클래스는 보통 네 개 이하의 채널을 갖는 영상의 픽셀 값을 표현하는 용도로 사용된다.
      • 그레이스케일 영상의 경우 Scalar 클래스의 첫 번째 원소가 픽셀 밝기를 표현하고 나머지 세 개는 0으로 설정된다.
      • 트루컬러 영상의 경우, 처음 세 개 원소가 B, G, R 색상 성분 값을 표현하고 네 번째 원소는 보통 0으로 설정된다.
      • 간혹 PNG 파일 처럼 투명도를 표현하는 알파 채널이 있는 경우 Scalar 클래스의 네 번째 원소를 이용하기도 한다.
Scalar(밝기)
Scalar(파란색, 녹색, 빨간색)
Scalar(파란색, 녹색, 빨간색, 투명도)

InputArray와 OutputArray 클래스

  • InputArray 클래스는 주로 OpenCV 함수의 입력으로 사용되고, OutputArray 클래스는 OpenCV 함수의 출력으로 사용되는 인터페이스 클래스이다.

InputArray 클래스

  • InputArray 클래스는 Mat, vector<T> 등 다양한 타입을 표현할 수 있는 인터페이스 클래스로서 OpenCV 함수의 입력 인자 자료형으로 주로 사용된다.
    • _InputArray 클래스는 Mat, Mat_<T>, Matx<T, m, n>, vector<T>, vector<vector<T>>, vector<Mat>, vector<Mat_<T>, UMat, vector<UMat>, double 같은 다양한 타입으로부터 생성될 수 있는 인터페이스 클래스이다.
    • _InputArray 클래스는 OpenCV 라이브러리 내부에서 코드 구현 편의상 사용되며, 사용자가 명시적으로 _InputArray 클래스의 인스턴스 또는 변수를 생성하여 사용하는 것을 금지하고 있다.
  • 만약 OpenCV에서 제공하는 함수처럼 사용자 저으이 함수에서 Mat 객체뿐만 아니라 vector<T> 타입의 객체를 한꺼번에 전달받을 수 있게 만들고 싶다면 사용자 저으이 함수 인자에 InputArray 타입을 사용할 수 있다.
    • 그리고 실제 함수 본문에서는 _InputArray 클래스의 멤버 함수인 _InputArray::getMat() 함수를 사용하여 Mat 객체 타입 형태로 변환해서 사용해야 한다.

OutputArray 클래스

  • _OutputArray 클래스는 클래스 계층적으로 _InputArray 클래스를 상속받아 만들어졌다. 그러므로 _OutputArray 클래스도 Mat 또는 vector<T> 같은 타입의 객체로부터 생성될 수 있다.
  • 다만 _OutputArray 클래스는 새로운 행렬을 생성하는 _OutputArray:create() 함수가 추가적으로 정의되어 있다.
    • 그래서 OpenCV의 많은 영상 처리 함수는 결과 영상을 저장할 새로운 행렬을 먼저 생성한 후, 영상 처리 결과를 저장하는 형태로 구현되어 있다.
  • OutputArray 클래스도 InputArray와 마찬가지로 사용자가 직접 OutputArray 타입의 변수를 생성해서 사용하면 안 된다.
    • OutputArray 타입으로 정의된 OpenCV 함수의 인자에는 Mat 또는 vector<T> 같은 타입의 변수를 전달하는 형태로 코드를 작성해야 한다.
  • 영상에 그림을 그리는 몇몇 OpenCV 함수는 입력 영상 자체를 변경하여 다시 출력으로 반환하는 경우가 있으며, 이러한 함수는 InputOutputArray 클래스 타입의 인자를 사용한다.
    • 이 클래스는 입력과 출력의 역할을 동시에 수행할 때 사용된다.

언페어

제목인 언페어만 보고 사법체계의 숨겨진 불평등에 대한 고발을 하는 내용이라 생각 했었는데, 사실은 인간의 인지적 편향과 오류 때문에 발생할 수 있는 수사와 판결 등의 불합리함에 대한 내용을 다루는 책이었다.

수사와 판결 과정에 끼어드는 인간의 편향이나 인지적 오류에 대해서는 기존에 행동경제학이나 인지과학 서적들에서 접했던 내용들과 유사 했지만, 그것을 사법체계에 적용시켜 올바른 사법 체계 구축에 대한 논의는 흥미로웠다. 특히 가해자에 대한 처벌이 아니라 교화를 중심으로 체계를 개편해야 한다는 것과 인간의 편향을 없애기 위해 아바타를 이용한 재판은 개인적으로 생각해 볼만한 논의점 이었다.

생각해 보면 국가의 법률 체계는 피해자가 가해자에게 복수를 직접하는 것이 아니라 국가가 3자의 관점에서 대신 처벌을 해주는 것을 근간으로 하고 있을텐데, 가해자가 피해자에게 직접 사죄하고 보상하고 용서를 구하지 않는 이상 국가가 처벌을 아무리 강하게 하더라도 정작 피해자에게 돌아오는 보상은 없는데 어떻게 이런 식으로 처벌 체계가 갖춰졌는지 참 신기한 일이다. 피해자가 멀쩡히 있는데, 대중에게 사과하고 자신은 사과를 했다고 하는 것과 같은 것이 아닌가?

더불어 인간의 편향을 없애기 위해 저자는 재판을 아바타를 도입하는 논의를 하였는데, 개인적으로는 그것과 별개로 먼 훗날 재판을 기계에게 맡기는 시대가 된다면 어떻게 될지에 대해서도 궁금함이 들었다. 인간이 가지는 편향은 없겠지만, 사람들은 그것을 받아들일 수 있을까?

이상엽/ 행렬과 행렬식

행렬

용어정리

용어 설명
성분 행렬 안에 배열된 구성원 (=항=원소)
행렬의 가로줄
행렬의 세로줄
m \times n 행렬 m 개의 행과 n 개의 열로 이루어진 행렬
주대각선 행렬의 왼쪽 위에서 오른쪽 아래를 가르는 선
대각성분

주대각선에 걸치는 행과 열의 지표수가 같은 성분 (i, i 성분)

대각성분으로만 이루어진 행렬을 대각행렬이라 한다.

ex) \left( \begin{array}{rrr} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{array} \right)

영행렬 모든 성분이 0인 행렬
전치행렬

(a_{ij}) 에 대하여 (a_{ji})  

i와 j의 자리를 바꾼 행렬

대칭행렬 A = A^{T} A
정사각행렬 행, 열의 개수가 같은 행렬
단위행렬 모든 대각성분이 1이고 그 외의 성분은 0인 정사각행렬

행렬의 연산

덧셈과 뺄셈

m \times n 행렬 A = (a_{ij}) , B = (b_{ij}) 에 대해

A \pm B = (a_{ij} \pm b_{ij})

상수배

m \times n 행렬 A = (a_{ij}) 에 대해

상수 c 에 대해 cA = (ca_{ij})

곱셈

m \times n 행렬 A = (a_{ij}) n \times r 행렬 B = (b_{jk}) 에 대해

AB = (c_{ik}) : m \times r 행렬

단, c_{ik} = \sum_{j = 1}^{n} a_{ij} b_{jk}

행렬의 곱셈은 교환법칙이 성립되지 않는다.

  • 행렬의 곱셈은 함수 합성과 비슷한 개념이다.
  • 두 함수가 f(x, y) = (ax+by, cx+dy), g(x, y) = (px+qy, rx+sy) 라고 할 때, 두 함수의 합성은 다음과 같다.
    • f \circ g \\ = (apx + aqy + brx + bsy, cpx + cgy + drx + dsy) \\ = ((ap+br)x + (aq+bs)y, (cp+dr)x + (cq+ds)y)
  • 두 행렬이 F = \left( \begin{array}{rr} a & b \\ c & d  \end{array} \right), G = \left( \begin{array}{rr} p & q \\ r & s  \end{array} \right) 라고 할 때, 두 행렬의 곱은 다음과 같다.
    • FG = \left( \begin{array}{rr} ap+br & aq+bs \\ cp+dr & cq+ds  \end{array} \right)
  • 결국 두 함수의 합성과 두 행렬의 곱이 결과가 같다.
    • 행렬의 곱의 규칙이 앞 행렬의 행과 뒤 행렬의 열을 곱하는 이유가 이러한 까닭.

연립일차방정식

행렬의 표현

예를 들어 $latex \begin{cases} x + 2y = 5 \\ 2x + 3y = 8 \end{cases} 를

  1. \left( \begin{array}{rrr} 1 & 2 & 5 \\ 2 & 3 & 8 \end{array} \right) 는 가우스 조던 소거법
  2. \left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right) \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{r} 5 \\ 8 \end{array} \right) 은 역행렬을 이용

가우스 조던 소거법

다음 세 가지의 기본 행 연산을 통해 연립일차방정식의 첨가행렬을 기약 행사다리꼴로 변환하여 해를 구한다.

  1. 한 행을 상수배한다.
  2. 한 행을 상수배하여 다른 행에 더한다.
  3. 두 행을 맞바꾼다.

역행렬 이용

연립일차방정식 AX = B 에서 A 의 역행렬 A^{-1} 가 존재하면, X = A^{-1}B 이다

예를 들어

\left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right) \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{r} 5 \\ 8 \end{array} \right) \Leftrightarrow \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right)^{-1} \left( \begin{array}{r} 5 \\ 8 \end{array} \right)

행렬식

행렬식이란?

정사각행렬 A 를 하나의 수로써 대응시키는 특별한 함수. det A = |A|

  • 행렬식은 행렬보다 먼저 있었던 개념.

이때 A

0 \times 0 \Rightarrow det ( ) = 0

1 \times 1 \Rightarrow det (a) = a

2 \times 2 \Rightarrow det (\left( \begin{array}{rr} a_{11} & a_{12} \\ a_{21} & a_{22} \end{array} \right)) = a_{11} a_{22} - a_{12} a_{21}

3 \times 3 \Rightarrow det (\left( \begin{array}{rrr} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{array} \right)) \\ = a_{11} M_{11} - a_{12} M_{12} + a_{13} M_{13} \\ = a_{11} \left| \begin{array}{rr} a_{22} & a_{23} \\ a_{32} & a_{33} \end{array} \right| - a_{12} \left| \begin{array}{rr} a_{21} & a_{23} \\ a_{31} & a_{33} \end{array} \right| + a_{13} |\left| \begin{array}{rr} a_{21} & a_{22} \\ a_{31} & a_{32} \end{array} \right| \\ = a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}  

  • M_{ij} 란 행렬 A 에서 i 행과 j 열을 제외한 나머지 행렬을 말함.
    • M은 Minor Matrix로 소행렬이라고 한다. (원래 행렬에서 일부를 제외한 나머지 행렬)
  • M은 꼭 1행을 기준으로 잡지 않아도 된다. 1열을 기준으로 하거나 다른 것을 기준으로 해도 결과는 같다.
    • 최종적으로 a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}   의 꼴이 나오기만 하면 되기 때문.
  • 사루스 법칙
    • 첫 번째 원소로부터 오른쪽 아래 대각선으로 그으면서 곱하여 더함. 모두 더한 후에는 가장 오른쪽 원소로부터 왼쪽 아래 대각선을 그으면서 앞의 값에서 뺀다.
    • 그러면 결국 a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}   의 꼴이 나옴.

4 \times 4 \Rightarrow det A = a_{11} M_{11} - a_{12} M_{12} + a_{13} M_{13} - a_{14} M_{14}

  • 행렬식의 계산은 위와 같이 일반화 된다.
    • 첫 행렬과 그 행렬이 포함된 행렬을 제외한 마이너 행렬을 곱한것을 차례로 더했다가 뺐다가를 반복하면 된다.
    • 이 계산을 일반화 하면 2×2 행렬에서 ad – bc가 되는 것도 같은 원리가 된다.

역행렬

행렬식이 0이면 역행렬이 존재하지 않는다. 즉, 행렬식이 0이 아닌 정사각 행렬 A 의 역행렬 A^{-1}

A^{-1} = { 1 \over det A } \left( \begin{array}{rrr} C_{11} & C_{22} & ... \\ C_{12} & C_{22} & ... \\ ... & ... & ... \end{array} \right) (단 C_{ij} = (-1)^{i+j} M_{ij} )

  • C 는 수반행렬이라고 한다.
  • C_{ij} M_{ij} 에 순서대로 +, -를 번갈아 붙인 값이 된다.
  • 수반행렬(C_{ij} ) 는 원래 행렬과 순서가 전치됨.

ex)

\left( \begin{array}{rr} a & b \\ c & d \end{array} \right)^{-1} = { 1 \over ad - bc } \left( \begin{array}{rr} d & -b \\ -c & a \end{array} \right)

  • 역행렬은 교환법칙이 성립한다.
    • AB = I \\ \Rightarrow BABB^{-1} = BIB^{-1} \\ \Rightarrow BAI = BB^{-1} \\ \Rightarrow BA = I

크래머 공식

연립일차방정식 AX = B 에서 A 가 행렬식이 0이 아닌 정사각행렬일 때,

x_{j} = { det A_{j} \over det A } = { \left| \begin{array}{rrrrr} a_{11} & ... & b_{1} & ... & a_{1n} \\ a_{21} & ... & b_{2} & ... & a_{2n} \\ ... & ... & ... & ... & ... \\ a_{n1} & ... & b_{n} & ... & a_{nn} \end{array} \right| \over \left| \begin{array}{rrrrr} a_{11} & ... & a_{1j} & ... & a_{1n} \\ a_{21} & ... & a_{2j} & ... & a_{2n} \\ ... & ... & ... & ... & ... \\ a_{n1} & ... & a_{nj} & ... & a_{nn} \end{array} \right| }

단, j = 1, ... , n 이고 A_{j} A j 번째 열을 B 의 원소로 바꾼 행렬이다.

  • 크래머 공식은 행렬 전체를 구하는게 아니라 그 중에 일부 원소에 대한 값만 빠르게 구할 수 있는 방법.
    • 행렬의 구조를 이용해서 정리한 내용이라 행렬 계산을 반복해서 보면 자명하게 이해된다.
    • 행렬 연산의 구조를 이용해서 이렇게 저렇게 짜맞추고 최종 결과를 이끌어 냄.

19.09.01

한국에서 기회평등은 오히려 개선되었다

구조적 요인은 경제발전으로 인하여 평균 소득이 높아지고 직업 구조가 고도화되면 설사 부모 세대 내에서의 "상대적" 지위(=등수)와 자녀 세대 내에서의 상대적 지위에 차이가 없더라고, 자녀 세대의 사회이동이 높아지는 현상을 나타냄.

부모가 그 세대 내에서 하위 40%고, 자녀도 그 세대 내에서 하위 40%일지라도 부모 세대는 농사꾼이었지만, 자녀 세대는 화이트칼라 회사원이 됨. 이 경우 계급의 상대적 지위는 부모와 자녀 세대에 전혀 변하지 않았지만, 마치 계급이동이 활발한 것처럼 느껴짐. (중략)

이렇게 순수 사회이동의 확률이 높아졌음에도 불구하고 사회이동이 줄었다고 느끼는 것은 고도성장 시기를 지나서 저성장 시대로 접어들었기에 구조적 이동이 줄어든 것. 개천에서 용이 안나는 듯이 느끼지만, 사실은 개천이 줄어서 그런 것. 옛날에는 개천 밖에 없었기에 용이 났다하면 다 개천에서 나지만, 지금은 개천이 별로 없어서 용이 개천에서 안나는 것. (중략)

순수 사회이동 확률이 높다는 것은 개천에서 용이 나는 확률이 높다는 것 뿐만 아니라 부자가 망해서 개천으로 떨어질 확률도 높다는 것. 한국에서 순수 사회이동 확률이 높기 때문에 중상층 이상에서 자신의 지위 유지를 위한 노력도 높아질 수 밖에 없음. 떨어지면 바닥이고, 다른 사회보다 떨어질 확률이 높으니, 기를 쓰고 지위 유지를 할려고 하는 것.

놀라운 이야기. 실제 기회는 평등해졌지만, 사회 전체의 성장률이 낮아지면서 구조적 이동이 줄어들었기 때문에 기회의 불평등이 심화되었다고 느껴진다는 것. 이는 밀물이 들어오면 모든 배가 떠오르는 것과 같다. 실제 우리는 그 최종곱 –사회 전체의 변화와 개인의 변화– 을 보기 때문에 그렇게 느껴지는 듯.

역동적인 사회는 바닥으로 떨어지는 사람이 존재한다는 것도 새겨 둘만한 내용. 자리는 한정되어 있고, 누군가 윗자리로 올라왔다는 것은 그 윗자리를 차지하고 있는또 다른 누군가는 그 자리를 내어줘야 한다.

항해사 없이 이동하는 ‘자율운항선박’

자율운항선박이 기술적으로 자동차나 드론 등에 비해 개발이 더 쉽다고 보기는 어렵다. 다른 자율이동체 로봇과 마찬가지로 사물인터넷(IoT), 빅데이터, 인공지능(AI) 등의 기술을 총체적으로 융합할 필요가 있는 데다 바다라는 특수 상황을 고려해 별도로 개발해야 할 기술 역시 많다.

그러나 사고 위험에 대한 부담은 상대적으로 적다고 볼 수 있다. 선박의 경우 일단 바다로 나아가면 주변에 장애물이 거의 없다. 또 자동차나 항공기처럼 빠르게 움직이지 않으므로 연산장치의 부담이 걸릴 우려도 적으며, 주위를 파악해야 하는 센서의 성능 등에서도 여유가 있다.

시기의 문제일 뿐 결국 자율주행으로 갈 것이다. AI가 일반지능을 대체한다는 것은 사실 먼 미래일 뿐만 아니라 실제적으로 큰 의미도 없다. –사람마다 차이는 있겠지만 인간은 기본적으로 지배욕구를 갖고 있기 때문에, 어느 누구도 기계가 자신을 대신해 중요한 문제에 대한 결정 권한을 갖기를 원하지는 않는다. 자기가 하기 귀찮은 일을 대신해주길 바랄 뿐

현실의 기계 장치 중에 사람만큼 일반 운동 능력을 가진 기계 장치는 존재하지도 않으며 있어도 큰 효용이 없다. 흙을 대량으로 퍼 올릴 수 있는 굴삭기가 필요한 것이지 사람 대신 삽질을 해주는 기계가 필요한 것이 아니다. 특정 영역에 대해 사람을 대신해 줄 수 있으면 된다. 고로 AI 분야의 Next는 자율주행.

미숙아 수준 ‘미니 뇌’ 만들었다

지난 10여 년 간 과학자들은 사람의 신장, 간, 피부, 소화기관 등을 모방한 유사 생체 장기 ‘오가노이드(organoids)를 만들어왔다.

‘미니 장기’, 혹은 ‘유사 장기’ 등으로 번역되는데 이 인공 장기는 인체에서 채취한 줄기세포를 3차원적으로 배양하거나 재조합해 만든 작은 장기 유사체로 신약개발과 질병 치료, 인공장기 개발 등에 활용이 가능하다.

오가노이드를 처음 만든 사람은 영국 케임브리지대 매들린 랭커스터(Madeline Lancaster) 박사다. 그는 2013년 신경줄기세포로 뇌 오가노이드를 제작했다. 이후 미국과 일본 등에서 심장, 위, 간, 신장, 췌장, 갑상선 등 10여 개의 오가노이드가 탄생했다. (중략)

그동안 과학자들은 줄기세포를 키워 유사 뇌를 만들었지만 실제 신경세포의 활동을 모방할 수는 없었다. 그러나 미숙하지만 뇌 기능을 수행할 수 있는 ‘미니 뇌’를 제작함으로써 뇌전증, 뇌일혈, 조현병 등 정신질환을 치료하는 데 도움을 줄 수 있을 것으로 기대하고 있다.

정말 놀라운 세상.

 

19.08.11

‘빅데이터 없는 인공지능’ 기술이 온다

지난 수십 년의 인공지능 발전 역사를 돌아보면 접근법이 크게 둘로 나뉜다. 하나는 지능의 원리를 분명한 코드로 짜야 한다는 ‘전문가 시스템’파이고, 다른 하나는 지금의 열풍을 가져온 컴퓨터가 스스로 익히도록 하는 ‘기계학습’파이다. 그런데 신경-상징 개념 학습자는 둘을 결합한 ‘하이브리드’ 인공지능이라는 게 특징이다.

이 인공지능은 우선 일부 데이터로부터 학습을 통해 대상의 특징을 뽑아낸다. 그리고 나선 이를 저장해두고 전통의 전문가 시스템 기법을 결합해 문제 해결에 활용하는 것이다. 둘의 결합을 통해 훨씬 적은 수의 데이터만으로도 비슷한 문제 해결 능력을 발휘할 수 있다는 게 연구진의 설명이다.

외국어를 배울 때 그 언어의 문법을 이해하지 못하면, 어마어마한 수준의 데이터가 필요하다. 물론 몇몇 큰 기업들은 그런 데이터 확보가 가능하겠지만, 많은 경우에 현실적이지 않음. 주어진 맥락(context)에서 특징(feature) 을 추출하는 방식으로 가는게 결국 방향일 것 같다. 

사진 찍듯이 통째로 외우는 기억력, 부럽긴 하지만

시각 정보와 공간 학습이 초인적 기억술과 관련이 있는 걸까? 뛰어난 기억술을 지닌 이들은 주로 ‘장소 기억법’(method of loci)이라는 고전적인 기억 증강 방법을 사용하는 것으로 알려졌다. 이 방법은 2500여년 전 고대 그리스의 시모니데스(기원전 556~468)라는 시인이 자신이 강연하던 연회장의 청중을 그들이 앉아 있던 장소와 연계해 모두 기억해낼 수 있었다는 전설 같은 이야기에서 비롯했다고 한다. 이 기억법은 기억하고자 하는 정보들을 자신이 익숙한 가상의 ‘장소’에 배치하고 그 장소의 이미지와 결합함으로써, 빠르고 효과적으로 그 정보들을 떠올리는 방법이다. 그러므로 장소 기억법을 사용하면 시각 이미지와 공간 기억을 처리하는 뇌 부위의 활성이 일반인보다 높게 측정되는 게 당연할 것이다.

루리야가 보고한 ‘에스’도 기억술을 배우지 않았다고 말했지만, 그의 두뇌는 비슷한 전략을 사용한 것으로 보인다. ‘에스’는 기억하고자 하는 정보들을 시각화하는 것을 선호했으며, 어떠한 가상의 ‘길’을 만들고 그 길의 여러곳에 기억할 정보들을 배치하고서, 나중에는 그 길을 걸어가듯이 기억된 정보들을 떠올리곤 했다. 그의 또 다른 능력은 감각기관을 통해 받아들인 정보들을 공감각적으로 해석하는 능력이었다. 예를 들어 어떤 음악 소리를 들으면 음악에서 얻어지는 청각 정보뿐만 아니라 시각, 촉각, 미각적 이미지를 함께 느끼면서, 특정 음악을 ‘말랑하고 노란색의 달콤한 노래’라는 식의 정보로 기억해 나중에 그 음악을 쉽게 연상한다는 것이다. 이처럼 기억 능력이 뛰어난 사람들은 기억하고자 하는 것을 자신에게 이미 익숙한 정보들과 연합해 머리에 저장하고 이를 이용해 쉽게 끄집어내는 듯하다. (중략)

그렇다면 장기 강화 현상을 인위적으로 증강하면 기억력도 높아지지 않을까? 1999년 당시 미국 프린스턴대에 있던 조 첸 박사 연구팀은 장기 강화에 필수인 특정 단백질이 신경세포들에 더 많이 발현하도록 유전자 변형 생쥐를 만들어 그런 실험을 했다. 놀랍게도 기억력을 측정할 수 있는 거의 모든 종류의 행동 시험에서 이 동물들의 기억력이 증강되었음을 확인할 수 있었다. 또한 2005년 로스앤젤레스 캘리포니아대의 알시노 실바 박사 연구팀은 세포 성장을 촉진하는 특정 단백질(Ras)이 과도하게 활성화되도록 유전자를 변형한 생쥐한테서도 높은 기억력과 신경세포 간의 연결성을 관찰할 수 있었다고 보고했다.

하지만 이야기는 여기서 끝나지 않았다. 실험동물의 인위적 기억력 증강에는 종종 예상치 못한 부작용이 뒤따랐다. 유전자 조작으로 기억이 증가한 생쥐들은 정상 생쥐들보다 고통을 더 잘 느꼈으며(하필 기억 저장과 만성 통증은 그 생물학적 메커니즘이 비슷한데, 통증을 느낄 때도 뇌에서 장기 강화 현상이 벌어진다고 알려져 있다), 세포 성장이 과도하게 증가하는 바람에 암 발생률이 높아질 수도 있었다. 현재까지 동물실험을 한 과학자들이 얻은 교훈은 기억만을 증가시키고 다른 생리적 현상은 정상으로 유지할 수 있는 방법은 아직 존재하지 않는다는 것이다.

실제로 초인적인 기억력을 가진 사람들도 모든 것을 기억하는 데 뛰어난 것은 아니었으며, 오히려 뛰어난 기억력에 따른 부작용으로 고생하기도 했다. 앞서 소개한 ‘에이제이’는 자신의 일생을 마치 영화를 보는 것같이 뚜렷하게 기억했지만, 의외로 자신이 갖고 다니는 여러 열쇠가 각각 어느 용도인지 잘 몰랐고, 심지어 최근에 자신을 인터뷰한 사람의 옷차림도 잘 떠올리지 못했다고 한다.

망각도 기억의 일부. 잊지 말아야 할 정보는 어딘가에 기록을 해두면 그만이다. 기억술에 대한 내용도 흥미로워서 추가. 시각화가 얼마나 중요한지 이해할 수 있다.