Category Archives: 배우기

OpenCV 4로 배우는 컴퓨터 비전과 머신 러닝/ OpenCV 주요 기능

  • (각 함수의 상세한 파라미터에 대해서는 이전의 <OpenCV로 배우는 영상처리 및 응용>에서 정리하였으므로 생략)

카메라와 동영상 파일 다루기

VideoCapture 클래스

  • 동영상이란 일련의 정지 영상을 압축하여 파일로 저장한 형태
    • 이때 동영상에 저장되어 있는 정지 영상을 프레임(frame)이라고 함.
    • 동영상을 처리하는 작업은 동영상에서 프레임을 추출한 후, 각각의 프레임에 영상 처리 기법을 적용하는 형태로 이루어짐.
  • OpenCV에서는 VideoCapture라는 클래스를 이용하여 카메라 또는 동영상 파일로부터 정지 영상 프레임을 받아올 수 있음.
  • VideoCapture 클래스에서 동영상 파일을 불러오려면 처음 VideoCapture 객체를 생성할 때 동영상 파일 이름을 지정하거나 기본 생성자로 VideoCpature 객체를 생성한 후 VideoCapture::open() 멤버 함수를 호출해야 함.
  • 하나의 동영상 파일 대신 일련의 숫자로 구분되는 이름의 정지 영상 파일을 가지고 있고, 이 파일을 불러오고 싶을 때에도 VideoCapture 클래스를 이용할 수 있음.
    • 예컨대 img0001.jpg, img0002.jpg, img0003.jpg 라는 파일이 있을 때 filename 인자에 ‘img%04d.jpg”라고 입력하면 일련의 영상 파일을 차례로 불러올 수 있음.
    • 또한 filename 인자에 ‘protocol://host:port/script_name?script_params|auth’ 형태의 비디오 스트림 URL을 지정하여 인터넷 동영상을 사용할 수도 있음.
  • apiPreference 인자에는 아래 표와 같은 VideoCaptureAPIs 열거형 상수 중 하나를 사용하여 동영상 파일을 불러오는 방법을 지정할 수 있음.
    • 대부분의 경우 apiPreference 인자를 생략하거나 기본값인 CAP_ANY를 지정하는데, 이 경우 시스템이 알아서 적절한 방법을 선택하여 사용 함.
열거형 상수 설명
CAP_ANY 자동선택
CAP_V4L, CAP_V4L2 V4L/V4L2(리눅스)
CAP_FIREWIRE, CAP_IEEE1394 IEEE 1394 드라이버
CAP_DSHOW 다이렉트쇼(DirectShow)
CAP_PVAPI PvAPI, Prosilica GigE SDK
CAP_OPENNI OpenNI
CAP_MSMF 마이크로소프트 미디어 파운데이션
CAP_GSTREAMER GStreamer
CAP_FFMPEG FFMPEG 라이브러리
CAP_IMAGES OpenCV에서 지원하는 일련의 영상 파일
CAP_OPENCV_MJPEG OpenCV에 내장된 MotionJPEG 코덱

 

  • 컴퓨터에 연결된 카메라 장치를 열 때에도 VideoCapture 생성자 혹은 VideoCapture::open() 함수를 이용하는데, 이때 함수의 인자에 문자열이 아닌 정수 값을 전달 함.
    • 카메라 장치를 사용하려 할 때 VideoCapture 클래스의 생성자 혹은 VideoCapture::open() 함수에 전달하는 정수 값 index는 다음과 같은 형태로 구성됨
index = camera_id + domain_offset_id
  • 만일 컴퓨터에 한 대의 카메라만 연결되어 있다면 이 카메라의 camera_id는 0이 된다.
    • 만일 두 대 이상의 카메라가 연결되어 있다면 각각의 카메라는 0보다 같거나 큰 정수를 ID로 갖는다.
  • domain_offset_id는 카메라 장치를 사용하는 방식을 표현하는 정수 값이며 VideoCaptureAPIs 열거형 상수 중 하나를 지정한다.
    • 대부분의 경우 domain_offset_id는 자동 선택을 의미하는 0(CAP_ANY)을 사용하기 때문에 index 값은 결국 camera_id와 같은 값으로 설정한다.
  • 카메라 또는 동영상 파일 열기를 수행한 후에는 VideoCapture::isOpened() 함수를 이용하여 열기 작업이 성공적으로 수행되었는지를 확인하는 것이 좋다.
  • 카메라 장치 또는 동영상 파일의 사용이 끝나면 VideoCapture::release()를 호출하여 사용하던 자원을 해제해야 한다.
    • 참고로 VideoCapture 클래스의 소멸자에도 VideoCapture::release() 함수와 마찬가지로 사용하고 있던 자원을 모두 해제하는 코드가 들어가 있어서 VideoCapture 객체가 소멸할 때 자동으로 열려 있던 카메라 장치 또는 동영상 파일이 닫히게 된다.
  • VideoCapture 클래스를 이용하여 카메라 또는 동영상 파일을 정상적으로 열었다면 그 후에 공통의 멤버 함수를 사용하여 프레임을 받아올 수 있다.
    • VideoCapture 클래스에서 한 프레임을 받아 오기 위해서는 VideoCapture::operator >>() 연산자 재정의 함수 또는 VideoCapture::read() 함수를 사용한다.
  • >> 연산자 재정의와 VideoCapture::read() 함수는 모두 카메라 또는 동영상 파일로부터 다음 프레임을 받아 와서 Mat 클래스 형식의 변수 image에 저장한다.
    • 사실 >> 연산자 재정의는 함수 내부에 명시적으로 VideoCapture::read() 함수를 호출하는 형태로 구성되어 있기 때문에 그 둘은 완전히 같다.
VideoCapture cap(0);

Mat frame1, frame2;
cap >> frame1; // 1st frame
cap.read(frame2); // 2nd frame
  • 현재 열려 있는 카메라 장치 또는 동영상 파일로부터 여러 정보를 받아 오기 위해서는 VideoCapture::get() 함수를 사용한다.
    • VideoCapture::get() 함수는 인자로 지정한 속성 ID(propID)에 해당하는 속성 값을 반환한다.
    • VideoCapture::get() 함수의 인자로 지정할 수 있는 속성 ID는 VideoCaptureProperties 열거형 상수 중 하나를 지정할 수 있으며, 자주 사용되는 상수를 아래 표에 정리.
    • VideoCapture::get() 함수는 속성을 double 타입으로 반환한다.
VideoCaptureProperties 열거형 상수 설명
CAP_PROP_POS_MSEC 비디오 파일에서 현재 위치(밀리초 단위)
CAP_PROP_POS_FRAMES 현재 프레임 위치 (0-기반)
CAP_PROP_POS_AVI_RATIO [0, 1] 구간으로 표현한 동영상 프레임의 상대적 위치(0: 시작, 1: 끝)
CAP_PROP_FRAME_WIDTH 비디오 프레임의 가로 크기
CAP_PROP_FRAME_HEIGHT 비디오 프레임의 세로 크기
CAP_PROP_FPS 초당 프레임 수
CAP_PROP_FOURCC fourcc 코드(코덱을 표현하는 정수 값)
CAP_PROP_FRAME_COUNT 비디오 파일의 전체 프레임 수
CAP_PROP_BRIGHTNESS (카메라에서 지원하는 경우) 밝기 조절
CAP_PROP_CONTRAST (카메라에서 지원하는 경우)  명암비 조절
CAP_PROP_SATURATION (카메라에서 지원하는 경우) 채도 조절
CAP_PROP_HUE (카메라에서 지원하는 경우) 색상 조절
CAP_PROP_GAIN (카메라에서 지원하는 경우) 감도 조절
CAP_PROP_EXPOSURE (카메라에서 지원하는 경우) 노출 조절
CAP_PROP_ZOOM (카메라에서 지원하는 경우) 줌 조절
CAP_PROP_FOCUS (카메라에서 지원하는 경우) 초점 조절
VideoCapture cap(0);

int w = cvRound(cap.get(CAP_PROP_FRAME_WIDTH));
int h = cvRound(cap.get(CAP_PROP_FRAME_HEIGHT));
  • VideoCapture::get() 함수와 반대로 현재 열려 있는 카메라 또는 비디오 파일 재생과 관련된 속성 값을 설정할 때는 VideoCapture::set() 함수를 사용한다.
    • VideoCapture::set() 함수의 속성 ID도 위의 표에 정리한 VideoCaptureProperties 열거형 상수를 지정한다.
    • 만일 video.mp4 파일을 열어서 100번째 프레임으로 이동하려면 다음과 같은 코드를 작성하면 된다.
VideoCapture cap("video.mp4");
cap.set(CAP_PROP_POS_FRAMES, 100);

카메라 입력 처리하기

  • (앞서 나온 내용을 이용한 예제 코드와 설명이라 생략)

동영상 파일 처리하기

  • (앞서 나온 내용을 이용한 예제 코드와 설명이라 생략)

동영상 파일 저장하기

  • (앞서 나온 내용을 이용한 예제 코드와 설명이라 생략)

다양한 그리기 함수

직선 그리기

  • line()은 영상 위에 직선을 그리는 함수
    • 영상 위에 pt1 좌표부터 pt2 좌표까지 직선을 그린다.
    • 이때 선의 색상, 밝기는 color로 지정할 수 있고, thickness를 이용하여 두께를 지정할 수 있다.
    • lineType인자는 그리는 방식을 지정할 수 있는데, LineTypes 열거형 상수 중 하나를 지정할 수 있다.
LineTypes 설명
FILLED -1 내부를 채움(직선 그리기 함수에는 사용 불가)
LINE_4 4 4방향 연결
LINE_8 8 8방향 연결
LINE_AA 18 안티에일리어싱

 

  • 화살표 형태의 직선을 그려야 하는 경우에는 arrowedLine()을 이용하면 된다.
    • arrowedLine() 함수는 영상 위에 pt1 좌표부터 pt2 좌표까지 직선을 그리고 끝점인 pt2에 화살표 모양의 직선 두 개를 추가로 그린다.
    • 이때 화살표 모양의 직선 길이는 arrowedLine() 함수의 마지막 인자인 tipLength를 이용하여 조절할 수 있다.
  • drawMarker()는 직선 그리기 함수를 이용하여 다양한 모양의 마커를 그린다.
    • drawMarker() 함수는 img 영상의 position 좌표에 color 색상을 이용하여 마커를 그리는데, 마커의 종류는 markerType 인자로 지정할 수 있다. 기본값으로는 십자가 모양의 MARKER_CROSS 가 지정되어 있다.
MarkerTypes 설명
MARKER_CROSS 십자가 모양 (+)
MARKER_TILTED_CROSS 45도 회전된 십자가 모양 (x)
MARKER_STAR 별 모양 (*)
MARKER_DIAMOND 마름모 모양
MARKER_SQUARE 정사각형 모양
MARKER_TRIANGLE_UP 위로 뾰족한 삼각형
MARKER_TRIANGLE_DOWN 아래로 뾰족한 삼각형

도형 그리기

  • rectangle()은 사각형을 그리는 함수
    • rectangle(0 함수 인자 중 thickness는 도형 외곽선의 두께를 지정하는데, 만일 thickness에 -1 을 지정하거나 FILLED 열거형 상수를 지정하면 내부를 채운 사각형을 그린다.
  • circle()은 원을 그리는 함수
    • 원을 그리기 위해서는 원의 중심점 좌표와 반지름을 지정해야 한다.
  • ellipse()는 타원을 그리는 함수. 타원을 그리는 방식은 원을 그리는 방식보다 복잡하다.
    • ellipse() 함수는 다양한 형태의 타원 또는 타원의 일부인 호를 그릴 수 있다.
    • 타원의 크기는 axes 인자를 통해 지정하는데, axes 인자는 size 자료형을 사용하며, x축 방향 타원과 반지름과 y축 방향 반지름을 지정한다.
    • angle에 0이 아닌 값을 전달하면 회전된 타원을 그릴 수 있다.
    • startAngle과 endAngle 인자를 적절하게 이용하면 호를 그리는 용도로도 사용할 수 있다.
    • 예컨대 startAngle에 0을 지정하고 endAngle에 360을 지정하면 완전한 타원을 그리지만 startAngle에 0을 지정하고 endAngle에 180을 지정하면 타원에 반에 해당하는 호를 그린다.
    • thickness는 타원 외곽선 두께를 나타내는데, -1 또는 FILLED를 지정하면 내부를 채운 타원이나 호를 그린다.
  • polylines() 함수는 임의의 다각형을 그리는 함수
    • polylines()에는 다각형의 꼭지점 좌표를 전달해야 하며, 꼭지점 좌표는 vector<Point> 자료형에 저장하여 전달한다.

문자열 출력하기

  • 영상 위에 정해진 폰트로 문자열을 출력하려면 putText() 함수를 이용하면 된다.
    • putText() 함수는 img 영상의 org 위치에 text로 지정된 문자열을 출력한다.
    • 이때 사용할 폰트는 fontFace 인자로 지정할 수 있고, faceScale 인자를 이용하여 폰트 크기를 조절할 수 있다.
    • fontFace 인자에는 HersheyFonts 열거형 상수 값을 지정할 수 있다. HersheyFonts 열거형 중 FONT_ITALIC 상수는 논리합 연산자(|)를 이용하여 다른 상수와 함께 사용한다.
HersheyFonts 설명
FONT_HERSHEY_SIMPLEX 일반 크기의 산세리프 폰트
FONT_HERSHEY_PLAIN 작은 크기의 산세리프 폰트
FONT_HERSHEY_DUPLEX 일반 크기의 산세리프 폰트 (FONT_HERSHEY_SIMPLEX 보다 복잡)
FONT_HERSHEY_COMPLEX 일반 크기의 세리프 폰트
FONT_HERSHEY_TRIPLEX 일반 크기의 세리프 폰트 (FONT_HERSHEY_COMPLEX보다 복잡)
FONT_HERSHEY_COMPLEX_SMALL FONT_HERSHEY_COMPLEX 보다 작은 폰트
FONT_HERSHEY_SCRIPT_SIMPLEX 필기체 스타일의 폰트
FONT_HERSHEY_SCRIPT_COMPLEX 필기체 스타일의 폰트(FONT_HERSHEY_SCRIPT_SIMPLEX 보다 복잡한 형태)
FONT_ITALIC 이탤릭체를 위한 플래그

 

  • OpenCV는 문자열 출력을 위해 필요한 사각형 영역 크기를 가늠할 수 있는 getTextSize() 함수를 제공하는데, 이 함수를 잘 이용하면 문자열이 한쪼긍로 치우치지 않고 적당한 위치에 출력되도록 설정할 수 있다.
    • putText(0 함수를 이용하여 특정 위치 좌표에 문자열을 출력하면, 보통 문자열 길이와 크기에 따라 문자열이 차지하는 영역 크기가 달라지기 때문에 문자열이 한쪽에 치우쳐서 나타날 수 있다. 그러나 getTextSize() 함수가 반환하는 문자열 영역 크기 정보를 이용하면 문자열 출력 위치를 적절하게 조절할 수 있다.
Mat img(200, 640, CV_8UC3, Scalar(255, 255, 255));

const String text = "Hello, OpenCV";
int fontFace = FONT_HERSHEY_TRIPLEX;
double fontScale = 2.0;
int thickness = 1;

Size sizeText = getTextSize(text, fontFace, fontScale, thickness, 0);
Size sizeImg = img.size();

// 텍스트의 크기를 이용해서 적절한 위치를 계산
Point org((sizeImg.width - sizeText.width) / 2, (sizeImg.Height + sizeText.height) / 2);

putText(img, text, org, fontFace, fontScale, Scalar(255, 0, 0), thickness);

이벤트 처리

키보드 이벤트 처리

  • waitKey() 함수는 키보드 입력을 처리하는 OpenCV의 기본 함수
    • waitKey() 함수는 delay에 해당하는 밀리초 시간 동안 키 입력을 기다리다가 키 입력이 있으면 해당 키의 아스키 코드(ASCII code) 값을 반환한다. 만일 지정 시간 동안 키 입력이 없었으면 -1을 반환한다.
  • Window 운영체제에서 waitKey()는 일반적인 키보드 입력은 처리할 수 있지만, 함수키(F1, F2 등) 또는 화살표키 등 특수키 입력은 처리하지 못한다. 만일 키보드의 특수 키에 대한 처리를 하고 싶다면 waitKey() 대신 waitKeyEx()를 사용하면 된다.

마우스 이벤트 처리

  • OpenCV 에서 마우스 이벤트를 처리하려면 먼저 마우스 콜백 함수를 등록하고, 이후 마우스 콜백 함수에 마우스 이벤트를 처리하는 코드를 추가해야 한다.
    • OpenCv에서 특정 창에 마우스 콜백 함수를 등록할 때는 setMouseCallback() 함수를 사용한다.
    • setMouseCallback() 함수는 winname 창에서 마우스 이벤트가 발생하면 onMouse로 등록된 콜백 함수가 자동으로 호출되도록 설정한다.
    • userdata 인자에는 사용자가 마우스 콜백 함수에 전달하고 싶은 데이터를 void* 형식으로 전달할 수 있다.
    • 마우스 콜백 함수는 다음과 같이 정의되어 있다.
typedef void (*MouseCallback)(int event, int x, int y, int flags, void* userdata);
  • 마우스 콜백함수의 event 인자에는 MouseEventTypes로 정의된 열거형 상수가 전달된다.
MouseEventTypes 설명
EVENT_MOUSEMOVE 0 마우스가 창 위에서 움직임
EVENT_LBUTTONDOWN 1 마우스 왼쪽 버튼 누름
EVENT_RBUTTONDOWN 2 마우스 오른쪽 버튼 누름
EVENT_MBUTTONDOWN 3 마우스 가운데 버튼 누름
EVENT_LBUTTONUP 4 마우스 왼쪽 버튼 뗌
EVENT_RBUTTONUP 5 마우스 오른쪽 버튼 뗌 
EVENT_MBUTTONUP 6 마우스 가운데 버튼 뗌
EVENT_LBUTTONDCLICK 7 마우스 왼쪽 버튼 더블 클릭
EVENT_RBUTTONDCLICK 8 마우스 오른쪽 버튼 더블 클릭 
EVENT_MBUTTONDCLICK 9 마우스 가운데 버튼 더블 클릭
EVENT_MOUSEWHEEL 10 마우스 휠을 앞으로 돌림
EVENT_MOUSEHWHEEL 11 마우스 휠을 좌우로 돌림

 

  • 마우스 콜백함수의 flags 인자에는 MouseEventFlags 열거형 상수의 논리합이 전달된다.
MouseEventFlags 설명
EVENT_FLAG_LBUTTON 1 마우스 왼쪽 버튼이 눌려 있음
EVENT_FLAG_RBUTTON 2 마우스 오른쪽 버튼이 눌려 있음
EVENT_FLAG_MBUTTON 4 마우스 가운데 버튼이 눌려 있음
EVENT_FLAG_CTRLKEY 8 ctrl 키가 눌려있음
EVENT_FLAG_SHIFTKEY 16 shift 키가 눌려있음
EVENT_FLAG_ALTKEY 32 alt 키가 눌려있음

트랙바 사용하기

  • OpenCV에는 Window, Linux, Mac OS에서 공통으로 사용할 수 있는 트랙바(trackbar)라는 인터페이스를 제공함.
    • 트랙바는 슬라이더 컨트롤(slider control)이라고도 부르며, 영상 출력 창에 부착되어 프로그램 동작 중에 사용자가 지정된 범위 안의 값을 선택할 수 있음.
    • 트랙바는 사용자가 지정한 영상 출력 창의 상단에 부착되며, 필요한 경우 창 하나에 여러 개의 트랙바를 생성할 수 있음. 각각의 트랙바에는 고유한 이름을 지정해야 하며, 이 이름은 트랙바 왼쪽에 나타남.
    • 트랙바 위치는 사용자가 마우스를 이용하여 이동시킬 수 있고, 트랙바의 현재 위치는 트랙바 이름 옆에 함께 표시 됨.
  • OpenCV에서 트랙바를 생성하려면 createTrackbar() 함수를 이용하면 된다.
    • createTrackbar(0 함수는 winname 이름의 창에 trackbarname 이름의 트랙바를 부착하고, 트랙바가 움직일 때마다 onChange에 해당하는 트랙바 콜백 함수가 호출되도록 설정함.
    • 사용자가 트랙바 콜백 함수에 전다랗고 싶은 데이터가 있다면 userdata 인자를 통해 void* 형식으로 전달할 수 있음.
    • onChange에 지정하는 트랙바 콜백 함수는 트랙바 위치가 변경될 때 자동으로 호출되는 함수로 다음과 같이 정의되어 있음.
typedef void (*TrackbarCallback)(int pos, void* userdata);
  • 트랙바 콜백 함수의 첫 번째 인자에는 현재 트랙바의 위치 정보가 전달되고, 두 번째 인자에는 createTrackbar() 함수에서 지정한 사용자 데이터 포인터 값이 전달 됨.
  • 트랙바를 생성한 후 트랙바의 현재 위치를 알고 싶다면 getTrackbarPos() 함수를 사용하면 된다.
  • 프로그램 동작 중에 트랙바 위치를 강제로 옮기고 싶다면 setTrackbarPos()를 사용하면 된다.

OpenCV 데이터 파일 입출력

  • OpenCV에서 제공하는 FileStorage 클래스는 Mat 클래스 객체 뿐만 아니라 일반적인 C/C++ 자료형 데이터를 XML, YAML, JSON 등 파일 형식으로 저장하는 기능을 제공한다.

FileStorage 클래스

  • OpenCV에서 데이터 파일 입출력은 FileStorage가 담당하는데, FileStorage 클래스는 데이터의 파일 입출력 기능을 캡슐화하여 지원하는 클래스이다.
  • FileStorage 클래스를 이용하여 OpenCV 데이터를 저장하거나 읽어오려면 먼저 FileStorage 클래스를 생성한 후 FileStorage::open() 함수를 이용하여 실제 사용할 파일을 열어야 한다.
    • FileStorage::open() 함수의 첫 번째 인자 filename에는 데이터 파일 이름을 지정하는데, FileStorage 클래스는 XML, YAML, JSON 형식의 파일 입출력을 지원하며, 사용할 파일 형식은 filename의 확장자에 의해 자동으로 결정된다.
    • 만약 파일 이름 뒤에 .gz를 추가하면 데이터 파일을 압축하여 저장한다. 예컨대 filename을 “mydata.xml.gz”로 설정하면 XML 파일 형식으로 데이터를 저장한 후 gzip 형식으로 압축한다.
    • 두 번째 인자 flags는 파일 열기 모드를 결정하는데, FileStorage::mode 열거형 상수를 지정할 수 있다.
FileStorage::mode 열거형 상수 설명
FileStorage::READ 읽기 모드
FileStorage::WRITE 쓰기 모드 (새로 생성)
FileStorage::APPEND 추가로 쓰기 모드
FileStorage::MEMORY 논리합 연산자(|)를 이용하여 FileStorage::READ 또는 FileStorage::WRITE 상수와 함께 사용될 경우, 실제 파일 입출력 대신 메모리 버퍼를 이용한 입출력을 수행함

 

  • FileStorage::open() 이후 파일이 정상적으로 열렸는지 확인하는 함수는 FileStorage::isOpened()이다.
  • 일반적으로 FileStorage 클래스를 이용하여 파일에 데이터를 저장할 때는 << 연산자 재정의 함수를 사용하고, 파일로부터 데이터를 읽어올 때는 >> 연산자 재정의 함수를 사용한다.
  • FileStorage 객체를 이용하여 파일 입출력 작업이 완료되면 FileStorage::release() 함수를 호출해서 객체를 해제해야 한다.

데이터 파일 저장하기

  • 예제 코드
String name = "Jane";
int age = 10;
Point pt1(100, 200);
vector<int> scores = { 80, 90, 50 };
Mat mat1 = (Mat_<float>(2, 2) << 1.0f, 1.5f, 2.0f, 3.2f);

FileStorage fs("mydata.json", FileStorage::WRITE);

if (!fs.isOpened())
{
cerr << "File open failed!" << endl;
return;
}

fs << "name" << name;
fs << "age" << age;
fs << "point" << pt1;
fs << "scores" << scores;
fs << "data" << mat1;

fs.release();

데이터 파일 불러오기

  • 예제 코드
String name;
int age;
Point pt1;
vector<int> scores;
Mat mat1;

FileStorage fs("mydata.json", FileStorage::READ);

if (!fs.isOpened())
{
cerr << "File open failed!" << endl;
return;
}

fs["name"] >> name;
fs["age"] >> age;
fs["point"] >> pt1;
fs["scores"] >> scores;
fs["data"] >> mat1;

fs.release();

유용한 OpenCV 기능

마스크 연산

  • OpenCV에서는 임의의 모양을 갖는 ROI를 설정하기 위하여 일부 행렬 연산 함수에 대하여 마스크 연산을 지원한다.
    • 마스크 연산을 지원하는 OpenCV 함수는 보통 입력 영상과 크기가 같고 깊이가 CV_8U인 마스크 영상을 함께 인자로 전달 받는다.
    • 마스크 영상이 주어질 경우, 마스크 영상의 픽셀값이 0이 아닌 좌표에 대해서만 연산이 수행된다.
    • 일반적으로 마스크 영상은 사람의 눈으로도 구분이 쉽도록 픽셀 값이 0 또는 255로 구성된 흑백 영상이 사용된다.
  • Mat::setTo() 함수는 마스크 연산을 지원하는 함수로 함수의 두 번째 인자 mask에 마스크 영상을 지정할 수 있다.
    • 기본값으로 설정되어 있는 noArray()를 mask 인자로 지정하면 입력 행렬의 모든 원소 값을 value 값으로 설정하고 적절한 마스크 영상을 mask 인자로 지정하면 특정 영역에 대해서만 픽셀 값을 설정할 수 있다. 이때 마스크 영상은 Mat::setTo()를 호출하는 대상 행렬과 크기가 같아야 한다.
Mat src = imread("lenna.bmp", IMREAD_COLOR);
Mat mask = imread("mask_smile.bmp", IMREAD_GRAYSCALE);

if (src.empty() || mask.empty())
{
cerr << "Image load failed!" << endl;
return;
}

src.setTo(Scalar(0, 255, 255), mask);
  • 마스크 연산을 지원하는 또 다른 함수로 Mat::copyTo() 라는 함수가 있다.
    • 마스크 연산을 지원하는 Mat::copyTo() 함수는 mask 영상의 픽셀 값이 0이 아닌 위치에서만 *this 행렬 원소 값을 행렬 m으로 복사한다.
    • 만약 Mat::copyTo() 함수를 호출하는 *this 행렬과 인자로 전달된 m 행렬이 서로 크기 또는 타입이 같지 않을 경우, Mat::copyTo() 함수 내부에서 m.create() 함수를 호출하여 대상 영상 m을 새롭게 생성한 후 마스크 영상을 고려하여 픽셀 값을 복사한다.
    • 만약 *this 행렬과 m 행렬이 서로 크기와 타입이 같다면 m 행렬 원소 값을 그대로 유지한 상태에서 *this 행렬의 픽셀 값을 복사한다.
Mat src = imread("airplane.bmp", IMREAD_COLOR);
Mat mask = imread("mask_plane.bmp", IMREAD_GRAYSCALE);
Mat dst = imread("field.bmp", IMREAD_COLOR);

if (src.empty() || mask.empty())
{
cerr << "Image load failed!" << endl;
return;
}

src.copyTo(dst, mask);

연산 시간 측정

  • OpenCV 라이브러리는 정밀한 시간 측정 방법을 제공한다. 본래 특정 프로그램의 동작 시간을 측정하는 C/C++ 소스 코드 작성 방법은 운ㄷ영 체제마다 각기 다르지만 OpenCV 라이브러리를 이용하면 운영 체제에 상관 없이 통일된 인터페이스 함수를 사용하여 연산 시간을 측정할 수 있다.
  • OpenCV에서는 getTickCount() 함수와 getTickFrequency() 함수를 사용하여 특정 연산의 수행 시간을 측정한다.
    • getTickCount() 함수는 컴퓨터 시스템의 특정 시점부터 현재까지 발생한 틱(tick) 횟수를 반환한다. 여기서 틱 횟수는 컴퓨터 시스템에서 발생하는 클럭처럼 매우 빠르게 증가하는 성능 측정 계수를 의미하며, 컴퓨터의 성능에 따라 빠르게 증가할 수도 있고, 느리게 증가할 수도 있다.
    • 틱 횟수 차이 값은 사용하고 있는 컴퓨터의 시스템 성능에 따라 다르게 측정되므로 실제 연산 시간을 알아내기 위해서는 틱 횟수 차이를 시스템의 틱 주파수(tick frequency)로 나누는 작업이 동반되어야 한다.
    • 틱 주파수란 1초 동안 발생하는 틱 횟수를 의미하며 getTickFrequency()를 이용하여 시스템의 틱 주파수를 구할 수 있다.
int64 t1 = getTickCount();

my_func(); // do something

int64 t2 = getTickCount();
double ms = (t2 - t1) * 1000 / getTickFrequency();
  • getTickCount()와 getTickFrequency() 를 조합하는 것이 번거롭기 때문에 OpenCV 3.2.0 버전부터 연산 시간 측정을 위한 TickMeter 라는 이름의 클래스를 새롭게 제공한다.
    • 사용법은 아래와 같다.
TickMeter tm;
tm.start();

my_func(); // do something

tm.stop();
double ms = tm.getTimeMilli();

유용한 OpenCV 함수 사용법

sum() 함수와 mean() 함수

  • OpenCV에서 Mat 행렬의 원소 합을 구하고 싶을 때는 sum() 함수를 사용하고, 평균을 구하고 싶을 때는 mean() 함수를 사용한다.
    • 이 두 함수는 4채널 이하의 행렬에 대해서만 동작하며, 합과 평균을 Scalar 타입으로 반환한다.
  • mean() 함수는 마스크 연산을 지원하므로 필요한 경우 mask 영상을 지정하여 특정 영역의 원소 평균을 구할 수도 있다.
Mat img = imread("lenna.bmp", IMREAD_GRAYSCALE);

int sumVal = (int)sum(img)[0];
int meanVal = (int)mean(img)[0];

minMaxLoc() 함수

  • minMaxLoc() 함수는 행렬 또는 영상에서 최솟값, 최댓값, 그리고 최솟값과 최댓값의 위치를 찾을 때 사용한다.
    • minMaxLoc() 함수는 마스크 연산을 지원하므로 행렬 일부 영역에서의 최솟값, 최댓값과 그 위치를 구할 수 있다.
double minVal, maxVal;
Point minPos, maxPos;
minMaxLoc(img, &minVal, &maxVal, &minPos, &maxPos);

normalize() 함수

  • 행렬의 노름(norm) 값을 정규화하거나 원소 값 범위를 특정 범위로 정규화할 때 normalize() 함수를 사용한다.
  • normalize() 함수는 norm_type 인자에 따라 동작이 결정된다.
    • norm_type이 NORM_INF, NORM_L1, NORM_L2인 경우에는 \|dst\|_{L_{p}} = alpha(p = Inf, 1, 2) 수식을 만족하도록 입력 행렬 원소 값의 크기를 조정한다. 

\|dst\|_{L_{\infty}} = max_{i} |dst_{i}| = alpha

\|dst\|_{L_{1}} = \sum_{i} |dst_{i}| = alpha

\|dst\|_{L_{2}} = \sqrt{\sum_{i} dst_{i}^{2}} = alpha

  • 만약 norm_type 인자가 NORM_MINMAX인 경우에는 src 행렬의 최솟값이 alpha, 최댓값이 beta가 되도록 모든 원소 값 크기를 조절한다.
  • 많은 OpenCV 예제 코드에서 NORM_MINMAX 타입으로 normalize() 함수를 사용하고 있으며, 특히 실수로 구성된 행렬을 그레이스케일 영상 형태로 변환하고자 할 때 normalize() 함수를 사용하면 유용하다.
Mat src = Mat_<float>({1, 5}, {-1.f, -0.5f, 0.f, 0.5f, 1.f});

Mat dst;
normalize(src, dst, 0, 255, NORM_MINMAX, CV_8UC1);

cvRound() 함수

  • OpenCV에서 실수 갑의 반올림 연산을 위해 cvRound() 함수를 제공한다.
  • 이와 더불어 실수의 올림을 수행할 때는 cvCeil() 함수를 사용하고, 내림을 수행할 때는 cvFloor() 함수를 사용한다.

이상엽/ 물리적 벡터

벡터와 좌표계

평면벡터

R^{2} 에서 크기(스칼라)와 방향의 의미를 모두 포함하는 표현 도구

  • 벡터는 크기와 방향만 고려하므로 위치가 다르더라도 크기와 방향이 같으면 같은 것으로 인정한다. 고로 아래 이미지상 v와 동일한 벡터는 d가 된다.

공간벡터

R^{3} 에서 크기와 방향의 의미를 모두 포함하는 표현 도구

n차원 벡터

R^{n} 상의 벡터 v = (v_{1}, v_{2}, ... , v_{n}) = \vec{AB} = (b_{1} - a_{1}, b_{2} - a_{2}, ... , b_{n} - a_{n})

  • 영벡터 \vec{0} = 0 = (0, 0, ... , 0)
  • 두 벡터 v = (v_{1}, v_{2}, ... , v_{n}), w = (w_{1}, w_{2}, ... , w_{n}) 가 같다
    • \Leftrightarrow v_{1} = w_{1}, v_{2} = w_{2}, ... , v_{n} = w_{n}

벡터의 연산

노름

  • 벡터의 크기 (또는 길이) 라고 한다.
    • \|v\| = \sqrt{v_{1}^{2} + v_{2}^{2} + ... + v_{n}^{2}}
  • 노름이 1인 벡터를 단위벡터라고 한다.
    • 정규화: 벡터의 단위 벡터 (크기를 1)로 만드는 과정.
      • {v \over \|v\|} = \hat{v}
  • e_{1} = (1, 0, 0, ... , 0), e_{2} = (0, 1, 0, ... , 0) 등을 표준 단위벡터라고 한다.
    • 벡터를 표준단위 벡터를 이용하여 아래와 같이 표현 가능
    • v = (v_{1}, v_{2}, ... , v_{n}) = v_{1} e_{1} + v_{2} e_{2} + ... + v_{n} e_{n}

선형결합

  • 선형이라는 의미는 선으로 그려지는 것 보다는 –축소된 의미– ‘예측 가능한’ 이라는 의미로 이해하는 것이 좋다.
    • 역으로 비선형이라는 말은 ‘예측 불가능한’ (확률적인) 이라는 의미로 이해하는 것이 좋음.

벡터의 덧셈과 뺄셈

v \pm w = (v_{1} \pm w_{1}, v_{2} \pm w_{2} + ... + v_{n} \pm w_{n})

벡터의 실수배

kv = (kv_{1}, kv_{2}, ... , kv_{n})

선형(일차) 결합

R^{n} 의 벡터 w 가 임의의 실수 k_{1}, k_{2}, ... k_{r} 에 대하여

w = k_{1}v_{1}, k_{2}v_{2}, ... k_{r}v_{r} 의 형태로 쓰여지면 w v_{1}, v_{2}, ... v_{r} 의 선형(일차)결합이라 한다.

스칼라 곱

한 벡터가 다른 벡터의 방향에 대해 가한 힘에 의해 변화된 스칼라(크기), 점곱 또는 내적

  • 스칼라 결과를 얻어 내기 위한 벡터 곱
  • 점 곱(dot product) 또는 내적이라고도 한다.

v \cdot w = \|v\| \|w\| cos \theta = v{1}w_{1} + v_{2}w_{2} + ... + v_{n}w_{n}

(\theta 는 두 벡터 v, w 가 이루는 각)

  • 개념적으로 봤을 때 두 벡터의 스칼라 곱은 두 벡터의 크기를 곱한 것으로 정의한다.
  • 다만 벡터는 방향이라는 개념이 있기 때문에 단순 곱만이 아니라 추가적인 정의가 필요한데,
    • 일단 두 벡터 v, w가 같은 방향일 경우 스칼라 곱은 두 벡터의 곱으로 정의해 볼 수 있다.
      • \vec{v} \cdot \vec{w} = \|\vec{v}\| \times \|\vec{w}\|
    • 만일 두 벡터 v, w가 다른 방향일 경우, w를 v와 동일한 방향과 그렇지 않은 방향으로 분해해서 v와 곱할 수 있다.
      • 위 그림에서 w는 v와 일치하는 방향과 v와 수직인 방향으로 분해할 수 있는데, v와 일치하는 방향의 크기와 v를 곱한게 최종적인 벡터의 스칼라 곱으로 정의가 된다. (w의 크기보다 줄어드는데 이는 w의 수직 방향의 힘이 v와 같은 방향의 힘을 줄이기 때문이라고 이해할 수 있다.)
      • w를 v와 같은 방향의 벡터인 a와 v와 직교하는 방향의 벡터인 b로 분해하면 다음과 같은 수식으로 표현할 수 있다.
      • \vec{v} \cdot \vec{w} = \|\vec{v}\| \times \|\vec{a}\| = \|\vec{v}\| \times \|\vec{w}\| \times cos \theta
        • \vec{a} 의 크기는 \vec{w} 의 크기에 cos \theta 를 곱한 것과 같다.

벡터의 연산 성질

R^{n} 상의 벡터 u, v, w 와 스칼라 k, m 에 대하여 다음이 성립한다.

  • u + v = v + u
  • (u + v) + w = u + (v + w)
  • u + \vec{0} = \vec{0} + u = u
  • u + (-\vec{u}) = \vec{0}
  • k(u + v) = ku + kv
  • (k+m)u = ku + mu
  • k(mu) = (km)u
  • 1u = u
  • 0u = \vec{0}, k\vec{0} = \vec{0}
  • u \cdot v = v \cdot u
  • \vec{0} \cdot u = u \cdot \vec{0} = \vec{0}
  • u \cdot (v + w) = u \cdot v + u + \cdot w
  • (u + v) \cdot w = u \cdot w + v + \cdot w
  • k(u \cdot v) = (ku) \cdot v = u \cdot (kv)

벡터 곱

방향은 두 벡터에 동시에 수직이고 크기는 두 벡터의 평행사변형의 면적인 R^{3} 상의 벡터, 가위곱, 또는 외적

  • 벡터 결과를 얻어 내기 위한 벡터 곱
    • 같은 맥락에서 텐서 결과를 얻어 내기 위한 벡터 곱은 텐서 곱이라고 한다.
  • 가위 곱(cross product) 또는 외적 이라고도 한다.
    • 사실 외적이라는 표현은 적절하지 못한 표현인데, 텐서 곱이 외적이기 때문.
  • 벡터 곱은 오로지 3차원에서만 정의 되며, 2차원, 4차원 이상에서 정의 불가.
    • 반면 스칼라 곱은 N 차원에 대해 정의 가능.

v \times w = ( \left| \begin{array}{rr} v_{2} & v_{3} \\ w_{2} & w_{3} \end{array} \right|, -\left| \begin{array}{rr} v_{1} & v_{3} \\ w_{1} & w_{3} \end{array} \right|, \left| \begin{array}{rr} v_{1} & v_{2} \\ w_{1} & w_{2} \end{array} \right| )

  • 벡터 곱의 크기는 두 벡터의 크기의 곱이 되고 (평행사변형의 면적), 방향은 두 벡터에 동시에 수직인 방향이 된다.
    • 벡터 곱은 순서가 중요한데, 순서에 따라 벡터 곱의 방향이 바뀐다.
    • 위 예시에서 v \times w 는 위로, w \times v 는 아래로 가는 벡터가 된다.
  • 벡터 곱 연산은 두 벡터의 행렬식으로 계산된다.

벡터 곱의 성질

R^{3} 상의 벡터 u, v, w 와 스칼라 k 에 대하여 다음이 성립한다.

  • u \times v = -(v \times u)
    • 벡터 곱 순서를 바꾸면 방향이 반대가 된다.
  • u \times (v + w) = (u \times v) + (u \times w)
  • (u + v) \times w = (u \times w) + (v \times w)
  • k(u \times v) = (ku) \times v = u \times (kv)
  • u \times \vec{0} = \vec{0} \times u = \vec{0}
  • u \times u = \vec{0}
    • 자기 자신과 벡터 곱을 하면 영벡터가 된다.

벡터의 응용

직선의 표현

R^{2} 또는 R^{3} 에서 위치벡터가 a 인 점 A 를 지나며 방향벡터가 v 인 직선 상의 임의의 점 X 의 위치벡터 x

x = a + kv

을 만족한다. (단, k 는 임의의 실수)

  • 직선의 방정식이 아니라 벡터 –위치벡터와 방향벡터– 를 통해서도 직선을 표현할 수 있다는 뜻.
    • 위치벡터란 원점을 시점으로 하는 벡터를 뜻한다.
    • 방향벡터란 직선이 늘어나는 방향을 지시하는 벡터를 뜻한다.
  • y = x + 2 라는 직선의 방정식을 벡터를 이용해서 표현하면 (x, y) = (-1+k, 1+k) 의 꼴이 된다.

평면의 표현

R^{3} 에서 위치벡터가 a 인 점 A 를 지나며 법선벡터가 v 인 평면 상의 임의의 점 X 의 위치벡터 x

(x - a) \cdot v = 0

을 만족한다. 

  • 법선벡터는 평면상의 서로 다른 두 직선의 방향벡터들의 벡터 곱으로써 구하면 용이하다.
    • 법선벡터란 평면에 수직인 벡터를 뜻한다.

  • x - 2 + y + z = 0 라는 평면의 방정식을 벡터를 이용해서 표현하면 (x-2, y, z) 의 꼴이 된다.

OpenCV 4로 배우는 컴퓨터 비전과 머신 러닝/ OpenCV 주요 클래스

  • (각 자료형의 상세한 파라미터에 대해서는 이전의 <OpenCV로 배우는 영상처리 및 응용>에서 정리하였으므로 생략)

기본 자료형 클래스

Point_ 클래스

  • Point_ 클래스는 2차원 평면 위에 있는 점의 좌표를 표현하는 템플릿 클래스
  • 2차원 좌표를 나타내는 x와 y라는 이름의 멤버변수를 갖고 있다.
// 생성 및 초기화
Point pt1; // pt1 = (0, 0)
pt1.x = 5; pt1.y = 10; // pt1 = (5, 10)
Point pt2(10, 30); // pt2 = (10, 30)

// 연산
Point pt3 = pt1 + pt2; // pt3 = [15, 40]
Point pt4 = pt1 * 2; // pt4 = [10, 20]
int d1 = pt1.dot(pt2); // d1 = 350
bool b1 = (pt1 == pt2); // b1 = false

Size_ 클래스

  • 영상 또는 사각형의 크기를 표현하는 클래스.
  • 사각형 영역의 가로와 세로 크기를 나타내는 width, height 멤버 변수를 갖고 있다.
// 생성 및 초기화
Size sz1, sz2(10, 20);  // sz1 = [0 x 0], sz2 = [10 x 20]
sz1.width = 5; sz1.height = 10;  // sz1 = [5 x 10]

// 연산
Size sz3 = sz1 + sz2;  // sz3 = [15 x 30]
Size sz4 = sz1 * 2;  // sz4 = [10 x 20]
int area1 = sz4.area();  // area1 = 200

Rect_ 클래스

  • 사각형의 위치와 크기를 표현하는 클래스
  • 사각형의 좌측 상단 점의 좌표를 나타내는 x, y와 가로 세로 크기를 나타내는 width, height 멤버 변수를 갖고 있다.
// 생성 및 초기화
Rect rc1;  // rc1 = [0 x 0 from (0, 0)]
Rect rc(10, 10, 60, 40);  // rc2 = [60 x 40 from (10, 10)]

// 연산
Rect rc3 = rc1 + Size(50, 40);  // rc3 = [50 x 40 from (0, 0)]
Rect rc4 = rc2 + Point(10, 10);  // rc4 = [60 x 40 from (20, 20)]

// 논리연산
Rect rc5 = rc3 & rc4; // rc5 = [30 x 20 from (10, 10)]
Rect rc6 = rc3 | rc4; // rc6 = [80 x 60 from (0, 0)]

RotatedRect 클래스

  • 회전된 사각형을 표현하는 클래스
  • 사각형의 중심 좌표를 나타내는 center, 가로 및 세로 크기를 나타내는 size, 회전 각도를 나타내는 angle 멤버 변수를 갖고 있다.
// 생성 및 초기화
RotatedRect rr1(Point2f(40, 30), Size2f(40, 20), 30.f);  // 아래 그림 a 참조

// 사각형의 바운딩 영역 확인
Rect br = rr1.boundingRect();  // 아래 그림 b 참조

Range 클래스

  • 범위 또는 구간을 표현하는 클래스.
  • 범위의 시작과 끝을 나타내는 start와 end 멤버 변수를 갖고 있다.
// 생성 및 초기화
Range r1(0, 10);

String 클래스

  • 문자열을 다루는 클래스
  • 본래 OpenCV에서는 자체적인 String을 정의하여 사용하였음. String 클래스는 std::string 클래스와 완전히 호환되도록 설계되어서 std::string 클래스를 다루는 방식과 유사하게 사용할 수 있었음.
  • 그러다가 OpenCV 4.0 버전부터는 자체적인 String 클래스를 삭제하고 C++ 표준 라이브러리의 std::string 클래스를 String 클래스로 재정의함.
// 생성 및 초기화
String str1 = "Hello";
String str2 = "world";
String str3 = str1 + " " + str2;  // str3 = "Hello world";

bool ret = (str2 == "WORLD");  // ret = false, == 연산자는 대소문자를 구분하므로

Mat 클래스

Mat 클래스 개요

  • Mat 클래스는 일반적인 2차원 행렬뿐만 아니라 고차원 행렬을 표현할 수 있으며, 한 개 이상의 채널(channel)을 가질 수 있음.
  • Mat 클래스에는 정수, 실수, 복소수 등으로 구성된 행렬 또는 벡터(vector)를 저장할 수 있고, 그레이스케일 또는 컬러 영상을 저장할 수도 있음.
  • 경우에 따라 벡터 필드(vector field), 포인트 클라우드(point cloud), 텐서(tensor), 히스토그램(histogram) 등 정보를 저장하는 용도로 사용 됨.
  • Mat 클래스에서 행렬이 어떤 자료형을 사용하는지에 대한 정보를 깊이(depth)라고 하는데, OpenCV에서 Mat 행렬의 깊이는 다음과 같은 형식의 매크로 상수를 이용하여 표현 함.
CV_<bit_depth>{U|S|F}
  • 깊이 표현 매크로 상수 형식의 처음에 나타나는 CV_는 OpenCV를 나타내는 접두사
  • 그 뒤의 <bit_depth>에는 8, 16, 32, 64의 숫자를 지정할 수 있으며, 이는 원소 값 하나의 비트 수를 나타냄
  • 그 다음의 {U|S|F} 부분에는 U, S, F 세 문자 중 하나를 지정할 수 있는데, U는 부호 없는 정수형, S는 부호 있는 정수형, F는 부동 소수형을 의미함
  • OpenCV 라이르러리는 행렬의 깊이 표현을 위해 다음과 같은 매크로 상수를 정의하여 사용함
#define CV_8U  0  // uchar, unsigned char
#define CV_8S  1  // schar, signed char
#define CV_16U 2  // ushort, unsigned short
#define CV_16S 3  // signed short
#define CV_32S 4  // int
#define CV_32F 5  // float
#define CV_64F 6  // double
#define CV_16F 7  // float16_t
  • Mat 행렬 원소는 하나의 값을 가질 수도 있고, 여러 개의 구성된 값을 가질 수도 있다.
  • Mat 행렬 원소를 구성하는 각각의 값을 채널(channel)이라고 한다.
    • 즉, Mat 행렬은 하나의 채널을 가질 수도 있고, 여러 개의 채널을 가질 수도 있다.
    • 이때 하나의 행렬을 구성하는 각 채널은 모두 같은 자료형을 사용해야 함.
  • OpenCV에서는 Mat 행렬의 깊이 정보와 채널 수 정보를 합쳐서 Mat 객체의 타입(type)이라고 부른다. OpenCV 행렬의 타입은 다음과 같은 형식의 매크로 상수로 표현한다.
CV_<bit_depth>{U|S|F}C(<number_of_channels>)
  • 즉, Mat 행렬의 깊이 표현 매크로 뒤에 C1, C3 같은 채널 정보가 추가로 붙어 있는 형태이다.
    • 예컨대 CV_8UC1 타입은 8비트 unsigned char 자료형을 사용하고 채널이 한 개인 행렬 또는 영상을 의미한다.
    • B, G, R 세 개의 색상 성분을 가지고 있는 컬러 영상은 unsigned char 자료형을 사용하고 세 개의 채널을 가지고 있기 때문에 CV_8UC 타입이다.
    • 복소수처럼 두 개의 실수 값을 사용하는 행렬은 CV_32FC2 타입으로 만들 수 있다.

행렬의 생성과 초기화

// 생성 및 초기화
Mat img1;
Mat img2(480, 640, CV_8UC1);
Mat img3(480, 640, CV_8UC3);  // unsigned char, 1-channel
Mat img4(Size(640, 480), CV_8UC3);  // unsigned char, 3-channels
  • 행렬의 크기와 타입을 지정하여 Mat 객체를 생성하는 경우 Mat 행렬의 모든 원소는 쓰레기값(garbage value)이라고 부르는 임의의 값으로 채워지게 된다. 고로 모든 원소 값을 특정 값으로 초기화하여 사용하는 것이 안전하다.
Mat img5(480, 640, CV_8UC1, Scalar(128));  // initial values, 128
Mat img6(480, 640, CV_8UC3, Scalar(0, 0, 255));  // initial values, red
  • 새로운 행렬을 생성할 때 모든 원소 값을 0으로 초기화하는 경우가 많기 때문에 OpenCV에서는 모든 원소가 0으로 초기화된 행렬을 만드는 함수로써 Mat::zeros()를 제공한다.
Mat mat1 = Mat::zeros(3, 3, CV_32SC1);  // 0's matrix
  • 비슷하게 행렬의 모든 원소가 1로 초기화된 행렬을 생성하려면 Mat::ones()를 이용하면 되고, 단위 행렬(identity matrix)를 생성하려면 Mat:eye() 함수를 이용하면 된다.
Mat mat2 = Mat::ones(3, 3, CV_32FC1);  // 1's matrix
Mat mat3 = Mat::eye(3, 3, CV_32FC1);  // identity matrix

mat1 = \left[ \begin{array}{rrr} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array} \right]

mat2 = \left[ \begin{array}{rrr} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \end{array} \right]

mat3 = \left[ \begin{array}{rrr} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{array} \right]

  • Mat 객체를 생성할 떄, 행렬 원소를 저장할 메모리 공간을 새로 할당하는 것이 아니라 기존에 이미 할당되어 있는 메모리 공간의 데이터를 행렬 원소 값으로 사용할 수 있다.
    • 이는 외부 메모리 공간을 참조하는 방식이기 때문에 객체 생성이 빠르다는 장점이 있다. 이러한 용도의 Mat 클래스 생성자 형식은 다음과 같다.
float data[] = { 1, 2, 3, 4, 5, 6 };
Mat mat4(2, 3, CV_32FC1, data);
  • 외부 배열을 행렬 원소 값으로 사용하는 경우 외부 배열 크기와 생성할 행렬 원소 개수는 같아야 하고, 서로 사용한느 자료형도 같아야 한다.
    • 위와 같은 코드의 경우 mat4 행렬의 1행은 data 배열의 처음 세 개의 원소로 채워지고, 2행은 data 배열의 나머지 원소로 채워진다.

mat4 = \left[ \begin{array}{rrr} 1 & 2 & 3 \\ 4 & 5 & 6 \end{array} \right]

  • 사용자가 지정한 원소 값을 이용하여 Mat 객체를 생성하는 방법 중에 Mat_ 클래스를 사용하는 방법도 종종 사용된다. Mat_ 클래스는 Mat 클래스를 상속하여 만든 템플릿 클래스로 Mat_ 클래스 객체와 Mat 객체는 상호 변환이 가능하다.
    • 그런데 Mat_ 클래스는 << 연산자와 , 를 이용하여 간단하게 행렬 원소 값을 설정하는 인터페이스를 제공한다.
    • 그래서 일단 Mat_ 객체를 만들어서 << 연산자로 행렬을 지정한 후 이를 Mat 객체로 변환하여 사용하기도 한다.
Mat_<float> mat5_(2, 3);
mat5_ << 1, 2, 3, 4, 5, 6;
Mat mat5 = mat5_;

// 다음과 같이 한 줄로도 표현 가능
Mat mat5 = (Mat_<float>(2, 3) << 1, 2, 3, 4, 5, 6);

mat5 = \left[ \begin{array}{rrr} 1 & 2 & 3 \\ 4 & 5 & 6 \end{array} \right]

  • OpenCV 4.0에서는 C++ 11의 초기화 리스트(initializer list)를 이용한 행렬 초기화 방법을 사용할 수 있다.
    • Mat 클래스 또는 Mat_ 클래스의 생성자에 행렬 크기와 초깃값을 중괄호를 이용한 리스트 형태로 전달하는 방식.
    • 다만 생성된 Mat 객체의 타입을 명시적으로 지정하기 위해 Mat_ 클래스 형식으로 생성한 후 Mat 타입으로 변경하는 것이 좋다.
Mat mat6 = Mat_<float>({2, 3}, {1, 2, 3, 4, 5, 6});
  • 비어 있는 Mat 객체 또는 이미 생성된 Mat 객체에 새로운 행렬을 할당하려면 Mat 클래스의 Mat::create() 멤버 함수를 사용할 수 있다.
    • 이미 행렬 데이터가 할당되어 있는 Mat 객체에서 Mat::create() 함수를 호출할 경우, 만약 Mat::create() 함수의 인자로 지정한 행렬 크기와 타입이 기존 행렬과 모두 같으면 Mat::create() 함수는 별다른 동작을 하지 않고 그대로 함수를 종료한다.
    • 반면 새로 만들 행렬의 크기 또는 타입이 기존 행렬과 다른 경우, Mat::create() 함수는 일단 기존 메모리 공간을 해제한 후 새로운 행렬 데이터 저장을 위한 메모리 공간을 할당한다.
mat4.create(256, 256, CV_8UC3);  // 256 x 256, uchar, 3-channels
mat5.create(4, 4, CV_32FC1);  // 4 x 4, float, 1-channels
  • Mat:create() 함수는 새로 만든 행렬의 원소 값을 초기화하는 기능이 없기 때문에 행렬을 생성한 후 행렬 전체를 초기화하고 싶다면 = 연산자 재정의 또는 Mat::setTo() 멤버 함수를 이용하여 행렬 전체 원소 값을 한꺼번에 설정할 수 있다.
    • Mat:setTo() 함수는 두 개의 인자를 가지고 있지만 두 번째 인자 mask는 기본값을 가지고 있으므로 생략할 수 있다.
mat4 = Scalar(255, 0, 0);
mat5.setTo(1.f); 

행렬의 복사

  • Mat 클래스 객체에 저장된 영상 또는 행렬을 복사하는 가장 간단한 방법은 복사 생성자 또는 대입 연산자를 사용하는 방법이다.
Mat img1 = imread("dog.bmp");

Mat img2 = img1;  // 복사 생성자 - 얕은 복사

Mat img3;
img3 = img1; // 대입 연산자 - 얕은 복사
  • 만일 복사본 영상을 새로 생성할 때 픽셀 데이터를 공유하는 것이 아니라 메모리 공간을 새로 할당하여 픽셀 데이터 전체를 복사하고 싶다면 Mat::clone() 또는 Mat::copyTo() 함수를 사용해야 한다.
    • Mat::clone() 함수는 자기 자신과 동일한 Mat 객체를 완전히 새로 만들어서 반환한다. 
    • Mat::copyTo() 함수는 인자로 전달된 m 행렬에 자기 자신을 복사한다. 만약 Mat::copyTo() 함수를 호출한 행렬과 인자로 전달된 행렬 m이 서로 크기와 타입이 같으면 원소 값 복사만 수행한다.
    • 반면 서로 크기 또는 타입이 다르면 Mat::copyTo() 함수 내부에서 행렬 m을 새로 생성한 후 픽셀 값을 복사한다.
Mat img4 = img1.clone();  // 깊은 복사

Mat img5;
img1.copyTo(img5);  // 깊은 복사

부분 행렬 추출

  • Mat 클래스로 정의된 행렬에서 특정 사각형 영역의 부분 행렬을 추출하고 싶을 때는 Mat 클래스에 저으이된 괄호 연산자 재정의를 사용한다.
Mat img1 = imread("cat.bmp");
Mat img2 = img1(Rect(220, 120, 340, 240)); // 220, 120 좌표부터 340 x 240 크기만큼의 사각형 부분 영상 추출
  • 부분 영상 추출은 얕은 복사이기 때문에 부분 영상을 추출한 후 부분 영상의 픽셀 값을 수정하면 원본 영상의 픽셀 값도 함께 변경 됨.
  • 영상의 반전은 Mat 클래스 타입의 변수 앞에 ~ 연산자를 붙이는 방식으로 할 수 있다.
img2 = ~img2;
  • Mat 클래스의 부분 영상 참조 기능은 입력 영상에 사각형 모양의 관심 영역 (ROI, Region Of Interest)을 설정하는 용도로 사용할 수 있다. 
    • ROI는 영상의 전체 영역 중에서 특정 영역에 대해서만 영상 처리를 수행할 때 설정하는 영역을 의미한다.
    • 사각형이 아닌 임의의 모양의 ROI를 설정하고 싶은 경우에는 마스크 연산을 응용할 수 있다.
  • 만약 독립된 메모리 영역을 확보하여 부분 영상을 추출하고자 한다면 괄호 연산자 뒤에 Mat::clone() 함수를 사용하면 된다.
Mat img3 = img1(Rect(220, 120, 340, 240)).clone();
  • Mat 행렬에서 특정 범위의 행을 추출하고자 할 때는 Mat::rowRange()를 이용하며 특정 열을 추출하고자 할 때는 Mat:colRange() 함수를 사용할 수 있다.
    • 행 또는 열의 범위는 두 개의 int 값으로 지정할 수도 있고, Range 클래스 객체를 이용하여 지정할 수도 있다.
    • 하나의 행 또는 열을 추출하여 1행짜리 또는 1열짜리 행렬을 만들고자 할때는 Mat::row() 또는 Mat::col() 함수를 사용할 수 있다.
  • Mat::rowRange(), Mat::colRange(), Mat::row(), Mat::col() 함수들은 모두 부분 행렬을 얕은 복사 형태로 반환한다.
    • 따라서 깊은 복사를 수행하려면 Mat::clone() 함수를 함께 사용해야 한다.

행렬의 원소 값 참조

Mat::at() 함수 사용 방법

  • OpenCV에서 제공하는 가장 직관적인 행렬 원소 접근 방법은 Mat::at() 멤버 함수를 사용하는 방법이다.
    • Mat::at() 함수는 보통 행과 열을 나타내는 두 개의 정수를 인자로 받아 해당 위치의 행렬 원소 값을 참조 형식으로 반환한다.
    • Mat::at() 함수는 템플릿 함수로 정의되어 있기 때문에 Mat::at() 함수를 사용할 때는 행렬 원소 자료형을 명시적으로 지정해야 한다.
Mat mat1 = Mat::zeros(3, 4, CV_8UC1);

for (int j = 0; j < mat1.rows; j++)
{
for (int i = 0; i < mat.cols; i++)
{
mat1.at<uchar>(j, i)++;
}
}
  • 위 코드에서 Mat::at() 함수가 참조하는 행렬 원소 위치는 아래 그림과 같다.

Mat::ptr() 함수 사용 방법

  • Mat:ptr() 함수는 Mat 행렬에서 특정 행의 첫 번째 원소 주소를 반환한다.
    • Mat::ptr() 함수도 템플릿으로 정의되어 있기 때문에 행렬 원소의 자료형을 명시적으로 지정해야 한다.
    • Mat::ptr() 함수는 지정한 자료형의 포인터를 반환하며, 이 포인터를 이용하여 지정한 행의 원소에 접근할 수 있다.
for (int j = 0; j < mat1.rows; j++)
{
uchar* p = mat1.ptr<uchar>(j);

for (int i = 0; i < mat.cols; i++)
{
p[i]++;
}
}

MatIterator_ 반복자 사용 방법

  • Mat 클래스와 함께 사용할 수 있는 반복자 클래스 이름은 MatIterator_ 이다.
    • MatIterator_ 클래스는 템플릿으로 정의된 클래스이므로 Mat 행렬 타입에 맞는 자료형을 명시하여 사용해야 한다.
    • MatIterator_ 클래스를 사용하는 방식은 C++의 반복자 사용 방법과 유사하다. Mat::begin() 함수를 이용하여 행렬의 첫 번째 원소 위치를 얻을 수 있고, Mat::end() 함수를 이용하여 마지막 원소 바로 다음 위치를 얻을 수 있다.
  • MatIterator_ 반복자를 사용하면 행렬의 가로, 세로 크기에 상관없이 모든 원소를 안전하게 방문할 수 있지만, Mat::ptr() 보다 느리고, Mat::at() 처럼 임의의 위치에 자유롭게 접근할 수 없기 때문에 사용성이 높지 않은 편이다.
for (MatIterator_<uchar> it = mat1.begin<uchar>(); it != mat1.end<uchar>(); ++it)
{
(*it)++;
}

행렬 정보 참조하기

  • (Mat 클래스의 멤버 변수들 설명. 생략)

행렬 연산

// mat1과 mat2 행렬 사이의 덧셈과 뺄셈 연산
mat3 = mat1 + mat2;
mat3 = mat1 - mat2;

// mat1 행렬의 각 원소와 슼라라 s1 사이의 덧셈 및 뺄셈 연산
mat3 = mat1 + s1;
mat3 = mat1 - s1;
mat3 = s1 + mat1;
mat3 = s1 - mat1;

// mat1 행렬의 각 원소에 -1을 곱함
mat3 = -mat1;

// mat1과 mat2 행렬의 곱셈 연산
mat3 = mat1 * mat2;

// mat1 행렬의 각 원소에 실수 d1을 곱함
mat3 = mat1 * d1;
mat3 = d1 * mat1;

// mat1과 mat2 행렬의 같은 위치 원소끼리 나눗셈
mat3 = mat1 / mat2;

// mat1 행렬의 각 원소와 실수 d1끼리 나눗셈 연산
mat3 = mat1 / d1;
mat3 = d1 / mat1;
  • 위의 연산 중 * 연산은 행렬의 수학적 곱셈 연산을 의미하며, 만일 두 행렬의 같은 위치에 있는 원소끼리 곱셈 연산을 수행하려면 Mat::mul() 함수를 사용해야 한다.
  • 행렬의 역행렬은 Mat::inv() 함수를 이용해서 구할 수 있다.
    • Mat::inv() 함수는 method 인자를 통해 역행렬 계산 방법을 지정할 수 있다.
    • 역행렬이 존재하는 일반적인 행렬이라면 가우스 소거법을 사용하는 DECOMP_LU를 사용할 수 있으며, 이 값은 기본값으로 지정되어 있으므로 생략할 수 있다.
    • 역행렬이 존재하지 않는 경우 DECOMP_SVD를 지정하면 특잇값 분해(singular value decomposition) 방법을 이용하여 의사 역행렬(pseudo-inverse matrix)를 구할 수 있다.
    • DECOMP_EIG와 DECOMP_CHOLESKY는 각각 고윳값 분해와 촐레스키(Cholesky) 분해에 의한 역행렬 계산을 의미한다.
  • 행렬의 전치행렬은 Mat::t()를 이용하여 구할 수 있다.

크기 및 타입 변환 함수

  • 행렬의 타입을 변경할 때는 Mat::convertTo() 함수를 사용한다.
    • Mat::convertTo() 함수는 행렬 원소의 타입을 다른 타입으로 변경하고 추가적으로 모든 원소에 일정한 값을 더하거나 곱할 수 있다.
    • Mat::convertTo() 함수에 의해 생성되는 출력 행렬 m의 원소 값은 다음 수식에 의해 결정된다.

m(x, y) = saturate_cast<rtype>(alpha \times (*this)(x, y) + beta)

  • 일반적으로 영상은 픽셀 값을 uchar 자료형을 이용하는데, 만일 일련의 복잡한 연산을 수행해야 하는 경우 연산의 정확도를 높이기 위해 픽셀 값을 float, double 같은 실수형으로 변환하여 내부 연산을 수행해야 하는 경우가 있을 수 있다.
  • 이러한 경우에 Mat::convertTo() 함수를 사용하여 CV_8UC1 타입의 행렬을 CV_32FC1 타입으로 변경할 수 있다.
Mat img1 = imread("lenna.bmp", IMREAD_GRAYSCALE);

Mat img1f;
img1.convertTo(img1f, CV_32FC1);
  • Mat::reshape() 함수는 주어진 행렬의 크기 또는 채널 수를 변경한다.
    • Mat::reshape() 함수는 행렬 원소 데이터를 복사하여 새로운 행렬을 만드는 것이 아니라 하나의 행렬 원소 데이터를 같이 참조하는 행렬을 반환한다. 그러므로 Mat::reshape() 함수에 의해 반환된 행렬 원소 값을 변경하면 원본의 값도 함께 바뀌게 된다.
uchar data1[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 };
Mat mat1(3, 4, CV_8UC1, data1);
Mat mat2 = mat1.reshape(0, 1);

// result
// mat1: [ 1, 2, 3, 4;
// 5, 6, 7, 9;
// 9, 10, 11, 12]
// mat2: [ 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 ]
  • 행렬의 모양이 아니라 단순히 행렬의 행 크기를 변경하고 싶을 때는 Mat::resize() 함수를 사용하면 된다.
    • Mat::resize() 함수는 행렬의 행 개수를 변경하는데, 입력된 개수가 기존 행 개수보다 작으면 아래쪽 행을 제거하고, 기존 행렬의 행 개수보다 크면 아래쪽에 행을 추가한다. 이때 추가하는 행 원소의 초기값을 지정할 수 있다.
mat1.resize(5, 100);

// result
// mat1: [ 1, 2, 3, 4;
// 5, 6, 7, 9;
// 9, 10, 11, 12;
// 100, 100, 100, 100;
// 100, 100, 100, 100]
  • 이미 존재하는 행렬에 원소 데이터를 추가하고 싶을 때는 Mat::push_back() 함수를 이용할 수 있다.
    • Mat::push_back() 함수 인자로 _Tp& 또는 std::vector<_Tp>& 타입을 사용할 경우, *this 행렬은 1열짜리 행렬이어야 한다.
    • 만약 Mat_<_Tp>& 또는 Mat& 타입을 인자로 사용할 경우에는 *this 행렬과 인자로 전달된 m 행렬의 열 개수가 같아야 한다.
Mat mat3 = Mat::ones(1, 4, CV_8UC1) * 255;
mat1.push_back(mat3);

// result
// mat1: [ 1, 2, 3, 4;
// 5, 6, 7, 9;
// 9, 10, 11, 12;
// 100, 100, 100, 100;
// 100, 100, 100, 100;
// 255, 255, 255, 255]
  • Mat::push_back()과 반대로 맨 아래에 있는 행을 제거할 때는 Mat::pop_back() 함수를 이용하면 된다.

Vec과 Scalar 클래스

Vec 클래스

  • 벡터는 같은 자료형을 가진 원소 몇 개로 구성된 데이터 형식이다.
// 생성 및 초기화
Vec<uchar, 3> p1, p2(0, 0, 255);
  • 매번 Vec<uchar, 3> 형태로 입력하는 것은 번거롭기 때문에, OpenCV에서는 자주 사용되는 자료형과 개수에 대한 Vec 클래스 템플릿의 이름을 재정의를 제공한다.
    • OpenCV 에서 제공하는 Vec 클래스 템플릿의 이름 재정의는 다음 형식을 따른다.
Vec<num-of-data>{b|s|w|i|f|d}
  • <num-of-data> 위치에는 2, 3, 4 등 숫자를 지정할 수 있고, {b|s|w|i|f|d} 부분에는 b, s, w, i, f, d 문자 중 하나를 지정한다.
    • OpenCV 라이브러리에 정의된 Vec 클래스의 이름 재정의는 다음과 같다.
typedef Vec<uchar, 2> Vec2b;
typedef Vec<uchar, 3> Vec3b;
typedef Vec<uchar, 4> Vec4b;

typedef Vec<short, 2> Vec2s;
typedef Vec<short, 3> Vec3s;
typedef Vec<short, 4> Vec4s;

typedef Vec<ushort, 2> Vec2w;
typedef Vec<ushort, 3> Vec3w;
typedef Vec<ushort, 4> Vec4w;

typedef Vec<int, 2> Vec2i;
typedef Vec<int, 3> Vec3i;
typedef Vec<int, 4> Vec4i;
typedef Vec<int, 6> Vec3i;
typedef Vec<int, 8> Vec4i;

typedef Vec<float, 2> Vec2f;
typedef Vec<float, 3> Vec3f;
typedef Vec<float, 4> Vec4f;
typedef Vec<float, 6> Vec4f;

typedef Vec<double, 2> Vec2d;
typedef Vec<double, 3> Vec3d;
typedef Vec<double, 4> Vec4d;
typedef Vec<double, 6> Vec4d;
  • Vec 클래스는 [ ] 연산자가 재정의되어 있기 때문에 [ ] 연산자를 이용하여 멤버 변수 val 배열에 쉽게 접근할 수 있다.

Scalar 클래스

  • Scalar 클래스는 4채널 이하의 영상에서 픽셀 값을 표현하는 용도로 자주 사용된다.
    • Scalar 클래스는 Scalar_ 라는 이름의 클래스 템플릿 이름 재정의이며, Scalar_ 클래스는 Vec 클래스를 상속받아 만들어졌다.
    • Scalar 클래스는 보통 네 개 이하의 채널을 갖는 영상의 픽셀 값을 표현하는 용도로 사용된다.
      • 그레이스케일 영상의 경우 Scalar 클래스의 첫 번째 원소가 픽셀 밝기를 표현하고 나머지 세 개는 0으로 설정된다.
      • 트루컬러 영상의 경우, 처음 세 개 원소가 B, G, R 색상 성분 값을 표현하고 네 번째 원소는 보통 0으로 설정된다.
      • 간혹 PNG 파일 처럼 투명도를 표현하는 알파 채널이 있는 경우 Scalar 클래스의 네 번째 원소를 이용하기도 한다.
Scalar(밝기)
Scalar(파란색, 녹색, 빨간색)
Scalar(파란색, 녹색, 빨간색, 투명도)

InputArray와 OutputArray 클래스

  • InputArray 클래스는 주로 OpenCV 함수의 입력으로 사용되고, OutputArray 클래스는 OpenCV 함수의 출력으로 사용되는 인터페이스 클래스이다.

InputArray 클래스

  • InputArray 클래스는 Mat, vector<T> 등 다양한 타입을 표현할 수 있는 인터페이스 클래스로서 OpenCV 함수의 입력 인자 자료형으로 주로 사용된다.
    • _InputArray 클래스는 Mat, Mat_<T>, Matx<T, m, n>, vector<T>, vector<vector<T>>, vector<Mat>, vector<Mat_<T>, UMat, vector<UMat>, double 같은 다양한 타입으로부터 생성될 수 있는 인터페이스 클래스이다.
    • _InputArray 클래스는 OpenCV 라이브러리 내부에서 코드 구현 편의상 사용되며, 사용자가 명시적으로 _InputArray 클래스의 인스턴스 또는 변수를 생성하여 사용하는 것을 금지하고 있다.
  • 만약 OpenCV에서 제공하는 함수처럼 사용자 저으이 함수에서 Mat 객체뿐만 아니라 vector<T> 타입의 객체를 한꺼번에 전달받을 수 있게 만들고 싶다면 사용자 저으이 함수 인자에 InputArray 타입을 사용할 수 있다.
    • 그리고 실제 함수 본문에서는 _InputArray 클래스의 멤버 함수인 _InputArray::getMat() 함수를 사용하여 Mat 객체 타입 형태로 변환해서 사용해야 한다.

OutputArray 클래스

  • _OutputArray 클래스는 클래스 계층적으로 _InputArray 클래스를 상속받아 만들어졌다. 그러므로 _OutputArray 클래스도 Mat 또는 vector<T> 같은 타입의 객체로부터 생성될 수 있다.
  • 다만 _OutputArray 클래스는 새로운 행렬을 생성하는 _OutputArray:create() 함수가 추가적으로 정의되어 있다.
    • 그래서 OpenCV의 많은 영상 처리 함수는 결과 영상을 저장할 새로운 행렬을 먼저 생성한 후, 영상 처리 결과를 저장하는 형태로 구현되어 있다.
  • OutputArray 클래스도 InputArray와 마찬가지로 사용자가 직접 OutputArray 타입의 변수를 생성해서 사용하면 안 된다.
    • OutputArray 타입으로 정의된 OpenCV 함수의 인자에는 Mat 또는 vector<T> 같은 타입의 변수를 전달하는 형태로 코드를 작성해야 한다.
  • 영상에 그림을 그리는 몇몇 OpenCV 함수는 입력 영상 자체를 변경하여 다시 출력으로 반환하는 경우가 있으며, 이러한 함수는 InputOutputArray 클래스 타입의 인자를 사용한다.
    • 이 클래스는 입력과 출력의 역할을 동시에 수행할 때 사용된다.

이상엽/ 행렬과 행렬식

행렬

용어정리

용어 설명
성분 행렬 안에 배열된 구성원 (=항=원소)
행렬의 가로줄
행렬의 세로줄
m \times n 행렬 m 개의 행과 n 개의 열로 이루어진 행렬
주대각선 행렬의 왼쪽 위에서 오른쪽 아래를 가르는 선
대각성분

주대각선에 걸치는 행과 열의 지표수가 같은 성분 (i, i 성분)

대각성분으로만 이루어진 행렬을 대각행렬이라 한다.

ex) \left( \begin{array}{rrr} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{array} \right)

영행렬 모든 성분이 0인 행렬
전치행렬

(a_{ij}) 에 대하여 (a_{ji})  

i와 j의 자리를 바꾼 행렬

대칭행렬 A = A^{T} A
정사각행렬 행, 열의 개수가 같은 행렬
단위행렬 모든 대각성분이 1이고 그 외의 성분은 0인 정사각행렬

행렬의 연산

덧셈과 뺄셈

m \times n 행렬 A = (a_{ij}) , B = (b_{ij}) 에 대해

A \pm B = (a_{ij} \pm b_{ij})

상수배

m \times n 행렬 A = (a_{ij}) 에 대해

상수 c 에 대해 cA = (ca_{ij})

곱셈

m \times n 행렬 A = (a_{ij}) n \times r 행렬 B = (b_{jk}) 에 대해

AB = (c_{ik}) : m \times r 행렬

단, c_{ik} = \sum_{j = 1}^{n} a_{ij} b_{jk}

행렬의 곱셈은 교환법칙이 성립되지 않는다.

  • 행렬의 곱셈은 함수 합성과 비슷한 개념이다.
  • 두 함수가 f(x, y) = (ax+by, cx+dy), g(x, y) = (px+qy, rx+sy) 라고 할 때, 두 함수의 합성은 다음과 같다.
    • f \circ g \\ = (apx + aqy + brx + bsy, cpx + cgy + drx + dsy) \\ = ((ap+br)x + (aq+bs)y, (cp+dr)x + (cq+ds)y)
  • 두 행렬이 F = \left( \begin{array}{rr} a & b \\ c & d  \end{array} \right), G = \left( \begin{array}{rr} p & q \\ r & s  \end{array} \right) 라고 할 때, 두 행렬의 곱은 다음과 같다.
    • FG = \left( \begin{array}{rr} ap+br & aq+bs \\ cp+dr & cq+ds  \end{array} \right)
  • 결국 두 함수의 합성과 두 행렬의 곱이 결과가 같다.
    • 행렬의 곱의 규칙이 앞 행렬의 행과 뒤 행렬의 열을 곱하는 이유가 이러한 까닭.

연립일차방정식

행렬의 표현

예를 들어 $latex \begin{cases} x + 2y = 5 \\ 2x + 3y = 8 \end{cases} 를

  1. \left( \begin{array}{rrr} 1 & 2 & 5 \\ 2 & 3 & 8 \end{array} \right) 는 가우스 조던 소거법
  2. \left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right) \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{r} 5 \\ 8 \end{array} \right) 은 역행렬을 이용

가우스 조던 소거법

다음 세 가지의 기본 행 연산을 통해 연립일차방정식의 첨가행렬을 기약 행사다리꼴로 변환하여 해를 구한다.

  1. 한 행을 상수배한다.
  2. 한 행을 상수배하여 다른 행에 더한다.
  3. 두 행을 맞바꾼다.

역행렬 이용

연립일차방정식 AX = B 에서 A 의 역행렬 A^{-1} 가 존재하면, X = A^{-1}B 이다

예를 들어

\left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right) \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{r} 5 \\ 8 \end{array} \right) \Leftrightarrow \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right)^{-1} \left( \begin{array}{r} 5 \\ 8 \end{array} \right)

행렬식

행렬식이란?

정사각행렬 A 를 하나의 수로써 대응시키는 특별한 함수. det A = |A|

  • 행렬식은 행렬보다 먼저 있었던 개념.

이때 A

0 \times 0 \Rightarrow det ( ) = 0

1 \times 1 \Rightarrow det (a) = a

2 \times 2 \Rightarrow det (\left( \begin{array}{rr} a_{11} & a_{12} \\ a_{21} & a_{22} \end{array} \right)) = a_{11} a_{22} - a_{12} a_{21}

3 \times 3 \Rightarrow det (\left( \begin{array}{rrr} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{array} \right)) \\ = a_{11} M_{11} - a_{12} M_{12} + a_{13} M_{13} \\ = a_{11} \left| \begin{array}{rr} a_{22} & a_{23} \\ a_{32} & a_{33} \end{array} \right| - a_{12} \left| \begin{array}{rr} a_{21} & a_{23} \\ a_{31} & a_{33} \end{array} \right| + a_{13} |\left| \begin{array}{rr} a_{21} & a_{22} \\ a_{31} & a_{32} \end{array} \right| \\ = a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}  

  • M_{ij} 란 행렬 A 에서 i 행과 j 열을 제외한 나머지 행렬을 말함.
    • M은 Minor Matrix로 소행렬이라고 한다. (원래 행렬에서 일부를 제외한 나머지 행렬)
  • M은 꼭 1행을 기준으로 잡지 않아도 된다. 1열을 기준으로 하거나 다른 것을 기준으로 해도 결과는 같다.
    • 최종적으로 a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}   의 꼴이 나오기만 하면 되기 때문.
  • 사루스 법칙
    • 첫 번째 원소로부터 오른쪽 아래 대각선으로 그으면서 곱하여 더함. 모두 더한 후에는 가장 오른쪽 원소로부터 왼쪽 아래 대각선을 그으면서 앞의 값에서 뺀다.
    • 그러면 결국 a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}   의 꼴이 나옴.

4 \times 4 \Rightarrow det A = a_{11} M_{11} - a_{12} M_{12} + a_{13} M_{13} - a_{14} M_{14}

  • 행렬식의 계산은 위와 같이 일반화 된다.
    • 첫 행렬과 그 행렬이 포함된 행렬을 제외한 마이너 행렬을 곱한것을 차례로 더했다가 뺐다가를 반복하면 된다.
    • 이 계산을 일반화 하면 2×2 행렬에서 ad – bc가 되는 것도 같은 원리가 된다.

역행렬

행렬식이 0이면 역행렬이 존재하지 않는다. 즉, 행렬식이 0이 아닌 정사각 행렬 A 의 역행렬 A^{-1}

A^{-1} = { 1 \over det A } \left( \begin{array}{rrr} C_{11} & C_{22} & ... \\ C_{12} & C_{22} & ... \\ ... & ... & ... \end{array} \right) (단 C_{ij} = (-1)^{i+j} M_{ij} )

  • C 는 수반행렬이라고 한다.
  • C_{ij} M_{ij} 에 순서대로 +, -를 번갈아 붙인 값이 된다.
  • 수반행렬(C_{ij} ) 는 원래 행렬과 순서가 전치됨.

ex)

\left( \begin{array}{rr} a & b \\ c & d \end{array} \right)^{-1} = { 1 \over ad - bc } \left( \begin{array}{rr} d & -b \\ -c & a \end{array} \right)

  • 역행렬은 교환법칙이 성립한다.
    • AB = I \\ \Rightarrow BABB^{-1} = BIB^{-1} \\ \Rightarrow BAI = BB^{-1} \\ \Rightarrow BA = I

크래머 공식

연립일차방정식 AX = B 에서 A 가 행렬식이 0이 아닌 정사각행렬일 때,

x_{j} = { det A_{j} \over det A } = { \left| \begin{array}{rrrrr} a_{11} & ... & b_{1} & ... & a_{1n} \\ a_{21} & ... & b_{2} & ... & a_{2n} \\ ... & ... & ... & ... & ... \\ a_{n1} & ... & b_{n} & ... & a_{nn} \end{array} \right| \over \left| \begin{array}{rrrrr} a_{11} & ... & a_{1j} & ... & a_{1n} \\ a_{21} & ... & a_{2j} & ... & a_{2n} \\ ... & ... & ... & ... & ... \\ a_{n1} & ... & a_{nj} & ... & a_{nn} \end{array} \right| }

단, j = 1, ... , n 이고 A_{j} A j 번째 열을 B 의 원소로 바꾼 행렬이다.

  • 크래머 공식은 행렬 전체를 구하는게 아니라 그 중에 일부 원소에 대한 값만 빠르게 구할 수 있는 방법.
    • 행렬의 구조를 이용해서 정리한 내용이라 행렬 계산을 반복해서 보면 자명하게 이해된다.
    • 행렬 연산의 구조를 이용해서 이렇게 저렇게 짜맞추고 최종 결과를 이끌어 냄.

이상엽/ 선택공리

선택공리

선택함수

집합 X (\neq \emptyset) 의 부분집합들의 집합족을 \{ A_{i} \} 이라 할 때,

\forall i \in I, f(A_{i}) \in A_{i} f : \{ A_{i} \} \to X

선택공리

공집합이 아닌 임의의 집합에 대한 선택함수가 존재한다.

참고) 선택공리는 ‘공집합을 원소로 갖지 않는 서로소인 집합족 \mathcal{F} 의 원소들에서 하나씩 원소를 선택하여 갖는 집합이 존재한다’ 라고도 해석이 가능하다.

동치인 명제

극대원리

임의의 부분순서집합은 극대인 쇄를 갖는다.

조른의 원리

모든 쇄가 위로 유계인 부분순서집합의 극대원소를 갖는다.

정렬원리

모든 집합은 정렬가능하다.

즉, 모든 집합은 적당한 순서관계를 부여하여 정렬집합으로 만들 수 있다.

그 외의 명제들

  • 라그랑주 원리
  • 타르스키 원리
  • 티호노프 원리
  • 타이히뮐러-투키 원리
  • 임의의 두 기수의 비교가능원리
  • 모든 벡터공간의 기저존재원리

함의되는 명제

  • 괴델의 완전성 원리
  • 베르의 범주원리
  • 한-바나흐 원리
  • 바나흐-타르스키 역설
  • 닐센-슈라이어 원리
  • 모든 체의 대수적 폐포존재 원리

이상엽/ 집합의 순서

부분순서집합

정의

부분순서관계

반사적, 반대칭적, 추이적인 관계

  • ex 1) 두 집합 A, B 에 대하여 A \subseteq B
  • ex 2) 두 실수 x, y 에 대하여 x \leq x
  • ex 3) 두 자연수 n, m 에 대하여 n m 의 배수인 관계

부분순서집합

집합 A 상에 부분순서관계 \leq 가 주어진 경우 A 를 부분순서집합이라 하고 이를 (A, \leq) 로 나타내기도 한다.

  • 집합 A \leq 관계가 부여 됐을 뿐이지, 집합 A 의 모든 원소들이 순서 관계를 가져야 하는 것은 아니다.
  • ex) A = \{ \emptyset, \{ 1 \}, \{ 2 \}, \{ 1, 2 \} \} 일 때, 
    • 다음의 관계는 성립하지만
      • \emptyset \to \{ 1 \}  
      • \emptyset \to \{ 2 \}  
      • \emptyset \to \{ 1, 2 \}  
      • \{ 1 \} \to \{ 1, 2 \}  
      • \{ 2 \} \to \{ 1, 2 \}  
    • 다음의 관계는 성립하지 않는다.
      • \{ 1 \} \to \{ 2 \}
      • \{ 2 \} \to \{ 1 \}
    • 즉 모든 원소들이 부분순서 관계를 갖지는 않는다는 것.

극대원소와 극소원소

A 가 부분순서집합이라 할 때,

  • \forall x \in A, x \geq a \Rightarrow x = a 를 만족하는 A 의 원소 a 를 극대원소,
  • \forall x \in A, x \leq b \Rightarrow x = b 를 만족하는 A 의 원소 b 를 극소원소라 한다.
  • ex) 멱집합 P(X) 에서 \emptyset, X
  • 극대, 극소 원소는 유일하지 않다. 극대, 극소는 최대, 최소와는 다르다.
  • ex) 집합 A = \{ a, b, c, d, e \} 의 관계가 다음과 같다면
    • a \to c  
    • b \to c  
    • b \to d  
    • d \to e  
    • c, e는 극대원소가 되고
    • a, b는 극소원소가 된다.

최대원소와 최소원소

A 가 부분순서집합이라 할 때,

  • \forall x \in A, x \leq a 를 만족하는 A 의 원소 a 를 최대원소,
  • \forall x \in A, x \geq b 를 만족하는 A 의 원소 b 를 최소원소라 한다.
  • 극대, 극소와 달리 최대, 최소는 유일하다.

상한과 하한

  • 극대-극소, 최대-최소를 무한집합에 적용하기 어렵기 때문에 만들어진 개념이 상계-하계, 상한-하한
  • 해당 집합을 포함하는 집합을 더 큰 정의하고 그 더 큰 집합을 이용해서 상계-하계와 상한-하한을 정의함. 

상계와 하계

B 가 부분순서집합 A 의 부분집합이라 할 때,

  • \forall x \in B, x \leq a a \in A A 에서 B 의 상계,
  • \forall x \in B, x \geq b b \in A A 에서 B 의 하계라 한다.
  • 상계-하계는 항상 존재하지 않음.

상한과 하한

부분순서집합 A 의 부분집합 B 에 대하여

  • B 의 상계들의 집합이 최소 원소를 가질 때 이 원소를 A 에서 B 의 상한이라 하고, sup B 로 나타낸다.
  • B 의 하계들의 집합이 최대 원소를 가질 때 이 원소를 A 에서 B 의 하한이라 하고, inf B 로 나타낸다.
  • ex) A = [ 0, 1 ) \subset \mathbb{R} 에서 0, 1

절편과 절단

절편

부분순서집합 A 의 원소 a 에 대하여

  • S_{a} = \{ x \in A | x < a \}
    • 집합 아래에 표시된 숫자보다 작은 숫자들을 모은 집합이라고 생각하면 된다.
  • ex 1) \mathbb{R} 의 절편 S_{0} = (- \infty, 0)
  • ex 2) \mathbb{N} 의 절편 S_{3} = \{ 1, 2 \}

절단

  1. B \cap C = \emptyset, B \cup C = A
  2. x \in B \wedge y \leq x \Rightarrow y \in B
  3. x \in C \wedge x \leq y \Rightarrow y \in C

를 만족하는 부분순서집합 A 의 공집합이 아닌 부분집합들의 쌍 (B, C)

  • ex) \mathbb{R} 의 두 부분집합 M = (- \infty, 0), N = [0, \infty) 에 대하여 (M, N)
  • 일종의 분할과 비슷하다.

순서동형

순서보존함수

부분순서집합 A, B 에 대하여

  • 함수 f : A \to B 가 조건 \forall x, y \in A, x \leq y \Rightarrow f(x) \leq f(y) 을 만족하면
  • f 를 순서보존함수라 한다.
  • 순서만 보장되면 되기 때문에, 집합 A와 집합 B의 크기가 달라도 무방하다.

순서동형

부분순서집합 A, B 에 대하여

  • 함수 f : A \to B 가 전단사이고 \forall x, y \in A, x \leq y \Rightarrow f(x) \leq f(y) 이면 f 를 순서동형사상이라 한다.
  • 이때 A, B 는 순서동형이라 하고 A \simeq B 로 나타낸다.
  • ex) 항등함수 I_{A} : A \to A

전순서집합

전순서집합

비교가능

부분순서집합 A 의 두 원소 x, y x \leq y \vee y \leq x 이면 x, y 는 비교가능하다고 한다.

  • ex) 집합 A = \{ a, b, c, d \} 의 관계가 다음과 같을 때
    • a \to c  
    • b \to c  
    • c \to d  
    • 다른 원소들 간에는 비교가 가능하지만 a와 b는 비교가 불가능하다.

전순서집합

부분순서집합 A 의 임의의 두 원소가 비교가능하면 A 를 전순서집합이라고 한다.

  • 집합 내의 모든 원소가 비교 가능한 상태이면 전순서집합이 된다.

부분순서집합 A 의 전순서 부분집합 B A 에서의 쇄라고 한다.

  • ex) 집합 A = \{ a, b, c, d \} 의 관계가 다음과 같을 때
    • a \to c  
    • b \to c  
    • c \to d  
  •  A 는 전순서 집합이 아니지만, 만일 A 의 부분집합을  B = \{ a, c, d \} 로 잡으면 B 는 전순서집합이 되고, 이 때 B A 의 쇄라고 한다.

정렬집합

부분순서집합 A 의 공집합이 아닌 모든 부분집합 B 가 최소원소를 가지면, 그리고 그 때에만 집합  A 를 정렬집합이라 한다.

  • ex)
    • ((0, 1), \leq) 는 전순서집합이긴 하지만, 최소 원소를 갖고 있지 않기 때문에 정렬집합은 아니다.
    • (\mathbb{N}, \leq) 는 전순서집합이기도 하고 정렬집합이기도 하다.
  • 따라서 정렬집합이면 전순서집합이다. 그 역은 성립하지 않는다.

서수

서수의 개념

서수

집합의 길이를 나타내는 수

  1. 모든 정렬집합 A 에 대하여 서수가 존재하며, 모든 순서수 \alpha 에 대하여, o(A) = \alpha 인 정렬집합 A 가 존재한다.
    • 책에 따라 ord(A) 라고 표기하기도 함.
  2. A \approx B \Leftrightarrow o(A) = o(B)
  3. A = \emptyset \Leftrightarrow o(A) = 0
  4. A \approx \{ 1, 2, ... , k \} \Leftrightarrow o(A) = k
  • 기수와 서수의 가장 큰 차이는 구조가 들어가느냐 하는 것.

유한서수와 초한서수

유한서수란 유한정렬집합의 기수이고, 초한서수란 무한정렬집합의 서수이다.

  • <대표적인 초한서수>
    • \omega = o(\mathbb{N})

서수의 순서

정렬집합 A, B 에 대하여 o(A) = \alpha, o(B) = \beta 일 때,

  • A B 의 절편과 순서동형이면 \alpha \beta 보다 작거나 같다고 하며 \alpha \leqslant \beta 로 나타낸다.
  • 이때 특히 \alpha \neq \beta 이면 \alpha < \beta 로 나타낸다.

서수의 연산

서수 합

서로소인 두 집합 A, B 의 서수를 각각 \alpha, \beta 라고 할 때 \alpha + \beta = o(A \cup B)

  • ex) A = \{ 1 \}, B = \{ a, b \} 라면 
    • B B_{1} = \{ 2, 3 \} 로 변환한 후에
    • 그 둘을 합하여 A \cup B = \{ 1, 2, 3 \}   을 만든다.

서수 곱

서로소인 두 집합 A, B 의 서수를 각각 \alpha, \beta 라고 할 때\alpha \beta = o(B \times A)

  • 순서쌍의 순서는 앞의 것을 먼저, 뒤의 것을 그 다음에 보는 것이 자연스럽다 –사전식 순서
  • 뒤의 것을 앞으로 놓고 곱하는 것이 사전식 순서 결과를 만들 수 있기 때문에 서수곱은 뒤의 것을 먼저두는 식으로 한다. 이것은 일종의 수학적 약속.

연산 법칙

임의의 서수 \alpha, \beta, \gamma 에 대하여 다음이 성립한다.

  • 결합법칙
    • (\alpha + \beta) + \gamma = \alpha + (\beta + \gamma)
    • \alpha (\beta \gamma) = (\alpha \beta) \gamma
  • 분배법칙
    • \alpha (\beta + \gamma) = \alpha \beta + \alpha \gamma
    • 단 (\alpha + \beta) \gamma \neq \alpha \gamma + \beta \gamma
      • 좌측 분배 법칙은 성립하지만, 우측 분배 법칙은 성립하지 않는다.
      • 2 \cdot (\omega + 1) = 2 \cdot \omega + 2
      • (\omega + 1) \cdot 2 \neq \omega \cdot 2 + 2
  • 일반적으로 서수는 합과 곱에 대하여 교환법칙이 성립하지 않는다.
    • 1 + \omega \neq \omega + 1
    • 2 \cdot \omega \neq \omega \cdot 2
  1.  

이상엽/ 연속체 가설

집한론의 역설

칸토어의 역설

칸토어의 정리

임의의 집합 X 에 대하여 \#X < \#P(X) 이다.

  • (크거나 같은 것이 아니라 아예 큰 것)
  • (멱집합의 기수는 2^{X} 가 되는데, 원래 집합이 공집합이었을 때 조차도 2^{0} = 1 이 되어서 멱집합은 항상 원래 집합 보다 크게 된다.)

칸토어의 역설

모든 집합들의 집합을 U , 그 기수를 \#U = \kappa 라 하자.

그러면 칸토어의 정리에 따라 U 의 멱집합의 기수 \#P(U) \#P(U) = 2^{\kappa} > \kappa = \#U 이지만, 이는 \#U \geq \#P(U) 이어야 하는 가정에 모순이 된다.

  • (멱집합의 기수가 원래 집합보다 같거나 큰 것이 아니라 항상 크기 때문에 역설이 발생)

러셀의 역설

모든 집합들의 집합을 U 라 하자.

그러면 S = \{ A \in U | A \notin A \} 는 하나의 집합이 된다. (여기서 S는 자기 자신을 원소로 갖지 않는 집합들의 집합)

만약 S \in S 라 하자. 그러면 S 의 정의에 의해 S \notin S 이다.

만약 S \notin S 라고 하자. 그러면 S 의 정의에 의해 S \in S 이다.

따라서 U 는 존재하지 않는다.

  • (칸토어의 역설이나 러셀의 역설이나 모두 모든 집합들의 집합은 존재하지 않는다는 증명)

공리적 집합론

ZFC

체르멜로(Zermelo)-프렝켈(Fraenkel)의 ZF 공리계에 선택공리(Axiom of choice)가 추가된 공리계.

체르멜로가 확장공리/ 짝공리/ 공집합공리/ 무한공리/ 합집합공리/멱집합공리/분류공리꼴 7개를 만들었고, 이후에 체르멜로 공리계의 허술함을 보완하기 위해 폰노인만의 정칙성공리와 프렝켈의 치환공리꼴이 추가 되어 ZF 공리계가 완성 됨. 최종적으로 선택공리가 추가되어 ZFC가 완성 됨.

현대 수학의 표준적인 수학기초론으로 다음 10가지 공리 및 공리꼴을 가지고 집합론을 구성한다.

  • 확장공리
    • 두 집합의 모든 원소가 일치하면 두 집합은 동일하다
  • 짝공리
    • 두 집합을 원소로 하는 집합이 존재한다.
  • 공집합공리
    • 아무런 원소도 갖지 않는 집합(공집합)도 존재한다. 
  • 무한공리
    • 무한 집합이 존재한다.
  • 합집합공리
    • 집합족의 합집합도 집합이다.
  • 멱집합공리
    • 집합의 멱집합도 집합이다.
  • 분류공리꼴
    • 명제함수가 참이 되게 하는 집합의 원소들을 갖고 집합을 만들어도 집합이다.
  • 정칙성공리
    • X라는 집합이 공집합이 아니면 X와 서로소인 원소를 갖는 집합도 집합이다.
  • 치환공리꼴
    • 미지수 x, y가 포함된 논리식이 있을 때, 논리식이 참이 되게 하는 y들의 집합도 집합이다.
  • 선택공리 (Axiom of choice)

그 외의 집합론

NBG

ZFC의 보존적 확장 형태로, 고유 모임을 포함하는 집합론.

폰 노이만-베르나이스-괴델의 이름을 따서 만들어짐.

고유 모임(proper class)이란 집합이 아닌 모임을 의미.

MK

NBG에서 재귀적 정의를 허용한 집합론.

모스-켈리의 이름을 따서 만들어짐.

연속체 가설

정의

칸토어의 연속체 가설

두 초한기수 \aleph_{0}, \varsigma 에 대하여, \aleph_{0} < x < \varsigma 를 만족하는 기수 x 는 존재하지 않는다. 

일반화 연속체 가설

임의의 초한기수 \kappa 에 대하여, \kappa < x < 2^{\kappa} 를 만족하는 기수 x 는 존재하지 않는다. 

ZFC 와의 관계

연속체 가설은 ZFC와 독립적이다. 즉, ZFC 에서는 연속체 가설을 증명할 수도, 반증할 수도 없다.

다른 공리와의 관계

구성 가능성 공리

ZFC에 구성 가능성 공리를 추가하면 일반화 연속체 가설이 참이다.

고유 강제법 공리

고유 강제법 공리를 가정하면 칸토어의 연속체 가설은 거짓이다.

러셀 서양철학사/ 논리 분석철학

  • 피타고라스 시대 이후 철학사에서는 주로 수학에서 영감을 받아 사유를 전개한 철학자와 경험과학에서 더 많은 영향을 받은 철학자 사이에 대립이 존재했다.
    • 플라톤, 토마스 아퀴나스, 스피노자, 칸트는 수학에서 영감을 받은 편이고, 데모크리토스, 아리스토텔레스, 로크에서 현대에 이르는 현대 경험주의자들은 반대파에 속한다.
  • 이러한 철학의 기원은 수학자들이 수학적 주제에서 오류와 느슨한 추리를 일소하는 일에 착수하면서 이룩한 업적에 있다.
  • 17세기 활동한 위대한 수학자들은 낙관적 태도로 빠른 결과를 내고 싶어 했다. 그 결과 그들은 해석 기하학과 미적분학의 토대를 불확실한 상태로 남겨두었다.
  • 라이프니츠는 무한소가 실재한다고 믿었는데, 이러한 믿음은 그의 형이상학에 적합하기는 했지만 수학의 관점에서 보면 논리적 근거가 없었다.
  • 바이어슈트라스는 19세기 중엽 무한소 없이 미적분학을 확립할 수 있는 방법을 찾아냄으로써 마침내 미적분학에 확실한 논리적 근거를 마련해 주었다.
  • 다음에 칸토어는 연속과 무한수의 이론을 발전시켰다. 그가 정의내리기 전까지 ‘연속’은 모호한 말로서 형이상학의 지리멸렬한 면을 수학에 들여오고 싶어 했던 헤겔 같은 철학자들에게 편리하게 이용되기도 했다.
    • 칸토어는 연속(continuity)이란 말에 정확한 의미를 부여함으로써 그가 정의한 연속이 수학자나 물리학자들에게 필요한 개념이란 사실을 보여주었다. 이로써 베르그송의 경우와 같은 다수의 신비주의는 헛된 체계가 되었다.
    • 칸토어는 또한 무한수(infinite number)와 관련해서 여러 해 동안 수학자들을 괴롭혀 온 논리적 수수께끼를 풀었다.
    • (이하 칸토어의 무한 개념에 대한 설명 생략)
    • 칸토어는 ‘무한’ 집합을 전체 집합이 포함하는 만큼 많은 항을 포함한 부분들을 갖는 집합으로 정의했다. 이러한 기초 위에 그는 무한수에 대한 가장 흥미로운 수학 이론을 세울 수 있었고, 이로써 이전에는 신비주의와 혼란에 빠져 있던 정수 영역을 정확한 논리의 영역에 들여 놓았다.
  • 프레게의 연구에서 산수, 그리고 순수 수학은 일반적으로 연역 논리의 연장일 뿐이라는 결론이 도출된다.
    • 이러한 결론은 산수 명제가 ‘종합 판단’이고 시간에 대한 언급을 포함한다는 칸트의 이론을 반증한다.
  • 철학의 작업이 대부분 지금까지 사용된 관례보다 다소 넓은 의미로 사용해야 하기는 하지만, ‘구문론(syntax)’이라 불러도 좋은 체계로 환원될 수 있다는 사실이 점차 분명해졌다.
    • 몇몇 철학자, 특히 카르나프는 철학의 모든 문제는 실제로 구문론과 관련된 문제여서 구문에서 오류를 범하지 않으면 철학의 문제들은 해결되거나 해결 불가능하다고 입증된다는 이론을 제의했다.
    • (구문론에 대한 러셀의 설명 생략)
  • 사실 수학적 지식은 경험에서 유래한 귀납법을 통해 획득되지 않는다. 
    • 수학은 여전히 경험적인 지식은 아니다. 그런데 수학은 또한 세계에 대한 선험적 지식도 아니다.
    • 사실상 수학은 언어와 관련된 지식일 뿐이다.
  • 물리학은 순수 수학과 마찬가지로 논리 분석철학에 재료를 제공했다. 이 일은 특히 상대성 이론과 양자 역학을 통해 일어났다.
    • 철학자들이 보기에 상대성 이론에서 중요한 부분은 시간과 공간을 시공간으로 대체한 점이다.
    • 상식에 따르면 물리 세계는 일정한 시기에 걸쳐 지속하고 공간 속에서 이동하는 ‘사물들’로 구성된다. 철학과 물리학은 ‘사물’이란 개념을 ‘물질적 실체’라는 개념으로 발전시켜서 물질적 실체는 제각기 미세하고 모든 시간에 걸쳐 지속하는 입자들로 구성된다고 생각했다.
    • 아인슈타인은 입자를 사건으로 대체했다. 사건은 제각기 다른 각 사건과 ‘간격’이라는 관계를 맺으며, 간격은 다양한 방식으로 시간요소와 공간요소로 분석될 수 있었다. 
    • 다양한 방식 가운데 어느 방식을 선택하느냐는 임의적인 문제였기 때문에 어느 한 방식도 다른 방식에 비해 이론적 차원에서 더 선호될만하지 않았다.
    • 앞서 말한 사실로부터 입자가 아닌 사건이 바로 물리학이 다루는 ‘재료’가 되어야 한다는 결론이 도출되는 듯하다. 입자로 생각되던 사물은 일련의 사건으로 생각해야 할 것이다.
  • 물리학이 물질을 덜 물질적인 대상으로 만드는 사이에 심리학은 정신을 덜 정신적인 대상으로 만들었다. 
    • 앞에서 관념 연합을 조건반사와 비교해보는 기회가 있었다. 관념 연합을 대체한 조건반사는 분명히 생리학에 훨씬 더 가깝다. 
    • 요컨대 양쪽 끝에서 물리학과 심리학은 서로 접근하면서 윌리엄 제임스가 ‘의식’을 비판한 끝에 도달한 중성적 일원론(neutralmonism)의 학설을 세울 수 있게 했다.
  • 현대 물리학과 생리학은 예부터 이어진 지각의 문제에 새로운 빛을 던져주었다.
    • 만약 지각(perception)이라는 현상이 존재한다면 지각은 어느 정도 지각된 대상의 결과일 수밖에 없으며, 지각이 지각 대상에 대한 지식의 근원이라면 대상과 다소라도 유사할 수 밖에 없다.
    • 첫째 필요조건은 범위가 크든 작든 세계의 나머지 부분과 독립된 인과 계열들이 성립해야만 충족될 수 있다. 물리학에 따르면 이것은 사실로 드러난다.
  • 내가(러셀이) 윤곽을 제시했던 현대 분석적 경험주의는 수학을 체화하고 강력한 논리적 방법을 발전시킨 점에서 로크, 버클리, 흄의 경험주의와 다르다.
    • 요컨대 현대 분석적 경험주의에서는 특정한 문제에 대해 철학이 아니라 과학의 특질인 명확한 답변을 제시할 수 있다는 말이다.
    • 이러한 경험주의 철학은 체계를 구성하는 철학들보다 장점이 많은데, 우주 전체에 대한 포괄적인 이론을 일거에 창안하는 대신에 한 번에 한 문제씩 다룰 수 있다.
    • 이 점에서 현대 분석적 경험주의의 방법은 과학의 방법과 유사하다. 나는 철학적 지식이 가능한 한에서 철학은 분석적 방법을 추구해야 한다고 확신한다. 또한 분석적 방법을 통해 예부터 이어진 많은 문제들을 말끔히 해결할 수 있으리라 확신한다.
  • 하지만 전통적으로 철학에 포함되지만 과학적 방법으로 적절하게 다루기 힘든 중대한 분야가 남는다. 이 분야는 궁극적인 가치의 문제를 포함한다.
  • 철학은 역사를 관통하면서 조화를 이루지 못한 채 혼합된 두 부분으로 구성되었다.
    • 한 부분은 세계의 본석에 대한 이론이고 다른 한 부분은 최선의 삶의 방식데 대한 윤리 혹은 장치 학설이다. 두 부분을 충분히 명료하게 분리하지 못했기 때문에 혼란에 빠진 사고방식이 많이 생겨났다.
  • 지성의 측면에서 보면 철학은 잘못된 도덕적 고찰의 결과로는 비범한 정도까지 진보하지 못했다.
  • 논리적 분석을 철학의 주된 직무로 삼은 철학자들은 위에서 말한 모든 증명을 거부했다.
    • 그들은 솔직하게 인간 지성이 인류에게 의미심장한 가치가 있는 많은 문제에 대해 결정적인 해답을 찾을 수 없다고 고백하지만, 과학과 지성에 드러나지 않는 숨겨진 진리를 발견할지도 모르는 고상한 인식 방법이 있다고 믿지도 않는다.
    • 그들은 이렇게 체념하는 태도 덕분에 이전에는 형이상학의 오리무중에서 모호한 채로 남아 있던 많은 문제에 정확하게 답할 수 있다는 사실을 발견하면서 이해하려는 갈망을 제외하면 철학자의 어떤 기질도 개입되지 않는 객관적인 방법을 고안했다.

러셀 서양철학사/ 존 듀이

  • 듀이의 연구가 지닌 주된 가치는 전통적인 ‘진리’ 개념을 비판한데 있으며 자신이 ‘도구주의’라 부른 이론 속에서 구체적으로 표현했다.
    • 대부분의 전문적인 철학자들의 생각에 의하면, 진리는 정적이고 궁극적이며 완벽하고 영원하다.
    • 듀이의 관심은 수학이 아니라 생물학이기 때문에 사유를 진화의 한 과정으로 이해한다. 물론 전통적인 견해도 인간이 점차 더 많이 알게 된다는 점을 인정할 테지만, 성취한 각 부분의 지식은 궁극적인 무엇으로 여겨진다.
    • 그는 인간의 지식이란 유기적인 전체로서 모든 부분을 거쳐 점차 성장하지만 완전한 전체에 이를 때까지는 어떤 부분의 지식도 완벽하지 않다고 생각한다.
  • (러셀의 비판 생략)
  • 듀이는 절대적으로 ‘참’이 될 판단들을 목표로 삼지 않으며, 모순된 판단들을 절대적인 ‘거짓’으로 단정하지도 않는다.
    • 그의 견해에 따르면 ‘탐구’라 불리는 과정은 유기체와 환경 사이에 상호 조정이 이루어지는 한 형식이다.
  • 듀이는 탐구(inquiry)를 진리나 지식이 아니라 논리의 핵심으로 삼는다. 
    • 그는 탐구를 이렇게 정의한다. “탐구는 미정의 상황을 원래 상황의 구성 요소들이 통일된 전체가 되도록 특징과 관계가 결정된 상황으로 변형시키는 통제된 과정이다”
    • 그는 또 “탐구는 객관적 대상의 객관적 변형에 관계한다”고 덧붙인다.
  • (러셀의 비판 생략)

러셀 서양철학사/ 윌리엄 제임스

  • 윌리엄 제임스는 ‘근본 경험주의’라는 학설을 창안했고, ‘실용주의’나 ‘도구주의’로 불리는 이론을 주창한 세 주역 가운데 한 사람이다.
  • 제임스의 근본 경험주의 학설은 <의식은 존재하는가?>라는 논문에서 최초로 공표되었다.
    • 이 논문의 주요 목적은 주체와 객체 관계가 근본적인 관계라는 사실을 부정하는데 있었다.
    • 그때까지만 해도 철학자들은 ‘인식활동’이라는 일종의 사건이 존재하며, 그 안에서 한 존재, 즉 인식하는자 혹은 주체가 다른 존재, 즉 인식되는 사물 혹은 객체를 의힉산하든 사실을 당연하게 받아들였다.
    • 인식하는 자는 정식 혹은 영혼으로 생각되었고, 인식되는 객체는 물체, 영원한 본질, 타인의 정신이고 자기의식의 경우에는 인식하는 자가 되기도 한다.
    • 일반적으로 인정을 받은 철학에 포함된 내용은 거의 대부분 주체와 객체의 이원론과 밀접한 관계가 있었다.
    • 정신과 물질의 구분, 관조적 이상, 그리고 전통적인 ‘진리’ 개념은 모두 주체와 객체의 구분이 기본적인 것이 아니라면 근본적으로 재고해 보아야 한다.
  • 그는 의식이란 “실재하지 않는 것의 이름이며 제이 ㄹ원리들 가운데 하나가 될 정당한 자격이 없다. 의식에 여전히 집착하는 사람들은 단순한 메아리, 철학의 대기 중에서 사라져가는 ‘영혼’이 뒤에 남긴 희미한 풍설에 집착하는 셈이다”라고 말한다.
    • 그는 이어서 “물체와 대조를 이루며 물체에 대한 사유가 만들어지는 원래부터 있던 재료 혹은 존재의 본질은 존재하지 않는다”
    • 그러면서 그는 사유가 인식의 기능을 수행하며 그 기능을 ‘의식’이라 부를 수 있다는 사실을 부정하지 않는다는 설명을 덧붙인다.
    • 그가 부정하는 견해는 조잡하게 표현하면 의식이란 하나의 ‘사물’이라는 견해로 간주될 수도 있다.
    • 그는 세계의 모든 존재가 구성되는 근본 재료만이 존재한다고 주장한다. 그는 이 근본 재료를 ‘순수 경험’이라 부르며, 인식활동은 순수 경험의 두 부분 사이에 맺어지는 특별한 관계라고 말한다.
    • 주체와 객체의 관계는 파생된 관계로서 “내 생각에 경험은 그러한 내적 이중 관계를 갖지 않는다” 주어진 경험의 나뉘지 않는 부분은 한 맥락에서는 인식하는 자이고 다른 맥락에서는 인식되는 무엇이다.
  • (이하 러셀 설명 생략)
  • 제임스의 말을 들어보면 관념은 우리 경험의 다른 부분과 만족스러운 관계를 맺도록 도와주는 한에서 참이 된다. “관념은 그것을 믿는 것이 우리의 삶에 유익하기만 하면 ‘참’이다”
    • 진리는 선(좋음)의 한 종류지 독립적인 범주에 해당되지 않는다. 진리는 관념에서 생기며, 사건들에 의해 참으로 만들어진다.
  • (이하 러셀 비판 생략)