virsh 를 통해 Ubuntu 20.04 에 console 로 접속하는 방법

KVM 가상화 시스템에서 virsh 를 통해 Ubuntu Guest OS에 Console 로 접속하는 방법은 다양한데 대부분 grub 부팅 옵션을 손보는 것이 였다. 하지만 Ubuntu 20.04 로 넘어오면서 이 방법이 훨씬 간단해 졌다.

먼저 Ubuntu 20.04 Guest 에 접속한 후에 다음과 같이 입력 하면 끝난다.

이렇게 한 후에 KVM 시스템에서 console 접속을 하면 접속이 잘된다.

이 방법은 18.04 에서도 가능하다.

Kubernetes 설치

Kubernetes 설치에 대해서 다룬다. 이번에는 Ubuntu 20.04 LTS, Centos 8.2 기반으로 진행했으며 이전에 설치에서 CNI 를 Calico 로 진행 했다. 더 나가 Helm, Metric Server 까지 진행 한다.

설치 환경은 다음과 같다.

  • Master
    • Distribution: Ubuntu 20.04
    • IP: 192.168.96.31
    • Hostname: kmaster
    • account: systemv
  • Worker Node
    • Distribution: CentOS 8.2
    • IP: 192.168.96.32
    • Hostname: knode
    • account: systemv
  • CNI: Calico
  • Helm 설치
  • Metric Server 설치

공통 설정 부분

Master, Node 두 서버 모두 Static IP 주소를 가지고 있어야 한다. 그리고 모두 일반 계정을 가지고 있어야 하며 이 일반 계정은 sudo 사용 권한을 가지고 있어야 한다.

sudo 권한 부여

CentOS 8.2 의 경우에 일반 계정을 생성한 후에 sudo 권한을 주고 싶다면 다음과 같이 하면 된다.

CentOS 8.2 에는 wheel 라고 하는 특수한 그룹이 존재하는데, sudo 설정에는 이 그룹에 한해 sudo 사용 권한을 부여하고 있어 일반 계정 systemv 에 sudo 를 사용하게하고 싶다면 wheel 그룹에 포함시키면 된다.

Ubuntu 20.04 에서는 다음과 같이 일반계정에 sudo 권한을 부여할 수 있다.

br_netfilter 모듈 로딩

br_netfilter 커널 모듈을 로딩해 줘야 한다. 기존에는 modprobe 설정으로 했지만 이제는 systemd 를 활용하면 되는데 ubuntu 20.04, CentOS 8.2 이 모두 이를 사용하고 있어서 적용 가능하다.

다음과 같이 모듈이름으로 conf 파일을 생성해 준다.

물론 이렇게 하면 시스템을 재부팅을 하더라도 자동으로 모듈이 로딩 된다.

커널 네트워크 파라메터

다음과 같이 커널 파라메터를 수정해 줘야 한다.

/etc/hosts 파일 편집

Master, Node 서버 양쪽 모두에 /etc/hosts 파일에 각 서버 정보를 다음과 같이 입력해준다.

swapoff 설정

kubernetes 는 swap 파티션이 존재할 경우에 동작하지 않을 수 있다. 예를들어, kubeadm 명령어로 뭔가를 할려고 할경우에 swap 파티션이 존재할 경우에 오류를 내면서 작동되지 않는다.

Master, Worke 양쪽 모두에 swap 을 off 로 해준다.

이렇게 하면 swap 이 비활성화 된다. 그리고 반드시 /etc/fstab 에서 swap 관련 마운트 설정을 주석처리 해준다.

CentOS 8.2 에서 설정

SELinux off

CentOS 8.2 에서 설정은 SELinux 설정이다. 다음과 같이 해준다.

firewalld 비활성화

이것은 systemctl 로 다음과 같이 가능하다.

패키지 설치

Ubuntu 에서 설정

패키지 설치

Docker 설치 및 설정

Kubernetes 는 Docker 를 기반으로하는 서비스다. 당연히 설치를 해줘야 하는데, 설치 관련 내용은 다음에 링크에서 각 배포판마다 잘 설명되어 있다.

한가지, Docker 설치를 위한 패키지 저장소는 명령어와 파일을 생성하는 방법 두가지가 있다.

Ubuntu 20.04

ubuntu 에서는 add-apt-repository 명령어로 저장소 URL 을 추가 가능하다. 예를 들면 다음과 같다.

저장소 추가가 되었다면 다음과 같이 Docker 를 설치해 준다.

CentOS 8.2

CentOS 8.2 에서는 yum-config-manager 명령어를 이용해서 추가할 수 있다. 이 명령어는 yum-utils 패키지에 포함되어 있어 설치하면 사용할 수 있다.

저장소 추가가 되었다면 다음과 같이 Docker 를 설치해 준다.

현시점에서 위와같은 오류가 발생한다. CentOS 8 에 대한 containerd 저장소가 존재하지 않기 때문에 필요한 정보만 출력하고 오류를 낸다. 수동으로 필요한 패키지를 다운받아서 해결한다.

수동으로 설치는 정상적으로 진행된다. 그리고 다음과 같이 Docker 를 설치해 준다.

CentOS 8.2 에서 Docker 를 설치하면 필요한 서비스가 자동으로 시작되지 않는다. 이를 위해서 다음과 같이 systemd 를 설정해주고 시작해준다.

CGroup Driver 설정

Ubuntu, CentOS 모두 공통으로 Docker 를 설정해 주는 부분이 존재한다. 바로 Driver 를 systemd 로 바꿔줘야 한다.

Kubernetes 를 설치할때에 Cgroup driver 를 systemd 로 추천하고 있다. 그래서 Kubernetes 만 systemd 로 드라이버를 교체하면 docker 와 통신이 되지 않는다. 이것을 위해서 Docker 에서도 드라이버를 systemd 로 교체해 준다.

다음과 같이 확인이 가능하다.

Kubernetes 설치

Ubuntu 20.04

Master 로 사용될 Ubuntu 20.04 에서 다음과 같이 Kubernetes 패키지 저장소를 추가 한다.

xenial 은 Ubuntu 16.04 를 말하는데 Ubuntu 20.04 에 설치하는데 아무런 문제가 없다.

다음과 같이 kubeadm, kubelet, kubectl 을 설치해 준다.

CentOS 8.2

CentOS 8.2 에서는 다음과 같이 Kubernetes 패키지 저장소를 추가 한다.

그리고 다음과 같이 Kubernetes 를 설치해 준다.

Master 설정

Master 를 다른 말로 Control Plaine 이라고도 한다. 이것을 만드는 것은 kubeadm 을 이용한다. 일반 계정으로 실행 한다.

Kubernetes Master 명령은 전부 일반계정으로 하도록 되어 있어 있다. 일반계정이 kube api 통신을 위한 설정을 위 출력에 나온데로 실행해주면 된다.

하지만 문제가 있다. 다음을 보자.

kmaster 가 ‘NotReady’ 나오고 coredns 상태가 ‘Pending’ 이다. kubelet 로그를 보자.

NetworkPlugin 이 없어 오류가 나오는 것으로 이는 CNI(Container Network Interface) 를 필요로 한다.

Calico 설치

Calico 는 Flannel 처럼 Kubernetes Cluster 에 네트워킹을 가능하도록 해준다. CNI 를 위한 컴포넌트중에 하나라고 보면 되는데, 한가지 주의해야 할 것은 반드시 메뉴얼을 읽어보고 해야 한다는 것이다.

Calico 는 Kubernetes 가 운영되는 환경에 따라 설치과정에 차이가 있으며 심지여 같은 운영환경이라고 할지라도 node 의 수에 따라서 설치해줘야하는 것도 다르다.

이 메뉴얼은 OnPremise 환경이며, 50 node 이하를 가지고 있음으로 아주 간단하게 다음과 같이 yaml 파일 하나만 다운로드 받아서 적용해주면 된다.

이제 시간을 조금 기달려서 모든 pods 가 정상으로 Running 인지를 확인해 본다.

그리고 nodes 의 상태를 확인해 본다.

“Ready” 상태가 되었음으로 이제 Worker Node 를 추가해 보자.

Worker Node 추가.

Worker Node 는 knode 서버에서 다음과 같이 Kubernetes Cluster 에 join 하겠다는 것으로 실현된다. join 을 위한 파라메터는 kmaster 에서 kubeadm 으로 cluster 를 생성할때 보여준 값을 입력하면 된다.

이렇게 한 다음에 kmaster 서버에서 다음과 같이 knode 가 추가되고 상태가 Ready 된다면 Worker Node 추가가 완료된 것이다.

Helm 3 설치하기

Helm 은 Kubernetes 에서 작동하는 많은 Application 들을 손쉽게 설치하도록 도와주는 프로그램이다. 마치 Ubuntu 의 APT 나 CentOS 의 Yum 이 프로그램 설치를 손쉽게 해주는것과 같다.

한가지 변화가 있다. Helm 2 와 Helm 3 은 완전히 다르다고 생각해야 한다. Helm 2 는 Tiller 라고 해서 Helm 서버가 필요했지만 Helm 3 에서는 이것이 없어졌다.

Helm 3 는 설치 스크립트를 제공함으로 이것을 이용하면 손쉽게 설치할 수 있다. 설치 Node는 kubectl 을 사용할 수 있는 곳이라면 어디선든 사용이 가능하다.

Helm 3 설치

Helm 3 설치는 스크립트로 제공한다.

설치는 그냥 바이너리를 다운로드 받아서 /usr/bin 에 helm 바이너리를 설치하는 것으로 끝난다.

정상적으로 설치됐는지 확인은 다음과 같이 한다.

한가지 문제는 기본 repository 주소가 없어서 뭐든 설치할려면 설치가 안된다. 이를 위해서 다음과 같이 저장소를 추가해 준다.

Helm 3 은 이것으로 끝이다. 이전 Helm 2 버전에 비해 해줘야 하는 것이 없다.

Metric Server 설치

Kubernetes 를 설치하게 되면 자원에 대한 모니터링이 필요하다. 과거에는 Heapster 를 이용했지만 이것은 이제 더 이상 개발이 되지 않고 있으며 이를 대체하는 것이 Metric Server 이다.

Kubernetes 에서 뭔가를 설치하는 것은 대부분 Pods 를 설치하는 것이며 이것에 대한 Rules, Datastore 등도 한꺼번에 설정을 해준다.

Metric Server 를 설치하게 되면 Kubernetes 의 컴포넌트들에 대한 자원 모니터링이 가능해지며 이것을 이용해 Autoscaling 에도 사용이 가능해진다.

Downloads

Metric Server 를 다음과 같이 다운로드를 한다.

TLS 수정

Metric Server 를 설치할때에 주의해야 할 것은 Kube API 서버와의 통신에서 사용할 TLS 를 수정하는 것이다. Metric Server 는 Public TLS 를 기본으로 하지만 Kube API 는 Kube 자체의 TLS 를 사용하기 때문에 그냥 설치하면 문제가 된다.

Deploy

이제 이것을 Deploy 해준다. Kubernetes 에서는 설치라는게 없다. 모두 다 pods 로 다 올라가기 때문에 Deploy 라고 한다.

위와같이 관련된 설정과 pods, deploy, service 등이 생성이 된다.

확인

Metric Server 의 확인은 pods, deploy 가 제대로 되었는지를 살펴보면 된다.

그리고 1~2분을 기다리면 후에 다음과 같이 자원이 출력이 되는지를 보면 된다.

CPU, Memory 등과 같은 자원 현황이 출력이 되면 정상적으로 작동하는 것이다.

VSCode 폰트 변경하기

VSCode 폰트(font) 변경하기에 대해서 알아본다. 환경도 윈도우즈가 아닌 리눅스(Linux) 에서 VSCode 폰트 변경이다. 리눅스 환경에서 폰트변경은 뭐든 쉬운 일이 아니다.

폰트(font) 알기 – fc-list

리눅스에서 폰트는 fc-list 명령어를 통해서 알 수 있다.

결과를 보면 다음과 같은 정보를 보여준다.

  1. 설치된 폰트 파일(전체 경로 포함)
  2. 폰트 이름.
  3. 스타일. 스타일은 Regular, Bold, Italic 등이다.

옵션없이 실행하자 설치된 모든 폰트들을 보여준다. 이 명령어에는 필터 기능을 제공한다.

‘:’ 를 기준으로 필터를 줄 수 있다. 필터는 ‘:’ 를 기준으로 연달아 적어주면 되는데 위의 예제는 언어가 ko 인 것만을 보여주도록 옵션을 줬다. 하지만 결과를 보면 중국어, 홍콩, 일본등도 함께 출련된다. 이것은 CJK 폰트의 특성이다. CJK 는 중국어,일본어,한국어만을 따로 모아 놓은 폰트를 말한다.

다음과 같은 필터를 사용할 수 있다.

  1. fc-list : family
  2. fc-list : lang=ko family
  3. fc-list : family style
  4. fc-list –format=”%{family[0]}\n” | sort | uniq

위 보기에서 2번째 명령어를 통해서 한글을 지원하는 폰트를 알아낸다. 나는 “Noto Sans Mono CJK KR” 를 선택했다.

VSCode 폰트 변경

리눅스용 VSCode 는 설정을 열기위한 단축키를 제공하는데, Shift + Ctl + P 를 누르면 된다. 여기서 ‘설정열기(JSON)’ 선택해 자신만의 설정을 커스터마이징 할 수 있다. 폰트 변경은 다음과 같이 했다.

폰트 이름에 공백(Space) 가 들어간 경우에 홑따옴표(‘) 로 감싸준다. 새로운 폰트 이름을 적자마자 바로 적용된다.

Oracle Linux 8 UEK 커널 설치

Oracle Linux 는 UEK(Unbreakable Enterprise Kernel) 라고 해서 커널을 제공 한다. Oracle 은 이를통해 최신의 커널을 제공하고 자신들만의 퍼포먼스 패치를 더해서 고성능을 낼수 있도록 했다. Oracle Linux 8 에서 UEK 커널을 설치해 보자.

Yum Repository 확인

Oracle Linux 8 에는 uek 를 위한 yum repository 가 추가되어 있다. 다음과 같이 확인이 가능하다.

‘ol8_UEKR6’ 가 uek 를 위한 저장소(repository) 이다. 이제 다음과 같이 어떤 버전의 uek 커널이 있는지 다음과 같이 체크해보자.

현재 시점에서 5.4 버전의 uek 커널이 있음을 알 수 있다.

시스템 커널 유지 개수

yum 은 자동으로 패키지를 설치해주고 더 이상 필요없는 패키지는 삭제해주며, 의존성도 함께 해결해준다. 커널의 경우에는 버전마다 설치가 되는데 이렇게 되면 아주 많은 커널이 설치가되어서 부팅시 많은 커널들이 보이게 된다.

이런문제를 해소하기 위해서 yum 은 같은 패키지의 경우에 다양한 버전에 한해서 몇개까지 유지할지 개수를 제한하는데 이것이 ‘installonly_limit’ 이다. 이는 다음과 같이 /etc/yum.conf 파일에 저장된다.

초기값은 3 인데, uek 를 설치하게되면 기본 커널도 삭제될 가능성도 있기 때문에 이것을 5로 교체해준다.

설치

설치는 yum 명령어를 이용해 간단히 다음과 같이 설치 할 수 있다.

자동으로 uek 의 최신 버전을 다운로드 받아 설치해 준다. 재부팅을하면 uek 커널로 올라올 것이다.

Oracle Linux 8.2 설치

Oracle 에서 만들어서 배포하는 Oracle Linux 8.2 를 설치해 본다. 현 시점(2020.07) 에서 최신버전은 Oracle Linux 8.2 이다.

다운로드

Oracle Linux 를 설치를 위해 준비된 이미지는 두가지로 전체 패키지를 담은 DVD 이미지와 Boot 이미지를 제공한다. Boot 이미지는 또 일반 커널과 UEK 커널을 가지는 버전으로 제공한다. 어느걸 하던 상관은 없다.

설치

다운받은 이미지를 USB 나 CD 로 구워서 부팅을 한다.

부팅을 하면 위와 같은 화면이 나온다. 여기서 “Install Oracle Linux 8.2.0” 를 선택해서 설치를 진행한다.

설치는 CentOS 설치 화면과 동일하다. 부팅을 uek boot 이미지를 이용해서 부팅을 했기 때문에 설치를 위한 패키지가 존재하지 않는다. 따라서 반드시 인터넷이 되어야 한다. 그래서 설치할때에 반드시 Network 설정을 먼저해 줘야 한다.

Network 설정

나는 iptime 공유기를 이용하고 있기 때문에 DHCP 만으로 설치하는 Oracle Linux 서버의 ip 설정을 끝냈다. 물론 고정IP 를 설정해도 된다. 일단 인터넷이 되어야 한다.

패키지 저장소 지정.

uek boot 이미지로 부팅을 했기 때문에 패키지를 인터넷을 통해서 다운받아야 한다. 다운받을 주소를 지정해준다. 이 주소는 다음의 링크에서 확인이 가능하다.

위 링크에서 “Installation Media Packages” 에서 BaseOS 8.2 에 x86_64 링크를 클릭해서 나오는 화면에 오른쪽에 Direct Yum Repository URL 주소를 입력해주면 된다.

나머지는 모두 CentOS 설치와 완전히 동일하다. 개인적으로 여기에 Oracle DB 를 설치하고자 파티션을 다음과 같이 나눴다.

  1. / – 40GB
  2. swap – 12GB

Spring5 Security 기초 템플릿 – Session

이 글은 Spring5 에 Spring-Security 에 대한 기초 템플릿이다. Session 유지를 위해서 Redis 를 필요로 한다. 또, ElasticSearch 의 RestHighLevelClient 로 ElasticSearch를 연결 한다. 데이터베이스는 JNDI 설정으로 연결 된다.

다음과 같은 내용을 담았다.

  1. JDK 11
  2. Tomcat 서버 9 를 이용.
  3. spring-session.xml 을 작성해 Redis 를 세션으로 사용하도록 했다.
  4. JNDI 를 이용해 MySQL 에 연결된다.

Redis 설정한 이유는 Spring Security 에 인증을 InMemory 를 요구 한다. 이는 다음과 같은 설정 때문이다.

인증을 위한 패스워드가 {bcrypt} 로 되어 있다. 이 설정은 InMemory 세션을 요구한다. 이를 위해서 spring-session.xml 을 작성해 web.xml 에서 다음과 같이 인식을 시켜 준다.

Spring5 Security 기초 템플릿

이 문서는 Spring5 Security 기초 템플릿에 대한 것이다. Spring5 에 Spring-Security 를 이용해 기초적인 로그인을 구현 했다. Session 은 InMemory 가 아닌 WAS 서버에 세션을 저장한다. 로그인 정보는 spring-security.xml 에 정의된 것을 그대로 사용했다. 그야말로 기초적인 내용만 담았다.

이 템플릿이 동작하기 위한 조건은 다음과 같다.

  1. Java 1.8 기반.
  2. 데이터베이스가 연결되어 있어야 한다. 데이터베이스는 MySQL 이다.
  3. WAS 서버에 JNDI 를 연결된다.
  4. users 테이블이 필요한데, user.sql 파일에 내용이 있다.
  5. spring security 의 Role 기반 권한 접근 제어.
  6. context root 는 malluser 이다.

작동방식

Login 화면

권한을 체크하기 때문에 로그인 화면이 먼저 나온다. 권한 체크는 다음과 같이 Controller 에서 이루어진다.

ROLE_USER 권한을 가지고 있다면 초기화면에 접근이 가능하며 그렇지 않다면 로그인 화면으로 돌아가게 된다.

인증을 위한 정보는 다음과 같이 구현 됐다.

{noop} 은 암화화 되지 않는 text 기반의 암호을 말하는 것이며 위 설정은 외부 정보 저장소를 이용하지 않는 것이다.

로그인을 하면 다음과 같은 화면이 나온다.

로그인 화면

LOGOUT 버튼은 다음과 JSP 에서 Security tags 를 이용해 구현 했다.

Eclipse 에서 제작되었다.

Mybatis에 DAO 와 Mapper

SpringFramework 을 이용하다보면 데이터베이스 액세스를 위해서 MyBatis 를 사용하곤 한다. SQL 매퍼라고 불리기도 하는 것인데, 이를 이용하면 손쉽게 자바 코드와 SQL 문을 분리해줄 수 있을뿐만 아니라 MyBatis 에서 제공하는 여러가지 추가적인 기능을 이용해 데이터베이스를 좀 더 유연하게 사용할 수 있다.

DAO

보통 MyBatis 를 이용할대는 DAO 를 구조를 사용하곤 했다. Data Access Object 라고 불리는 것으로 말 그대로 데이터 접근을 위한 객체로서 sqlSession 객체를 이용해 데이터베이스 조회만 전담하는 객체다.

이 구조는 인터페이스와 그것을 구현한 구현체 클래스가 있어야 한다. 이를 위해서 Spring의 컨텍스트 설정을 해줘야 하는데 대략 다음과 같다.

sqlSession 을 빈으로 등록해준다. 그리고 다음과 같이 DAO 를 작성해 준다.

UserDAOImpl 은 UserDAO 인터페이스의 구현체다. SqlSession 의 빈을 가지고 오기 위해서 와이어를 걸어서 가지고 왔고, SQL 매퍼를 찾기위한 네임스페이스와 파라메터 인자를 주고 selectOne 메소드를 호출하고 있다.

이제 이것을 Service 계층에서, 역시나, 와이어를 걸어서 가지와서 데이터베이스에 데이터를 값을 호출하고 있다.

많은 프로젝트에서 이와 유사한 구조를 자주 보게 된다.

Mapper

그런데, 신기하게도 Mapper 을 이용해서 DAO 를 사용할 수도 있다. 이 기능은 MyBatis 3.0 이상부터 지원하기 시작한 것으로 Mapper 인터페이스만 구현하고 Service 계층에서 바로 와이어를 걸어서 사용할 수 있도록 했다.

하지만 DAO 구조에서도 얼마든지 Mapper 를 사용할 수 있다. sqlSession 에 메소드의 파라메터를 Mapper 클래스로 넘기면 된다. 먼저 Mapper 인터페이스를 다음과 같이 만든다.

그리고 앞에 DAO 구현체에 메소드를 다음과 같이 바꾼다.

sqlSession 객체에는 getMapper 는 메소드가 존재하고 이는 MyBatis 가 지원하는 Mapper 인터페이스를 받게 되어 있다.

문제는 MyBatis 의 namespace 인데, Mapper 인터페이스의 경로를 적어주면 되며 id 가 Mapper 인터페이스의 메소드 이름과 매핑된다.

이렇게 함으로써 Mapper 를 이용하면서도 DAO 구조를 그대로 유지할 수 있다. 문제는 DAO 에서 Mapper 인터페이스 객체를 매번 생성해 줘야 한다는 것이다. sqlSession.getMapper 를 이용해서 매번 가지고 오게 되는데, 이렇게 하는 것보다는 Spring Context 에서 빈으로 등록해 와이어로 가지고 오게 되면 DAO 가 아닌 Service 계층에서 호출이 가능하다.

다음과 같이 빈으로 등록한다.

이제 Service 계층에서 다음과 같이 와이어로 가지고 오고 바로 사용할 수 있다.

하지만 이렇게 할 경우에 Mapper 인터페이스 객체 하나하나 전부 Spring Context 에서 빈으로 만들어 줘야 한다. 그래서 이렇게 하지말고 Mapper 인터페이스를 스캔하도록 할 수 있는데 이를 위해서 mybatis-spring 라이브러리 패키지와 xsd 설정을 해줘야 한다. xsd 과 설정은 Spring Context 파일에 다음과 같이 해준다.

Mapper 인터페이스 클래스 파일들을 전부 위 설정에 나온 패키지 경로로 모두 옮긴다. 그리고 각 Mapper 인터페이스에 @Mapper 어노테이션을 붙여준다. 또한 매퍼 XML 에 네임스페이스 경로도 모두 위 설정으로 바꿔 준다.

이렇게 하면 DAO 관련 파일들은 전부 삭제해도 잘 동작 한다.

Oracle JDBC Memory Management

이 문서는 Oracle JDBC Memory Management 를 번역한 것 입니다. 일부 오역과 오타가 있을 수 있습니다.

Introduction

데이터베이스 애플리케이션들은 아주 많은 양의 메모리를 사용할 수 있다. 큰 스케일의 JDBC 애플리케이션들은 그들이 사용하는 아주 많은 메모리 때문에 성능상의 문제를 발생시킬 수 있다. 오라클 데이터베이스 10i, 11g JDBC 드라이버는 의도적으로 성능 향상을 위한 많은 메모리 사용과 트레이드 오프 관계다. Oracle Database 12c 드라이버는 메모리를 좀 더 절약하지만 여전히 아주 큰 애플리케이션은 메모리 문제를 일으킬 수 있다. 이 화이트 페이퍼는(White paper) 다양한 드라이버들이 메모리를 어떻게 사용하고 최고의 성능을 위해서 그들을 어떻게 튜닝해야 하는지에 대한 약간의 식견을 제공한다.

Oracle Database 12c 에서 드라이버들의 메모리 관리는 Oracle Database 12c 에서 소개된 VARCHAR 컬럼의 32K 제한을 지원하고, 메모리 사용을 최소화하면서 최고의 성능을 내도록 디자인 되었다. 12c 메모리 관리 체계는 약간의 오버헤드를 유발하지만, 감소된 메모리 공간은 일반적으로 10i 나 11g 보다 낫거나 동일한 성능을 제공한다. 대규모 데이터 애플리케이션도 12c 드라이버를 사용한다고 하더라도 많은 메모리를 사용할 수 있다. 만약 여러분의 애플리케이션이 수용할만한 성능을 낸다면 메모리 사용에 대해 고민할 이유가 없다. 만약 여러분의 애플리케이션이 바라던 성능이 나오지 않으면서 기대 이상의 많은 메모리를 사용한다면 이 문서를 읽어보길 바란다.

Where Does It All Go?

JDBC 드라이버는 많은 곳에 메모리를 사용하지만 가장 큰 문제는 쿼리 결과를 저장하기 위해 사용하는 버퍼(buffer) 다. 각 명령문은(Statement, PreparedStatement 와 CallableStatement 포함) 메모리에 쿼리 결과를 저장한다. 12c 에서 각 명령문은 쿼리 결과를 저장하기 위해 byte[] 버퍼세트을(buffer set) 가진다. 10i, 11g 에서 각 명령문은 두개의 버퍼를 가지는데 하나는 byte[] 이고 다른 하나는 char[] 이다. char[] 는 character 타입(CHAR, VARCHAR2, NCHAR, etc)의 모든 로우 데이터를(row data) 저장한다. 나머지 데이터 타입은 byte[] 에 저장된다. 

10i 와 11g 에서, 일반적으로 명령문이 실행될때에 SQL 스트링이 파싱되는데(구문 분석) 이때 버퍼가 할당 된다. 명령문은 (접속이) 닫힐때까지 이러한 두개의 버퍼를(char[], byte[]) 들고 있게 된다. SQL이 파싱될때 버퍼가 할당되면, 그 크기는(버퍼의 크기) 쿼리에 의해서 리턴되는 실제 로우 데이터(row data) 크기와 상관 없지만, 로우 데이터의 가능한 최대 크기와 관련이 있다. SQL 이 파싱된 후에, 모든 컬럼의(column) 타입을 알고 있고, 이 정보를 이용해 JDBC 드라이버는 각 컬럼을 저장하기 위해 필요한 최대 메모리 양을 계산할 수 있다. 드라이버는 각 페치(fetch) 할때 가지고 올 행수인(the number of rows) fetchSize 를 가진다. (역, 데이터를 가지고 오는 작업을 Fetch 라고 한다. Oracle JDBC 드라이버는 한번에 한 개의 로우를(레코드) 가지고 오는게 아니라 fetchSize 만큼 여러개의 로우를 한번에 가지고 올 수 있다.) 각 컬럼의 크기와 로우 개수와 함께, 드라이버는 단일 페치(single fetch)에서 리턴되어지는 데이터의 최대 크기를 정확하게 계산할 수 있게 되는데, 이것이 버퍼의 크기가 된다.

반면에, 12c 에서 버퍼는 드라이버가 서버로부터 결과 데이터를 읽을때 요청되고 할당 된다. 이것은 10i 나 11g 와 비교해 봤을때 약간의 추가적인 오버헤드 비용이 있지만 쿼리 결과를 저장하기 위해 필요로 하는 메모리 양이 최소화 된다. LONG, LONG RAW 와 같은 타입은 버퍼에 인라인(inline) 으로 저장하기에는 매우 클 수 있고 다루기 어렵다. 기본적으로, 만약 쿼리 결과가 LONG, LONG RAW 타입을 포함한다면 fetchSize는 1로 설정되고, 이것은 향후 명확해질 대부분의 메모리 문제를 해결한다. 

10i 와 11g 에서 Character 데이터는 char[] 버퍼에 저장된다. Java에서 chars 는 한 Character 당 2 byte 이다. (10i, 11g 에서) A VARCHAR2(10) 컬럼은 최대 10개의 Character 를 가질 것이며 Java 에서 chars 는 row 하나당 20byte 를 가질 것이다. A VARCHAR2(4000) 컬럼은 8k bytes/row 를 가질 것이다. 핵심은 실제 데이터 크기가 아니라 컬럼의 크기로 정해지고 있다는데 있다. A VARCHAR2(4000) 컬럼이 모두 NULL 을 가진다 하더라도(실제 데이터가 없다 하더라도) 여전히 8K bytes/row 의 버퍼 메모리가 할당 된다. 버퍼는 쿼리 결과를 보기전에 할당되기 때문에 드라이버는 반드시 아주 큰 쿼리 결과값을 예상해 충분히 큰 메모리를 할당해야 한다. VARCHAR2(4000) 으로 정의된 컬럼은 4000 Character 로 꽉꽉 채워질 수 있다. 버퍼는 반드시 4000 chars 를 가질수 있는, 실제 결과 데이터가 그렇게 크지 않다고 하더라도, 충분한 메모리를 할당해야 한다.

BFILE, BLOB 그리고 CLOB 값들은 로케이터(locator) 처럼 저장된다. 로케이터는 BFILE, BLOB 그리고 CLOB 컬럼에 각각 4K bytes 일 수 있는데, byte[] 는 적어도 4K bytes/row 를 가져야 한다. RAW 컬럼들은 4K Bytes 이상 가질 수 있다. 다른 타입들은 대체로 이 보다 적게 갖는다. 대충 다른 모든 타입은 22 bytes/colums/row 로 가정한다.

드라이버가 executeQuery 메소드를 실행하면, 데이터베이스는 SQL 을 구분 분석, 즉 파스(parse) 한다. 데이터베이스는 결과가 세 개의 컬럼을 가질거라고 보고할 것이다: a NUMBER(10), a VARCHAR2(40) 그리고 a DATE. 첫번째 컬럼은 대략 22 bytes/row 가 필요하다. 두 번째 컬럼은 40 chars/row 가 필요하다. 세번째 컬럼은 대략 22 bytes/row 가 필요하다. 따라서 하나의 로우(row) 는 22 + (40*2) + 22 = 124 bytes/row 를 필요로하게 된다. (각 Character 들은 2 bytes 라는 걸 기억해라) 기본 fetchSize 가 10 로우일 경우에 드라이버는 10 개의 char[], 10 * 40 = 400 chars (800 bytes) 그리고 10 개의 byte[], 10 * (22+22) = 440 bytes 그래서 총 1240 bytes 를 할당할 것이다. (역, 그냥 한 로우 124 bytes/row * 10 = 1240 bytes 다.) 1240 bytes 는 메모리 문제를 야기하지 않는다. 하지만 쿼리 결과가 아주 클 경우에는 문제가 될 수 있다.

최악의 경우로 쿼리 결과가 255 개의 VARCHAR2(4000) 컬럼 리턴한다고 가정해 보자. 각 컬럼은 8k bytes/row 를 갖는다. 225 개의 컬럼이니까 2040K bytes 혹은 2MB/row 다. 만약 fetchSize 가 1000 개의 로우(row) 라면 드라이버는 2GB char[] 메모리를 할당하려고 할 것이다. 이건 좋지 않다.

12c JDBC 드라이버들은 오직 쿼리 메타데이터(metadata) 와 실제 쿼리 데이터를 저장하기 위한 메모리를 할당 한다. (10i, 11g 에서는) 각 컬럼별로 최대 가능 값을 저장하기 위한 메모리를 미리 할당하는 대신에, 12c 드라이버들은 오직 실제 컬럼 값들을 저장하기에 필요한 것만큼만 메모리를 할당 한다. 이것은 추가적인 오버헤드를 요구받지만 거의 모든 상황에서 메모리 사용량이 크게 줄어든다. 

12c 드라이버는 결과 쿼리값에 15 bytes 를 할당하지만 (15 bytes/value), 실제 데이터 값을 저장하기 위해 훨씬 많은 메모리를 필요로 한다. 만약 값이 null 이면 오직 15 byte 만 할당 된다. 만약 컬럼이 VARCHAR2(32000) 이고 실제 데이터가 32,000 characters 면, 15 + 64,000 bytes (2bytes/char) 크기의 메모리를 할당 한다. 만약 컬럼에 다음 데이터가 1 character 이면 15 + 2 bytes 가 할당 된다. 

이것은 10i 와 11g 접근방법을 근본적으로 벗어난 것이다. 만약 모든 값들이 최대 크기라면 12c 는 10i 와 11g 보다 13 bytes/value 를 더 사용한다. 이것은 매우 드문 케이스다. 더 일반적으로 많은 NULL 과 크기가 가변적인 VARCHAR 값들이 있다. 아주 드문 케이스를 제외하고 12c 드라이버는 10i 이나 11g 보다 메모리를 적게 사용할 것이다. 

12c 드라이버는 오직 byte 버퍼만 사용한다. char 버퍼는 없다. 버퍼는 전부 같은 길이다.(The buffers are all the same length) 그들은 캐시되고 재사용되어진다. 버퍼 캐시는(buffer cache) Java Memory Management Team 과 협력해 메모리 소비를 최소화하면서 재사용성을 최적화하도록 디자인 되었다. 12c 버퍼 크기가 10i와 11g의 최소 버퍼 크기보다 크다는 점에 유의할 필요가 있다. 아주 작은 쿼리 결과에서는 더 많은 메모리를 사용하겠지만 12c 와 10i, 11g 비교했을때 몇 kilobytes 밖에 차이가 나지 않는다.

Managing the buffer sizes

버퍼에 의해서 사용되어지는 많은 양의 메모리를 관리하기 위해 사용자가 할 수 있는 것들이 몇가지 있다.

  • 신중하고 주의해서 테이블 정의하기
  • 신중하고 주의해서 쿼리 짜기
  • 신중하고 주의해서 fetchSize 를 지정

VARCHAR2(4000) 과 VARCHAR2(20) 와 같은 컬럼은 10i, 11g 와 아주 큰 차이를 만들어 낸다. VARCHAR2(4000) 컬럼은 8K bytes/row 를 필요로한다. 실제 컬럼이 20 character 보다 더 많이 값을 가지고 있지 않게되면 VARCHAR2(4000) 에 대한 10i, 11g 에 의해서 할당된 대부분의 버퍼는 낭비하게 된다. (역, VARCHAR2(4000) 컬럼에 실제 데이터는 20 char 가 들어가 있는데 10i 와 11g 는 컬럼의 크기를 기반으로 최대 값을 할당하기 때문에 VARCHAR2(4000) 컬럼을 위한 버퍼는 낭비하게 된다.) 12c 드라이버에서는 이런 일이 발생하지 않는다. 

오직 몇개의 컬럼만 필요한데도 SELECT * 을 실행하면 버퍼 크기뿐만 아니라 성능상에 큰 영향을 준다. 이것은 로우 컨텐츠를 가지고 오고, 바꾸고, 네트워크를 통해서 전송하고 자바 표현식으로 다시 바꾸는데 많은 시간이 든다. 오직 몇개의 컬럼만 필요한데도 많은 컬럼을 리턴하면 10i 와 11g 드라이버는 불필요한 결과를 저장하기 위해서 아주 큰 버퍼를 할당하게 된다. 12c 드라이버는 실제 컬럼값에 대해서만 메모리 할당을 강제한다. 이것은 10i 와 11g 보다 작을 수 있지만 12c 드라이버는 NULL 에 대해서도 15 bytes/value 를 할당하기 때문에 여전히 낭비다.

메모리 사용을 제어하는 기본적인 툴은 fetchSize 다. 비록 2MB 는 아주 크지만, 대부분의 자바 환경에서 그 크기를 버퍼에 할당하는 것은 전혀 문제를 발생시키지 않는다. Oracle database 11 의 최악의 케이스 결과로 255개의 VARCHAR2(4000) 컬럼 조차도 fetchSize 가 1 이라면 대부분의 애플리케이션에서 문제가 되지 않는다. Oracle database 12 의 최악의 케이스 1000 개에 VARCHAR2(32000) 은 10i와 11g 드라이버에서 64MB/row 를 필요로 한다.(3200 * 2 = 64000, 1000 개의 컬럼이 있으니까 64000 * 1000 = 64,000,000 이다.) 비록 fetchSize 가 1이라 할지라도 많은 자바 환경에서 문제를 발생시킬 수 있다. 12c 드라이버는 오직 실제 데이터를 저장하기 위해 필요로하는 메모리만 할당 한다. 

메모리 사용 이슈를 다루는 첫 단계는 SQL 을 검토하는 것이다. 각 쿼리에 대해 로우(row) 당 사용될 대략적인 크기를 계산하고 fetchSize 를 확인해라. 로우당 크기가 메우 크다면 좀 더 적은 컬럼을 페치(fetch) 하는게 가능한지(역, SELECT 에서 가지고 올 컬럼을 지정해야 한다. SELECT * 은 무조건 피해야 한다.) 혹은 데이터 크기를 좀 더 타이트하게 제약하기 위해 스크마 수정이 가능한지를 살펴보라. 마지막으로 적당한 크기에 버퍼를 유지하기 위한 fetchSize 를 지정한다. Oracle 은 비록 어떤 케이스에서 큰 크기가 알맞다라고 하더라도 fechSize 를 100 보다 크지 않기를 권한다. 아주 많은 로우를 리턴하더라도 일부 쿼리에 대해 fetchSize 100은 부적절하게 아주 클 수 있다. 

Note: 오라클의 특볗한 메소드 OracleStatement.defineColumnType 은 지나치게 큰 크기로 정의된 컬럼의 크기를 줄이기 위해 OCI 드라이버와 함께 사용되어 질 수 있다. 크기 인자와 함께 호출되면, 그 크기가 해당 컬럼에 대해 스키마에 정의된 크기보다 우선 한다. 이것은 문제를 해결하기 위해 스키마를 마음대로 수정할 수 없는 경우에 해결할 수 있게 해준다. 여러분은 주어진 명령문에서 defineColumnType 을 전혀 호출하지 않거나 그 명령문에서 모든 컬럼에 defineColumnType을 호출해야만 한다. 스키마를 고치는게 가능한 최고의 방법이다. defineColumnType 메소드는 BLOB 및 CLOB 컬럼의 LOB 프리 페치 크기를 지정하는 것을 제외하고 12C Thin 드라이버에서 지원되지 않는다.

One statement does not make a problem

VARCHAR2(32000) 타입의 1000 컬럼이나 setFetchSize(100000)과 같은 극단적인 케이스를 제외하고 단일 명령문은 메모리 사용 이슈를 발생시키지 않는다. 실제로, 문제는 수백 혹은 수천만 명령문 객체가 있는 시스템에서 나타난다. 대규모 시스템에는 동시에 수백 개의 연결이(connection) 열려 있을 수 있다. 각각의 연결은 한 두개의 명령문을 동시에 열 수 있다. 이렇게 큰 시스템은 아주 많은 물리적 메모리를 가진 머신에서 운영된다. 따라서 수백 개의 명령문을 오픈하는 대규모 시스템을 가정하면 심각한 메모리 문제는 발생하지 않을 것 같다. 물론, 드라이버도 많은 메모리를 사용할 수 있지만 메모리는 원래 그렇게 사용된다. 실제로 대규모 시스템도 메모리 문제를 피할 수 있다.

대규모 시스템은 같은 SQL 을 여러번 실행하는 경향이 있다. 성능상의 이유로 여러번 실행할때 마다 각각의 SQL에 대해서 처음부터 다시 만드는 것보다 PreparedStatement 를 재사용하는 것이 좋다. 그래서 대규모 시스템에는 각각 구별되는 SQL 에 대해서 하나 이상의 많은 PreparedStatement 를 가질 수 있다. 대부분의 대규모 시스템들은 Weblogic Server 같이 모듈러 프레임워크를 사용한다. 프레임워크안에 독립 컴포넌트들은 그들이 필요로 하는 PreparedStatement 를 생성한다. 이것은 PreparedStatement를 유지해야 할 필요성과 충돌한다. (역, 프레임워크 안에서 독립 컴포넌트들이 고유의 PreparedStatement 를 생성하기 때문에 재상용을 위해 준비된 Oracle JDBC 의 PreparedStatement 를 사용하지 않는다는 뜻이다.) 이 요구 사항을 해결하기 위해 프레임 워크는 명령문 캐싱을 제공한다. 명령문 캐싱을 가지고 있으면 각각의 연결이 메모리에 수백 혹은 그 이상의 PreparedStatement 를 가지는 것이 쉽다. 이것은 수백, 수천개의 커넥션이 생성되면 실제로 메모리 문제가 발생할 가능성이 있다. 

Oracle JDBC 드라이버는 드라이버에 내장된 명령문 캐시를, 묵시적 명령문 캐시(Implicit Statement Cache), 통해서 이 문제를 해결한다. (명시적 명령문 캐시도 있지만 여기서 다루지 않는다.) 묵시적 명령문 캐시는 투명하다. 사용자는 단지 새로운 객체를 생성하는 것처럼 PrepareStatement 를 호출한다. 만약 드라이버가 prepare 호출이 캐시에 있다면 새로운 객체를 캐시로부터 사용자에게 리턴한다. 하지만 없으면 새로운 객체를 생성한다. 문법적으로 사용자 코드는 새로운 객체와 재사용 객체를 구분할 수 없다. 성능적인 측면에서 새로운 객체를 생성하는 것보다 캐시에서 명령문을 리턴하는 것이 훨씬 빠르다. 캐시된 명령문의 첫 실행은 드라이버와 서버가 이전 실행으로부터 아주 많은 상태들을 재사용할 수 있음으로 해서 훨씬 빠르다. 

묵시적 명령문 캐시는 Oracle JDBC PreparedStatement 의 내부 구조를 알고 있다. 이것은 최적의 성능을 위한 구조로 관리를 할 수 있음을 뜻 한다. 특히, 이것은 char[] 와 byte[] 버퍼를 관리할 수 있다. Oracle 은 실제 애플리케이션에서 서로 다른 버퍼 관리 체계가 어떻게 동작해야 하는지 좀 더 잘 인식하도록 개발됨에 따라 드라이버 버전 마다 다른 방법으로 버퍼를 관리한다. 10i 와 11g JDBC 드라이버는 PreparedSatement 가 묵시적 명령문 캐시에서 리턴될때에만 char[] 와 byte[] 버퍼를 관리 할 수 있다. 만약 PreparedSatement 가 닫히지 않으면, Oracle JDBC 메모리 관리 드라어버는 명령문이 즉시 재사용되지 않을지를 알 방법이 없으며, 그래서 버퍼 사용 관리를 위해 아무것도 할 수 없다. 12c 드라이버는 좀 더 다이나믹한 버퍼 메커니즘을 가지고 있고 ResultSet 이 닫힐때 캐시에서 버퍼를 리턴한다. Oracle 은 여전히 묵시적 명령문 캐시 사용을 권장하지만, 12c 드라이버는 Weblogic Server 와 같은 다른 명령문 캐쉬를 사용할때에도 과도한 메모리 소비를 하지 않는다.

Statement Batching and Memory Use

row 데이터 버퍼는 Oracle JDBC 드라이버가 생성할 수 있는 유일하게 큰 버퍼가 아니다. Oracle JDBC 드라이버는 데이터베이스에 PreparedStatement 파라메터를 전달하기 위해 큰 버퍼를 생성할 수 있다. 애플리케이션은 일반적으로 한번에 적은 양의 데이터를 쓰고 그들의 쓰는것보다 더 많은 양의 데이터를 읽는다. 따라서 파라메터 데이터 버퍼는 row 데이터 버퍼보다 훨씬 작은 경향이 있다. 하지만 잘못된 명령문 배치를 사용하면 드라이버가 아주 큰 버퍼를 생성하게 된다.

애플리케이션이 파라메터 값을 지정하기 위해 PreparedStatement setXXX 를 호출할때, 드라이버는 값을 저장한다. 이것은 적은 메모리를 갖는다; 단지 String 과 같은 Objejct 타입, long 과 double 의 8byte, 다른 모든 것은 4 bytes 와 배열을 레퍼런스 한다. PreparedStatment 실행될때, 드라이버는 Java 타입이 아닌 SQL 타입으로 데이터베이스에 값들을 전달해야 한다. 10i, 11g 드라이버는 byte[] 와 char[] 버퍼를 생성한다. 파라메터 데이터는 버퍼에 저장할 SQL 표현으로 변환 된다. 그리고 나서 드라이버는 네트워크를 통해서 바이트를 전송한다. 드라이버는 버퍼를 할당하기 전에 실제 데이터 크기를 가지기 때문에, 최소 크기 버퍼를 생성할 수 있다. 만약 새로운 데이터 값들이 더 큰 byte[] 나 char[] 버퍼를 필요로한다면, 더 큰 버퍼를 할당 한다. 적당한 양의 메모리를 가지면, 단일 명령문 실행중에 Out of Memory 가 나지 않는다. 하지만 명령문 배칭은 다르다.

명령문 배칭은 하나의 연산으로(operation) 단일 DML 명령문을 여러번 실행한다. 이것을 실행하기 위해서 드라이버는 한번에 모든 DML 실행을 위해 모든 파라메터 값들을 전송해야만 한다. 이것은 드라이버가 모든 파라메터 데이터를 SQL 표현식으로 변환하고 버퍼에 저장해야만 한다. 배치에서 실행 수는, 배치 크기(batch size), 쿼리에 대한 fetch 크기와 유사하다. 단일 명령문 실행에 대한 매개 변수 변환이 메모리 문제를 일이키지는 않지만, 대규모 배치 크기라면 문제가 될 수 있다. 

실제로, 이것은 흔하지 않은 문제며 적합하지 않은 큰 배치 크기(수십만 개정도) 일 때만 나타난다. 매번 수백개의 정도 로우의 executeBatch 를 호출하는 것으로 문제를 해결해야 한다.

12c 드라이버는 아주 큰 배치 크기를 갖는 경우에 배치를 분리시킴으로서 이 문제를 해결한다. 이것은 배치에서 수백만개의 로우를 Out of Memory 없이 다룰 수 있게 해준다. 대신 한번에 모든 로우를 보내기 보다는 모든 로우를 보내기 위해서 여러번 왕복을 해야 할 것이다.(역, 배치를 나눴으니까..) Oracle 은 여전히 아주 큰 배치 크기일 경우에 좀 더 적은 수백개의 로우로 매번 executeBatch 를 호출하도록 권장한다.

Version Specific Memory Management

이번 섹션에서는 다양한 버전의 Oracle JDBC 드라이버들이 어떻게 버퍼 메모리를 다루며 최고의 성능을 내기위해서 사용자가 어떻게 드라이버를 튜닝할 수 있는지에 대해서 다룬다.

Note: 세부적인 메모리 관리를 논의할때에 10i와 11g 드라이버 버퍼가 구체적으로 char[] 와 byte[] 를 가진다는 것을 무시하는 것이 편리하다. 이번 섹션에서 기억해야할 것은 명령문에 대해서 char[] 와 byte[] 버퍼가 그냥 일반적으로 “버퍼” 라고 생각하는 것이다.

비록 Java 메모리 관리가 아주 훌륭하지만, 아주 큰 버퍼 할당은 비용이 많이 든다. 이것은 실제 메모리 할당 비용이 아니다. 그것은 매우 빠르다. 문제는 모든 버퍼를 Zero filled 를 요구하는 Java 언어다. 단순하게 큰 버퍼를 할당하는 것이 아닌 반드시 Zero filled 여야 한다. Zero filling 은 모든 할당된 버퍼의 바이트에 대해 터칭(touching)을 요구한다. 다중레벨 데이터 캐시를 가지는 현대의 프로세서들은 작은 버퍼를 가진다. 아주 큰 버퍼의 Zero filling 은 그 크기가 프로세서 데이터 캐시를 초과하고 Zero filling 작업은 메모리 스피드로 실행 되는데, 이는 대체로 프로세스 스피드보다 느리다. 이 문제에 대한 성능 테스트는 드라이버에서 버퍼할당이 아주 큰 성능상 하락을 반복적으로 보여줬다. 이로 인해 버퍼 할당 비용과 재사용을 위해 버퍼를 절약하는 데 필요한 메모리 공간 간의 균형을 맞추는 데 어려움을 겪는다.

Oracle Database Release 10g Oracle JDBC Drivers

초기 10g 드라이버는 메모리 관리에 대한 접근이 순진했다. 그들은 최고의 성능을 위해 메모리를 관리한다. PreparedStatement 가 처음 실행될때, 필요한 byte[] 와 char[] 버퍼가 할당 된다. 그것뿐이다. 버퍼는 PreparedStatement 가 해제 될때에만 해제 된다. 묵시적 명령문 캐시는 버퍼를 관리하기 위해 아무것도 하지 않는다. 묵시적 명령문 캐시에서 모든 PreparedStatement 는 할당된 byte[] 와 char[] 버퍼를 즉시 재사용되도록 유지한다. 따라서 이 드라이버 버전에서 메모리 관리는 setFetchSize 사용, 신중하고 주의깊은 스키마 설계, 신중하고 주의깊은 SQL 쿼리를 코딩하는 것 뿐이다. 초기 10g 드라이버는 충분히 빠르지만, OutOfMemoryExceptions 를 포함한 메모리 관리 이슈를 가질 수 있다.

Oracle Database Release 10.2.0.4 Oracle JDBC Drivers

10.2.0.4.0 드라이버는 초기 10g 드라이버에서 나타난 메모리 관리 이슈 문제를 해결하기 위해서 시작시에 커넥션 속성이 추가 됐다. 이 커넥션 속성은 모 아니면 도다. 만약 이 속성이 지정되면, PreparedStatement 를 묵시적 명령문 캐시로 반환하면 버퍼가 해제된다. 버퍼는 명령문이 캐시로부터 반환될때 재할당 된다. 이런 단순한 접근은 극적으로 메모리 사용을 줄여주지만 상당한 성능 비용을 필요로 한다. 앞에서 서술했듯이, 버퍼 할당은 비싸다.

connection 속성은 다음과 같다.

oracle.jdbc.freeMemoryOnEnterImplicitCache

이 값은 “true” 나 “false” 를 가지는 boolean 이다. 만약 “true” 라면 버퍼는 PreparedStatement 가 묵시적 명령문 캐시로 반환될때 해제 된다. 만약 “false” 라면, 기본 값이다, 버퍼는 초기 10g 드라이버처럼 유지 된다. 이 속성은 -D 를 통해 시스템 속성으로 지정하거나 getConnection 메소드에 커넥션 속성으로 지정할 수 있다. 주의할 것은 freeMemeoryOnEnterImplicitCache 세팅은 파라메터 값 버퍼 해제를 발생시키지 않으며 오직 로우 데이터(row data) 버퍼 해제만 발생시킨다.

Oracle Database Release 11.1.0.6.0 Oracle JDBC Drivers

JDBC 개발 팀은 10.2.0.4.0 에 모 아니면 도식의 접근법이 이상적이 않다는 것을 깨달았다. 11.1.0.6.0 드라이버는 메모리 관리에 좀 더 세련된 접근법을 가진다. 그건 사용하지 않는 메모리의 최소화, 버퍼 할당 비용의 최소화 라는 두가지 목표가 있다. 이 드라이버는 각 커넥션에 대해 내부 버퍼 캐시를 소개했다. PreparedStatement 가 묵시적 명령문 캐시로 반환되면 버퍼 캐시에 캐시된다. 

서론에 언급 된 바와 같이, 버퍼의 크기는 0에서 수십 또는 수백 메가 바이트까지 광범위하게 변할 수있다. 11.1.0.6.0 버퍼 캐시는 아주 단순하다. 모든 캐시된 버퍼들은 모두 같은 크기다. 버퍼는 묵시적 명령문 캐시에서 모든 PreparedStatement 에 대해서 사용되어질 수 있기 때문에 그 크기는 아주 큰 요청을 가지는 PreparedStatment 만큼의 충분히 큰 크기를 가진다. 만약 한번에 하나의 명령문만 사용중인 경우 하나의 버퍼만 있으며 해당 버퍼는 모든 PreparedStatement 에서 사용된다. 일부 또는 대부분의 명령문의 경우 버퍼가 아주 클 수 있지만, 캐시에 있는 적어도 하나의 명령문에 대해서는 적절한 크기일 수 있다. PreparedStatement 재사용 패턴이 너무 편중되지 않으면, 작은 버퍼를 유지하고 필요에 따라 큰 버퍼를 재 할당하는 것보다 큰 버퍼를 유지하고 지속적으로 재사용하는 것이 더 효과적이다. 여러 명령문이 한번에 열리거나 아주 큰 버퍼를 필요로하는 PreparedStatement 가 하나 있는 경우 잠재적으로 메모리 문제가 있다.

10MB 버퍼를 필요로하는 하나의 PreparedStatement 과 나머지는 아주 작은 버퍼를 사용하는 애플리케이션이 있다고 가정해 보자. 한번에 커넥션당 하나의 명령문만 사용하고 아주 큰 PreparedStatement 가 충분히 자주 사용되면 문제는 없다. 각 명령문이 사용할때마다 단일 10MB 버퍼를 할당하며 PreparedStatement 가 묵시적 명령문 캐시로 반환될때 버퍼 캐시로 캐시된다. 단일 10MB 버퍼는 한번 할당되며 다양한 PreparedStatement 에 의해서 지속적으로 재사용 된다. 이제 한번에 두개의 PreparedStatement 가 열리면 무슨 일이 생기는지 생각해보자. 둘다 버퍼를 가져야 한다. 모든 PreparedStatement 는 버퍼에 할당되어야 함으로 모든 버퍼는 반드시 같은 크기, 최대 크기를 똑같이 가져야만 한다. 두개의 PreparedStatement 가 한번에 열릴때 버퍼는 각각 10MB 여야 한다. 두번째 PreparedStatement 가 열리는 중에, 그것이 아주 작은 용량의 버퍼를 필요로한다고 하더라도 10MB 버퍼가 할당된다. 만약 세번째 명령문이 열리면, 세번째 10MB 버퍼가 할당된다. 수백개의 커넥션과 한번에 수백개의 PreparedStatement 가 열리는 대규모 시스템에서 모든 PreparedStatement 에 대한 아주 큰 버퍼 크기는 메모리를 넘치게할 가능성이 있다. 뒤돌아보니 (문제가) 명확하지만, 개발팀은 이것이 얼마나 큰 문제인지 판단하지 않았고 문제가 있음을 내부 테스트에서 인지하지 못했다. 이 이슈는 적절한 스키마 디자인, SQL 코딩 그리고 fetchSize 선택을 통해서 최소화 될 수 있다.

주의해야할 것은, 11.1.0.6.0 드라이버는 버퍼처럼 freeMemoryOnEnterImplicitCache 를 지원하지 않으며 그것을 캐시에 넣을때 PreparedStatement 에 의해서 항상 해제된다. 해제된 버퍼들은 내부 버퍼 캐시에 저장된다.

Oracle Database Release 11.1.0.7.0 Oracle JDBC Drivers

11.1.0.7.0 드라이버는 아주 큰 버퍼 문제를 해결하기 위해서 커넥션 속성을 소개 한다. 이 속성은 버퍼 캐시에 저장되어질 최대 버퍼 크기와 연관된다. 모든 큰 버퍼들은 PreparedStatement 가 묵시적 명령어 캐시로 집어넣을때 해제되고 PreparedStatement 가 캐시로부터 데이터를 받을때에 재할당 된다. 대부분의 PreparedStatement 가 예를들어 100KB 미만의 적당한 크기의 버퍼를 필요로하지만 일부는 훨씬 더 큰 버퍼를 필요로하는 경우, 커넥션 속성을 110KB 로 설정하면, 자주 최대 크기 버퍼 할당에 부담을주지 않고 자주 사용되는 작은 버퍼를 재사용 할 수 있다. 이 속성을 설정하면 성능 향상되고, OutOfMemoryException 을 방지할 수 있다.

이 커넥션 설정은

oracle.jdbc.maxCachedBufferSize

이 값은 “100000” 처럼 정수 문자열(int string) 이다. 기본값으로 Integer.MAX_VALUE 다. 이것은 내부 버퍼 캐시에 저장할 수 있는 버퍼에 대한 최대 크기다. 하나의 크기로 char[] 와 byte[] 버퍼를 모두 사용한다. 그 크기는 char[] 버퍼의 경우 문자로(chars) byte[] 버퍼의 경우 byte로 표시된다. 이것은 미리 정의된 크기가 아니라 최대 버퍼 크기다. 만약 maxCachedBufferSize 가 100KB 로 설정되었지만 최대 버퍼 크기가 100KB 보다 적은 50KB 라면, 버퍼 캐시의 버퍼들은 50KB 가 될 것이다. maxCachedBufferSize 값의 변경은 드라이버의 내부 버퍼 캐시에서 char[] 나 byte[] 버퍼를 포함하거나 제외할때만 성능이 달라진다. 아주 큰 변화, megabytes 조차, 차이가 없다. 마찬가지로 하나를 변경하면 PreparedStatement 의 버퍼를 포함하거나 제외하하는 일이 발생할때에 차이가 난다. 이 속성은 -D 를 통해 시스템 속성처럼 지정하거나 getConnection 을 통해서 커넥션 속성처럼 지정할 수 있다.

만약 여러분이 maxCachedBufferSize 이 설정이 필요하다면, 큰 버퍼들이 필요로하는 SQL 쿼리에 대한 버퍼 크기를 측정하는 것으로부터 시작해야 한다. 이 과정에서 이러한 쿼리에 대한 fetch 크기를 튜닝하면 여러분이 바라는 성능을 얻을 수 있다. 실행 빈도와 버퍼 크기를 고려해 대부분의 명령문이 캐시된 버퍼를 사용할 수 있도록 크기를 정해야 하지만, Java 런타임이 새로운 버퍼를 할당해야하는 빈도를 최소화하기 위해 필요한 버퍼 수를 지원할 수 있을 정도의 충분히 작은 크기여야 한다.

어떤 애플리케이션들은 쓰레드 개수에 비해 많은 idle 커넥션을 가진다. 애플리케이션은 많은 데이터베이스 중에 하나에 접속을 필요로 하지만 한번에 하나만 접속한다. 만약 각 데이터베이스에 스레드당 대충 하나의 커넥션이 있고 스레드보다 더 많은 데이터베이스가 있는 경우에 스레드보다 더 많은 idle 커넥션을 가진다. 기본적으로 버퍼 캐시는 커넥션당 가지기 때문에 idle 커넥션으로 인해서 사용하지 않는 버퍼를 버퍼에 할당한다. 이것은 필요 이상으로 큰 메모리 공간이 필요함을 의미 한다. 비교적 극단적인 상황이지만, 발생할 수 있다.

이 경우에 커넥션 속성을 지정함으로써 해결할 수 있다.

oracle.jdbc.useThreadLocalBufferCache

이 속성의 값은 Boolean 문자열, “true” 나 “false” 다. 기본값은 “false” 다. 이 속성이 “true” 로 지정되면, 버퍼 캐시는 커넥션이 아닌 ThreadLoacl 에 직접 저장된다. 만일 커넥션보다 스레드 수가 적으면 사용되는 메모리 양이 줄어들 것이다. 이 속성은 -D 를 통해서 시스템 속성이나 getConnection 을 통해 커넥션 속성으로 지정할 수 있다. 

useThreadLocalBufferCache = “true” 를 사용하는 모든 커넥션은 같은 정적 ThreadLocal 필드를 공유하며 따라서 같은 버퍼 캐시 세트를 공유한다. 만얄 useThreadLocalBufferCache = “true” 설정되어 있다면, 사용하는 모든 커넥션은 같은 maxCacheBufferSize 를 가진다. 스레드가 처음 하나의 커넥션을 사용한 다음 다른 커넥션을 사용하는 경우 두 커넥션는 사용 된 버퍼의 크기와 수에 따라 서로의 성능에 간접적인 영향을 미친다. 보통 ThreadLocal 버퍼 캐시를 사용하는 모든 커넥션은 같은 애플리케이션의 일부일 것임으로 다른 커넥션을 사용하는 경우의 서로의 성능에 간접적인 영향을 미치는 일은 없다. 만약 한 쓰레드가 명령문을 생성하고 다른 쓰레드가 명령문을 닫는다면, 버퍼는 한개의 ThreadLocal 버퍼 캐시에서 다른 ThreadLocal 버퍼 캐시로 마이그레이션할 것이고 재사용되지 않을 것이다. 이것은 사례로 권장하지 않는다. 만약 모든 명령문이 하나의 ThreadLocal 에서 생성되었고 다른 쓰레드가 닫는다면 전혀 버퍼를 재사용하지 않게 된다. 다시말해 이것은 권장하지 않는다, 만일 여러분의 애플리케이션이 이러한 경우에 속한다면 절대로 useThreadLocalBufferCache 를 true 로 세팅하지 말라. 이것은 어떤 커넥션은 ThreadLocal 버퍼 캐시를 사용하고 어떤 것은 커넥션 버퍼 캐시당 기본값을 사용할 가능성이 있다.

Oracle Database Release 11.2 Oracle JDBC Drivers

11.2 드라이버는 11.1.0.7.0 보다 더 정교한 버퍼 캐시를 가진다. 이 버퍼 캐시는 다중버킷을(multiple bucket) 가진다. 버킷에 모든 버퍼들은 모두 같은 크기이며 이 크기는 미리 정해진다. 맨 처음 PreparedStatement 가 실행되면, 드라이버는 결과를 보관할 가장 작은 크기의 버퍼를(역, 최적크기의 버퍼) 갖는 버킷으로부터 버퍼를 얻는다. 만약 버킷에 버퍼가 없다면, 버킷에 미리 정해진 알맞은 크기의 새로운 버퍼를 할당한다. PreparedStatement 가 닫히면, 버퍼는 알맞은 버킷으로 반환된다. 버퍼들은 다양한 크기에 요구사항에 사용되므로 버퍼들은 보통 필요한 최소 크기보다 약간 크다. 불일치(역, 버퍼 크기의 불일치) 발생은 제한적이며 실제로 임펙트를 주지는 않는다.

11.2 드라이버는 항상 11.1 이나 10.2.0.4.0 드라이버보다 메모리를 같게 혹은 적게 사용한다. 어찌보면 11.2 드라이버가 충분한 성능을 내는데 비해 너무 적은 힙 크기로 실행되는 것이 말이 안되기도 한다. 더 적은 메모리로 실행된다는 이유만으로 그것이 효율적이라는 뜻은 아니다. 11.2 드라이버에서 대규모의 성능향상을 위해 -Xms 값을 크게 설정하는 것은 드문일이 아니다. 아래에 자바 힙 제어하기 섹션을 보라.

11.2 드라이버는 maxCachedBufferSize 를 지원하지만 별로 중요하지 않다. 11.1 에서 정확한 maxCachedBufferSize 설정은 탁월한 성능과 OutOfMemoryException 의 차이를 만들어 낸다. 11.2 드라이버에 maxCachedBufferSize 설정은 가끔 대규모 명령문 캐시와 광범위하게 나뉘는 버퍼 크기의 요구사항을 갖는 대규모 시스템에서 성능을 개선 시킬 수 있다. 11.2 에서 maxCachedBufferSize 는 최대 버퍼 크기의 log2 로 해석된다. 예를들어, maxCahcedBufferSize 가 20 으로 설정했다면 캐시 된 최대 크기 버퍼는 2^20 = 1048576 이 된다. 이전 버전과 호환성을 위해, 30 보다 큰 크기의 값은 log2 크기가 아닌 실제 크기처럼 해석되지만, 2의 거듭 제곱을 사용하는 것이 좋다.

maxCachedBufferSize 값의 합리적인 설정은 시스템에 임팩트를 주지 않는다. 만약 여러분이 maxCachedBufferSize 를 설정해야 한다면, 18부터 시작해라. 만약 16보다 적은 값을 설정 해야한다면 아마도 더 많은 메모리가 필요하다.

11.2 드라이버는 파라메터 데이터 버퍼를 위해서 같은 크기의 버퍼 캐시와 캐싱 스키마를 사용 한다. PreparedStatement 가 묵시적 명령문 캐시에 있으면 파라메터 데이터 버퍼들은 버퍼 캐시에 캐시 된다. PreparedStatement 가 맨 처음 실행되거나 묵시적 명령문 캐시에서 검색된 후 처음으로 실행될 때 버퍼 캐시로부터 파라메터 데이터 버퍼를 얻는다. 전형적으로 파라메터 데이터 버퍼들은 로우(row) 데이터 버퍼들보다 훨씬 작지만, 이런 버퍼들은 아주 큰 배치 크기를 가질 수 있을만큼 클 수 있다. 또, 11.2 드라이버는 Bfile, Blob, Clob 연산을 위한 char[] 버퍼와 대규모 byte[] 에 대해 다른 버퍼 캐시를 사용한다. 

11.2 드라이버도 useThreadLocalBufferCache 를 매우 잘 지원한다. 이것에 대한 기능과 이것을 언제/어떻게 사용할지 대한 권장사항은 11.1.0.7.0 과 동일하다.

또, 11.2 드라이버는 묵시적 명령문 캐시를 활성화 하기 위해서 새로운 속성을 추가한다.

oracle.jdbc.implicitStatementCacheSize

이 속성의 값은 “100” 과 같은 정수형 문자열이다. 이것은 명령문 캐시의 초기(initial) 크기다. 속성을 양수로 지정하면 묵시적 명령문 캐시가 활성화 된다. 기본값은 0 이다. 이 속성은 “-D” 를 통해서 시스템 속성이나 getConnection 을 통한 커넥션 속성으로 지정할 수 있다. OracleConnection.setStatementCacheSize 나 OracleConnection.setImplicitCachingEnabled 를 호출하면 implicitiStateCacheSize 값이 무시된다. 이 속성은 코드로 활성화하는 것이 비실용적인 경우 묵시적 명령문 캐시 활성화를 더 쉽게해 준다.

Oracle Database Release 12.1.0.1.0 Oracle JDBC Drivers

앞에서 설명했듯이, 12.1.0.1.0 드라이버는 다른 메모리 관리 체계를 사용한다. 12c 드라이버는 정의된 컬럼 크기에 민감하지 않다. VARCHAR2(32000) 컬럼은 같은 데이터에 대해 VARCHAR2(1) 보다 메모리를 더 사용하지 않는다. 10i 나 11g 드라이버 처럼, 12c 드라이버는 (쿼리 후 받은 데이터) 결과에서 fetchSize 와 실제 데이터 크기를 더한 컬럼의 수에 민감하다. Oracle 은 스키마 디자인이 다른 시스템 부분에 영향을 줄 수 있기 때문에 신중한 설계를 지속적으로 권장한다. 신중한 쿼리 디자인, 최소한의 컬럼과 로우(row) 세트 검색과 신중한 fetchSize 선택은 그 어떤것보다 중요하다.

12c 드라이버는 버퍼나 버퍼 캐시 크기를 제어하기 위한 옵션을 가지지 않는다. 

어떤 애플리케이션은 쓰레드 수에 비해 아주 많은 idle 커넥션을 가진다. 애플리케이션은 아주 많은 데이터베이스 중에 하나와 연결해야 하지만 오직 한번에 하나만 연결해야 한다. 만약 대략 각 데이터베이스를 위해 쓰레드당 하나의 연결이 있다고 한다면, 쓰레드보다 더 많은 idle 커넥션이 있게 된다. 기본적으로 버퍼 캐시는 커넥션당 이기 때문에 idle 커넥션은 버퍼 캐시에서 비사용 버퍼가 되는 결과가 된다. 이것은 필요 이상으로 많은 메모리가 필요함을 뜻한다. 이것은 비교적 드문 상황이지만, 알려지지 않은 것은 아니다. 

이 경우 커넥션 속성 설정을 통해 해결할 수 있다.

oracle.jdbc.useThreadLocalBufferCache

이 속성의 값은 Boolean 스트링, “true” 이거나 “false” 이다. 기본값은 false 다. 이 속성이 true 일때, 버퍼 캐시는 직접 커넥션을 저장하지 않고 ThreadLocal 에 저장 된다. 만약 커녁션보다 적은 쓰레드만 있다면, 이것은 많은 양의 사용할 메모리를 줄여준다. 이 속성은 -D 를 통한 시스템 속성이나 getConnection 을 통한 연결 속성으로 설정할 수 있다.

useThreadLocalBufferCache = “true” 를 사용하는 모든 커넥션은 같은 정적 ThreadLocal 필드를 공유하며 따라서 같은 버퍼 캐시 세트를 공유한다. 만얄 useThreadLocalBufferCache = “true” 설정되어 있다면, 사용하는 모든 커넥션은 같은 maxCacheBufferSize 를 가진다. 스레드가 처음 하나의 커넥션을 사용한 다음 다른 커넥션을 사용하는 경우 두 커넥션는 사용 된 버퍼의 크기와 수에 따라 서로의 성능에 간접적인 영향을 미친다. 보통 ThreadLocal 버퍼 캐시를 사용하는 모든 커넥션은 같은 애플리케이션의 일부일 것임으로 다른 커넥션을 사용하는 경우의 서로의 성능에 간접적인 영향을 미치는 일은 없다. 만약 한 쓰레드가 명령문을 생성하고 다른 쓰레드가 명령문을 닫는다면, 버퍼는 한개의 ThreadLocal 버퍼 캐시에서 다른 ThreadLocal 버퍼 캐시로 마이그레이션할 것이고 재사용되지 않을 것이다. 이것은 사례로 권장하지 않는다. 만약 모든 명령문이 하나의 ThreadLocal 에서 생성되었고 다른 쓰레드가 닫는다면 전혀 버퍼를 재사용하지 않게 된다. 다시말해 이것은 권장하지 않는다, 만일 여러분의 애플리케이션이 이러한 경우에 속한다면 절대로 useThreadLocalBufferCache 를 true 로 세팅하지 말라. 이것은 어떤 커넥션은 ThreadLocal 버퍼 캐시를 사용하고 어떤 것은 커넥션 버퍼 캐시당 기본값을 사용할 가능성이 있다. 

12c 드라이버는 좀 더 동적인 메모리 관리를 하기 때문에 LONG 및 LONG RAW 컬럼을 메모리로 직접 가져오는 것이 합리적일때가 있다. 만약 여러분의 애플리케이션이 LONG 이나 LONG RAW 에 대한 전체 값을 저장할 충분한 메모리를 가지고 있다면 oracle.jdbc.useFetchSizeWithLongColumn 속성을 설정할 수 있다. 기본적으로, 쿼리가 LONG이나 LONG RAW 컬럼으로 반환하는 경우 드라이버는 fetchSize 를 1로 설정하고 요청시에만 네트워크를 통해서 LONG 나 LONG RAW 값을 읽는다. 만약 이 설정을 설정하면 드라이버는 정의된 fetchSize 를 사용할 것이며 VARCHAR 나 RAW 처럼 전체 LONG 이나 LONG RAW 를 메모리에서 읽는다. LONG 과 LONG RAW 값이 아주 클 수 있기 때문에, 그 값의 크기를 정확하게 메모리에 맞는지를 알지 못한다면 이 설정을 지정해서는 안된다. 만약 이값이 적절하지 않다면 드라이버는 OutOfMemoryException 을 얻을 수 있다. 만일 그것을 저장할 힙(heap) 을 가지고 있다면 메모리에서 읽을 수 있는 가장 큰 단일 값은 2GB 이다.

연결 속성은 

oracle.jdbc.useFetchSizeWithLongColumns

이 값은 Boolean 스트링으로 “true”나 “false” 다. 만약 “true” 이면 LONG 과 LONG RAW 값들은 VARCHAR 과 RAW 값들처럼 메모리에서 읽는다. 기본값 “false” 면 쿼리에서 LONG 이나 LONG RAW 컬럼을 포함해 fetchSize 1 로 강제되고 요청시에만 네트워크를 통해서 LONG 과 LONG RAW 값들을 읽게 된다. 이 속성 역시 “-D” 를 통해서 시스템 속성으로 지정하거나 getConnection 메소드를 통한 연결 속성으로 지정이 가능하다. 주의할 것은 이 속성은 10i, 11g 드라이버에도 존재하지만 잘 사용되지 않는다.

Controlling the Java Heap

자바 런타임 메모리 튜닝은 블랙 아트 영역이다. 가장 중요한 두 가지 옵션은 -Xmx 와 -Xms 다. 자바 런타임 버전 및 OS 에 따라 다른 매개 변수가 있다. -Xmx 는 자바 런타임에서 사용할 최대 힙 크기를 설정한다. -Xms 는 초기 힙 크기를 설정한다. 디폴트 값은 OS 나 자바 런타임에 의존적이지만 대충 기본적으로 -Xmx 는 64MB, -Xms 는 1MB 다. 32 bit JVM 은 2GB 이상의 힙을 지원한다. 64bit JVM 은 아주 큰 힙을 지원할 것이다. 이 옵션들은 “k”, “m”, “g” 의 접미사를 가진 값을 받을 수 있는데, 이것은 kilo-, mega-, gigabytes 다. e.g -Xmx1G

Oracle JDBC 드라이버는 적절한 힙 크기로 실행될때 최고의 성능을 낼 수 있다. 대부분의 애플리케이션의 경우 애플리케이션 힙 크기를 일부 제한으로 늘리면 성능이 향상된다. 그 이후에 제한된 값 이상으로 애플리케이션 힙 크기를 늘려도 성능 차이는 없다. 만약 힙 크기가 머신이 가지고 있는 물리 메모리나 힙 메모리보다 훨씬 크기되면 세컨드 스토리지로 페이지되고 성능은 급격히 나빠질 것이다. 힙 크기를 설정할때, 최대 값 -Xmx 만으로는 출분하지 않다. 특히 11.2 드라이버는 메모리 할당에 그렇게 적극적이지 않다. 빈번하게 실행 가능한 최소값을 초과하여 힙 메모리를 늘리지 않는다. 만약 -Xmx 를 사용해 최대 힙 크기만 지정한다면, 11.2 드라이버는 설사 -Xmx 를 허용했다고 하더라도 최대 성능을 내기위한 충분한 메모리를 결코 사용하지 않는다. 만약 -Xms 를 사용해 최소 힙 크기를 함께 늘리면, 11.2 드라이버는 추가적인 메모리를 사용하게 만들 것이고 자주 최고의 성능을 제공할 것이다. 

애플리케이션 성능 튜닝시에 -Xmx 와 -Xms 모두 설정되고 모두 같은 값으로 설정된 고정된 힙 크기를 가지고 테스트하는 것은 매우 중요하다. JVM 이 힙 크기를 선택하도록 하면 고장된 힙 크기로 명확해진 성능이 모호하게 변화할 수 있다. 일반적으로 프로덕트 애플리케이션은 고정된 힙 크기에서도 잘 동작한다. -server 옵션 설정은 JVM 이 최소화 힙 크기에 대해서 좀 덜 적극적이게 될 것이고 이것은 약간의 성능 향상을 제공한다. -Xms 를 적절하게 설정하면 -server 설정만으로 제공되는 성능 이상으로 추가적인 성능을 제공하는 경우가 종종 있다. Oracle 은 서버 애플리케이션에 대해 -server, -Xms, -Xmx 설정을 권장한다. 보통 -Xms 와 -Xmx 는 같은 값으로 설정한다. 이것은 10i, 11g 그리고 12c 를 포함한 모든 Oracle JDBC 드라이버에 적용된다.

Conclusion

Oracle JDBC 드라이버는 최대 성능을 이룩하기 위해서 많은 양의 메모리를 사용할 수 있다. 만약 메모리가 여러분의 애플리케이션 성능을 제한한다면 최고 성능을 위해서 튜닝할 수 있다. 이상적으로 실제 애플리케이션 워크로드를 대표하는 재현 가능한 테스트 사례가 있어야 한다. 다양한 노브를 체계적으로 변경하고 테스트를 실행하면 최적의 설정을 식별할 수 있다. 모든 버전의 Oracle JDBC 드라이버에 대해, 묵시적 명령문 캐시 활성화, 적절한 데이터베이스 스키마 디자인, 신중한 SQL 코딩 그리고 적절한 fetch 크기 설정이 첫 단계다. 그 다음 Java 힙 크기를 대규모 실제 크기로 설정하기 위해 -Xmx 와 -Xms를 사용해 늘려라. 어떠한 값으로도 수용가능한 성능이 주어지면 -Xms 와 -Xmx 를 줄일 수 있다. 최대의 실제 힙 메모리를 가지고 성능이 원하는 것보다 낮고 10i 나 11g 드라이버를 사용 중이라면 필요에 따라 freeMemoryOnEnterImplictCache 이나 maxCachedBufferSize 를 사용해 실험해야 한다. 이것은 useThreadLocalBufferCache 를 설정해야할지 말지를 여러분의 애플리케이션 설계에서 명확하게 해준다. 만약 여러분이 모든 나머지 성능 영역을 찾고 있다면 자바 가비지 컬렉터 튜닝을 해봐야 겠지만 대부분의 경우 -Xmx 및 -Xms 설정이 필요로 하는 전부다.

HTTP 응답 헤더 보안

의외로 웹 프로그래밍을 하는 사람들 조차도 HTTP 응답 헤더에 대해서 생각을 하지 않는다. HTTP 응답 헤더에 대한 생각을 하지 않는다는 것은 웹 프로그래밍을 깊게 공부한 사람이 아니라고 말할 수도 있다.

Cache Control

대부분의 사람들은 이 부분에 대해서는 잘 안다. Cache Control 헤더는 Client 에 컨텐츠를 어떻게 캐시할 것인지에 대한 제어를 할 수 있다.

하지만 고려해야할 사항이 존재한다. 만약 AWS Cloud 를 사용한다면 더 더욱 고려해야할 사항이 존재한다. AWS 의 CloudFront 는 CDN 서비스로서 컨텐츠 캐시를 기반으로 한다.

만일 특정 컨텐츠에 대해서 캐시를 하고 싶지 않다면 어떻게 해야할까? AWS 에서는 다음과 문서에 기술해 놨다.

사용자 지정 오리진 웹 서버 애플리케이션에서, Cache-Control no-cacheno-store 또는 private 명령을 CloudFront에서 캐시하지 않으려는 객체에 추가합니다. 또는 Expires 명령을 CloudFront에서 캐시하지 않으려는 객체에 추가합니다.

CloudFront에서 특정 파일 캐시를 방지하려면 어떻게 해야 합니까?

오리진(origin) 의 웹 서버나 애플리케이션에서 Cache-Control 헤더를 조작하도록 권고 하고 있다.

위는 응답 캐싱 정책을 정의하는 사용하는 헤더 지시문이다. Cache-Control 은 HTTP/1.1 사양의 일부로 정의 되었다. Expire 는 Cache-Control 이전에 사용했던 지시문이다. 현대의 대부분 브라우저는 HTTP/1.1 를 지원하지만 구형을 쓰는 곳이 있을 수 있음으로 Expire 지시문을 함께 사용한다.

no-cache 는 말그대로 캐시를 하지 말라는 것을 지시한다. 이 지시자를 쓸 경우에 매번 요청할 때마다 문서의 유효성을 검사한다. 그래서 컨텐츠가 변경된 경우에 최신 버전을 가지고 오게 된다. 컨텐츠의 변화를 감지하는 매커니즘을 가진다는 것이 매우 중요하다. 또 모든 것을 캐시를 하지 않는다. 예를들어, 비공계 개인 데이터와같은 것은 이 지시자로 캐시를 제어를 할 수 없다.

no-store 는 비공개 개인 데이터를 포함해 모든 캐시를 하지 않다록 해준다.

public, private 이라는 것도 있다. 이는 중간 캐시를 이용할 경우에 유용하다. 중간 캐시는 CDN 을 의미한다. 만일 CDN 과 같은 중간 캐시 서버가 캐시 데이터를 가지고 있기를 원하지 않는다면 private 를 써야 한다.

그리고 위 코드에 보이는과 같이 모든 것을 다 포함하도록 지시문을 사용해서는 안된다. Pragma, Expire 는 HTTP/1.0 스펙에서 유효하다. 거기다 Cache-Control 지시문에서 no-cache, no-store, max-age 를 한꺼번에 쓰는건 잘못된 것이다.

그래서 cache 전략이 필요하게된다. 이는 HTML 구조를 봐야 한다.

index.html 파일 안에 구조가 저렇게 되어 있다고 가정하면, 대략 다음과 같은 형태의 캐시 전략을 쓸 수 있다.

ContentsCache-Control
index.htmlCache-Control: no-cache
common.cssCache-Control: max-age=86400
a.jsCache-Control: private, max-age=86400

CSS 파일은 최대 1일까지만 캐시하도록 지시했고, Javascript 파일은 CDN 에서 캐시를 하지 못하도록 하고 브라우져에서 최대 1일까지만 캐시하도록 했다. index.html 은 no-cache 를 주어서 캐시를 하지 못하게 했지만 매번 요청할 때마다 변경이 되었는지 체크하고 변경되었다면 최신판을 새로 받도록 했다.

must-revalidate 가 있는데, 강제 사항을 적용할 때 사용 한다. 이는 다음과 같이 사용한다.

이 경우에 1일동안 캐시를 하고 그 이후에는 서버에 반드시 유효성검사를 하도록 강제한다. 만일 네트워크 상황으로 유효성 검사를 못할 경우에는 절대로 캐시 데이터를 사용하지 못하도록 한다.

이론을 기반으로 현실에서 사용 전략을 다음과 같이 세울 수 있다.

경우의 수Cache-Control
금융Cache-Control: no-store
장바구니, 결재 페이지Cache-Control: no-store
개인정보 수정 페이지Cache-Control: no-store
동적 웹 페이지Cache-Control: no-cache
정적 파일Cache-Control: max-age=86400

금융 관련된 웹 애플리케이션을 사용할 때에는 캐시를 되도록이면 하게 하면 안된다.

Nginx 와 같은 경우에 다음과 같이 HTTP Header 에 Cache-Control 을 붙일 수 있다.

Nginx 에서 max-age 설정은 expires 해도 된다. 이렇게 하면 구형의 Expire 지시자도 함께 지정된다.

Spring에서는 Spring-Security 에서 다음과 같이 지원한다.

위 설정은 다음과 같은 상태로 만든다.

만일 직접 캐시를 조작하고 싶다면 다음과 같이 해주면 된다.

Content Type Options

브라우저는 content sniffing 같은 기술을 사용해 다운받을려는 컨텐츠 타입을 추정하고 특정하게 된다. 하지만 이러한 것은 XSS 와 같은 공격을 제공하는 빌미가 된다. 그래서 이것을 방지하기 위해서 다음과 같이 헤더응답을 넣는다.

Spring Security 에서는 간단하게 설정할 수 있다.

HTTP Strict Transport Security(HSTS)

보통 사이트에 접속하는데에 프로토콜을(HTTPS, HTTP) 붙이지 않는다. 이럴 경우 브라우저는 HTTP 로 먼저 접속해보고 서버의 설정에 따라서 HTTPS 로 리다이렉트를 하게 된다.

만일 중간에 해커가 Proxy Server 를 두게되면 클라이언트는 HTTP 로만, Proxy Server 가 이를 받아서 HTTPS 로 뒷단 서버에 연결을 하게된다. 이렇게 되면 모든 정보를 볼 수 있게 된다. 이러한 해킹 기법을 “SSL Stripping” 공격 혹은 SSL/TLS Hijacking 이라고 부른다.

HSTS 는 애초에 접속을 HTTPS 로만 하라고 강제한다. 이는 브라우저와 서버 모두 HSTS 를 모두 지원해야 한다는 제한이 있지만 2010에 HSTS 에 대한 논의로 인해서 현재에는 모든 서버와 브라우저가 지원하고 있다.

HSTS 를 지원하는 브라우저는 도메인 목록을 유지한다. HTTPS 로만 접속 해야만 하는 도메인을 가지고 있게된다. 만일 HSTS 목록에 있는 도메인 주소를 억지로 HTTP 로 접속하게 되면 서버가 리다이렉트를 하는게 아니라 HTTPS 로 다시 접속하라고 브라우저에 요청하게 된다. HSTS 는 목록에 도메인을 유지하는 시간을 지정할 수 있다.

무조건 HTTPS 로만 접속하도록 강제하기 때문에 SSL 도메인 인증서가 있는 사이트에서만 사용 가능하다.

Spring Security 에서는 다음과 같이 간단히 적용할 수 있다.

X-Frame-Options

HTML 내에 또 다른 frame 을 넣는 기술은 자주 사용 되었었다. 최근에는 사용이 줄었지만 그래도 여전히 사용되어지는 기술이다. 하지만 이러한 frame 을 이용할 경우에 그것이 변조에 취약하다는 문제가 있다.

그래서 이 frame 을 실행하지 못하도록 브라우저에게 요청할 수 있는데, 이것이 X-Frame-Options 다. 기본 값은 DENY 이지만 같은 도메인의 frame 일 경우에는 허용할 수도 있다.

Spring Security 에서는 다음과 같이 설정할 수 있다.

SAMEORIGIN 일 경우에는 같은 도메인의 frame 일 경우에는 허용하게 한다.

X-XSS-Protection

XSS 를 브라우저에서 실행하도록 한다. 주의해야할 것은 서버의 웹 애플리케이션에서 하는게 아니라 브라우저의 XSS 필터에서 하는 것이다. 그러니까 서버에 요청을 넣기전에 브라우저가 사전에 XSS를 한번 차단하게 하는 것이다.

Spring Security 에서는 다음과 같이 설정할 수 있다.

CONTENT-SECURITY-POLICY

웹에 자원은 동일한 도메인에서만 작동되도록 설계되었다. 하지만 자신만의 스크립트를 삽입하는 XSS 공격을 고안해 냈다. 이를 방어하기 위해서 고안된 것이 CSP(Content Security Policy) 이다. 이것을 HTTP 헤더에 정의하면 브라우저에는 이곳에서 받은 리소스만 실행허거나 렌더링하도록 강제 한다.

Spring Seuciryt 에서는 다음과 같이 설정할 수 있다.

Spring 에서 기본

많은 웹 애플리케이션이 Spring 을 이용해서 만들어진다. 그리고 인증을 위해서 Spring Security 를 사용한다. 하지만 대부분의 소스를 보면 위에서 언급한 기본적인 보안조차 되어 있지 안되어 있는 곳이 대부분이다. 대기업의 프로젝트에서조차도 이런것을 고려하지도 않는다.

위에서 언급한 모든 내용은 다음과 같이 Spring Security 에서 간단하게 설정할 수 있다.

아주 간단하다. 그냥 가져다 붙여넣기만 해도 된다. 하지만 이것조차도 사용하지 않는 대기업 프로젝트가 부지기수다. 뭐가 기술력이 좋다는 건지… IT 선진국이라는 것이 좋은 인프라에 작동하기만 하면 되는 앱만으로 얻을 수 있는 거였다니..