영권's

Effective Java - item6(불필요한 객체 생성을 피하라) 본문

자바/JAVA

Effective Java - item6(불필요한 객체 생성을 피하라)

ykkkk 2022. 9. 6. 02:12

같은 기능의 객체를 매번 생성하는 것 보다 객체 하나를 재사용하는 것이 좋다.

특히 불변 객체는 언제나 재사용이가능하다.

 

하지 말아야 할 극단적인 코드

String s = new String("apple"); // 따라하지 말 것

위 문장은 실행 될 때마다 새로운 String 인스턴스를 생성한다. 기능적으로는 이미 만들어진 apple이라는 문자열과 똑같지만 항상 새로운 객체를 만들게 된다.

대신, String s = "apple"; 과 같이 사용하면 jvm안에 이와 같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함이 보장된다.

 

또한, 정적 팩토리 메서드를 사용하여 불필요한 객체 생성을 피할 수 있다.

그래서 Boolean(String) 생성자 대신 Boolean.valueOf(String)를 사용하는 것이 좋다.

 

불변객체가 아닌 가변객체라도 사용중 변경되지 않을 것임을 보장한다면 재사용할 수 있다.

 

생성 비용이 매우 비싼 객체도 존재한다.

비싼 객체가 반복해서 필요하다면 캐싱하여 재사용해야 한다.

하지만 자신이 만드는 객체가 비싼 객체인지 매번 정확히 알 수 없다.

예를 들어, 주어진 문자열이 유효한 로마 숫자인지를 확인하는 메서드를 작성하면

 

```java

static boolean isRomanNumeral(String s){

   return s.matches("로마숫자 정규표현식")

}

```

 

String.matches는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법 중 하나이지만, 성능이 중요할 때는 반복해 사용하기 적합하지 않다.

이 메서드 내부에서 만드는 정규표현식용 Pattern 인스턴스는, 한 번 쓰고 버려져서 곧바로 GC 대상이 된다.

Pattern은 입력받은 정규표현식에 해당하는 유한 상태머신(finite state machine)을 만들기 때문에 인스턴스 생성 비용이 높다.

 

성능을 개선하려면, 필요한 정규표현식을 표현하는 불변 Pattern 인스턴스를 초기화(정적 초기화) 과정에서 직접 캐싱해두고, 나중에 isRomanNumeral 메서드가 호출될 때마다 이 인스턴스를 재사용한다.

```java

public class RomanNumerals{

    private static final Pattern ROMAN = Pattern.complie("로마숫자 판별 정규표현식");

 

static boolean isRomanNumeral(String s){

    return ROMAN.matcher(s).matches();

}

}

```

이렇게 개선한다면 isRomanNumeral가 빈번히 호출될 때 성능이 많이 개선된다.

또한, 코드도 훨씬 명확해졌다.

개선 전에는 존재조차 몰랐던 Pattern인스턴스를 static final 필드로 꺼내고 이름을 지어서 코드의 의미를 훨씬 잘 드러낸다.

만약, 개선된 코드의 isRomanNumeral 메서드가 한번도 호출되지 않는다면, ROMAN 필드는 쓸데없이 초기화 한 꼴이 된다. 그럴때는 메서드가 처음 호출될 때, 필드를 초기화하는 지연초기화로 불필요한 초기화를 없앨 수 있지만, 코드는 복잡해지지만, 성능은 크게 개선되지 않기 때문에 추천하지 않는다.

 

객체가 불변이면 재상요해도 안전함이 명백하다.

하지만 덜 명확하거나, 직관에 반대되는 상황도 있다. (어댑터를 생각하면 된다.)

어댑터는 실제 작업은 뒷단 객체에 위임하고, 자신은 제2의 인터페이스 역할을 해주는 객체다.

어댑터는 뒷단 객체만 관리하면 된다. 즉, 뒷단 객체 외에는 관리할 상태가 없으므로 뒷단 객체 하나당 어댑터 하나씩만 만들어지면 충분하다.

예를 들어, Map의 keySet 메서드는 Map 객체 안의 키를 전부 담은 Set 뷰를 반환한다.

새로운 Set이 매번 만들어지리라 생각할 수 있지만, 사실은 매번 같은 Set 인스턴스를 반환한다. 따라서,  반환한 객체중 하나만 수정해도 다른 모든 객체가 따라서 바뀌고 여러 keySet이 객체를 만들어도 되지만 그럴 이유가 없다.

 

불필요한 객체를 만들어내는 대표적인 예로 오토박싱이 있다.

기본 타입과 래퍼 타입을 섞어 쓸때 자동으로 상호 변환해주는것으로 오토박싱은 기본 타입과 그에 대응하는 박싱된 기본 타입의 구분을 흐려주지만, 완전히 없애주는 것은 아니다.

의미상으론 크게 다르지 않지만, 성능상으로는 그렇지 않다.

 

```java

// 최악의 코드

private static long sum(){

   Long sum = 0L;

   for (long i = 0; i <= Integer.MAX_VALUE; i++)

         sum += i;

 

   return sum;

}

```

 

정확한 답을 나타내기는 하지만 제대로 구현했을때보다 훨씬 느리다.

sum 변수를 long이 아닌 Long으로 선언해서 불필요한 Long 인스턴스가 만들어지기 때문이다.

(책에서는 Long : 6.3초, long : 0.59초로 차이난다고 한다.)

그래서 박싱된 기본타입 보다는 기본 타입을 사용하고, 의도치 않는 오토박싱이 숨어들지 않도록 주의하는 것이 좋다.

 

추후 주제인 방어적 복사와(defensive copy)와 대조적인 내용이다.

짧게 글을 쓰자면, 방어적 복사가 필요한 상황에서 객체를 재사용했을 떄의 피해가, 필요 없는 객체를 반복 생성했을 때의 피해보다 훨씬 크다.

방어적 복사에 실패하면 버그와 보안에 위험하지만, 불필요한 객체생성은 그냥 코드 형태와 성능에만 영향을 준다.

 

 

 

 

 

 

 

 

 

Comments