데이터 증강
데이터 증강 data augmentation
- 데이터 생성의 어려움: 모델은 복사가 가능하지만, 데이터는 직접 만들어야 하므로 비용이 발생함.
- 해결책으로서의 데이터 증강: 기존 데이터를 변형하여 데이터 양을 늘리는 기법.
- 증강 방법 예시: 이미지 회전, 좌우 반전, 색상 변경 등을 통해 하나의 데이터를 여러 개로 불림.
- 장점: 데이터 수집의 수고 없이 무료로 데이터 양을 늘릴 수 있음.
데이터 증강의 한계
- 한계와 주의점: 데이터의 본질적인 의미를 변화시키지 않는 범위에서만 제한적으로 사용해야 함.
- 부적절한 증강 예시:
- 나비 종류 분류: 색상이 중요한 특징이므로 임의로 색을 바꾸면 안 됨.
- 자율 주행: 주행 차선의 좌우 정보가 중요하므로 이미지를 좌우로 뒤집으면 안 됨. 신호등 색상 변경 또한 불가.
실습 준비
- 예제 파일 열기
from PIL import Image
img = Image.open('pump_horse.jpg')
- 여러 이미지 보기
def concat_images(images):
n = len(images)
width, height = 128, 128
total_width = n * width
new_im = Image.new('RGB', (total_width, height), color='white')
for i, im in enumerate(images):
new_im.paste(im.resize((width, height)), (width * i, 0))
return new_im
RandomPerspective
RandomRotation
RandomAffine
- 무작위 아핀 변환
transform = transforms.RandomAffine(
degrees=(30, 70), translate=(0.1, 0.3), scale=(0.5, 0.75), shear=(10, 30))
concat_images([transform(img) for _ in range(4)])
RandomCrop
RandomResizedCrop
ColorJitter
RandomInvert
RandomPosterize
RandomChoice
- 무작위로 고르기
transform = transforms.RandomChoice([
transforms.RandomHorizontalFlip(),
transforms.RandomVerticalFlip(),
transforms.RandomRotation(180),
])
concat_images([transform(img) for _ in range(4)])
RandomApply
- 각각의 변환을 확률 p에 따라 무작위로 적용
transform = transforms.RandomApply([
transforms.RandomHorizontalFlip(),
transforms.RandomVerticalFlip(),
transforms.RandomRotation(180),
], p=0.9)
concat_images([transform(img) for _ in range(4)])
RandomOrder
- 무작위 순서로 적용
transform = transforms.RandomOrder([
transforms.RandomRotation(180),
transforms.RandomCrop((256, 256)),
])
concat_images([transform(img) for _ in range(4)])
증강의 경우 transform 예시
transform = transforms.Compose([
transforms.RandomChoice([
transforms.RandomHorizontalFlip(),
transforms.RandomVerticalFlip(),
]),
transforms.Resize((256, 256)),
transforms.CenterCrop((IMAGE_SIZE, IMAGE_SIZE)),
transforms.ToTensor(),
transforms.Lambda(lambda x: (x / 127.5) - 1)
])