왜 이 코드를 실행하나요? 로드된 이미지들을 하나의 거대한 수치 행렬로 합치고, 나이 정답을 배열로 변환합니다. 이미지 픽셀값은 0~1 사이로 정규화하여 학습 준비를 마칩니다.
X = np.empty((1, img_size[0], img_size[1], 3))
# 데이터를 쌓을 빈 행렬 틀을 만들어요.
for img in all_images:
# 낱개 사진들을 하나씩 행렬 뒤로 합쳐요.
X = np.vstack((X, np.array(img).reshape(1, img_size[0], img_size[1], 3)))
# 0번으로 만들었던 가짜 틀을 제거해요.
X = np.delete(X, (0), axis=0)
# 나이 리스트를 Numpy 배열로 바꿔요.
y = np.array(ages)
# 학습용과 테스트용으로 8:2 비율로 나눠요.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y, shuffle=True, random_state=10)
# 공부할 데이터의 픽셀값을 0~1로 스케일링해요.
X_train = X_train / 255.
# 시험 볼 데이터도 똑같이 스케일링해요.
실제 출력
y_train[:5]: [10, 10, 10, 10, 10]
출력 해설: 이미지는 수치 행렬로 변환되었고, 각 이미지의 정답인 나이 데이터가 준비되었습니다.