import setup_env

✅ GPU 활성화: NVIDIA GeForce RTX 5070 Ti
✅ 전체 VRAM 용량: 15.92 GB
✅ CUDA 버전: 13.0
✅ PyTorch 버전: 2.9.0a0+145a3a7bda.nv25.10
--------------------------------------------------

# ==========================================
# 2. 데이터 로드 및 전처리 (Normalization)
# ==========================================
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307,), (0.3081,))
])

# MNIST 데이터셋 다운로드
train_dataset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_dataset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)

# DataLoader 설정
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=64, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=64, shuffle=False)

print(f"✅ 데이터 로드 완료 (학습: {len(train_dataset)}개, 테스트: {len(test_dataset)}개)")

✅ 데이터 로드 완료 (학습: 60000개, 테스트: 10000개)

import os

def list_files(startpath):
    print(f"📁 대상 경로: {os.path.abspath(startpath)}")
    for root, dirs, files in os.walk(startpath):
        level = root.replace(startpath, '').count(os.sep)
        indent = ' ' * 4 * (level)
        print(f"{indent}📂 {os.path.basename(root)}/")
        subindent = ' ' * 4 * (level + 1)
        for f in files:
            print(f"{subindent}📜 {f}")

# MNIST 데이터가 저장된 경로 확인
list_files('./data')

📁 대상 경로: /workspace/ai-deeplearning/tutorial/data
📂 data/
    📂 MNIST/
        📂 raw/
            📜 t10k-images-idx3-ubyte
            📜 t10k-images-idx3-ubyte.gz
            📜 t10k-labels-idx1-ubyte
            📜 t10k-labels-idx1-ubyte.gz
            📜 train-images-idx3-ubyte
            📜 train-images-idx3-ubyte.gz
            📜 train-labels-idx1-ubyte
            📜 train-labels-idx1-ubyte.gz

# 1번째(인덱스 0) 데이터 세트 가져오기
# train_dataset[0]은 (image_tensor, label_integer)를 반환합니다.
image, label = train_dataset[0]

print(f"✅ 데이터 타입: {type(image)}")       # <class 'torch.Tensor'>
print(f"✅ 이미지 모양: {image.shape}")       # torch.Size([1, 28, 28])
print(f"✅ 이 이미지의 정답(Label): {label}")  # 5 (MNIST의 첫 번째 데이터는 5입니다)

# 시각화 (Matplotlib)
import matplotlib.pyplot as plt

plt.imshow(image.squeeze(), cmap='gray')      # squeeze()로 [1, 28, 28] -> [28, 28] 변환
plt.title(f"Label (Ground Truth): {label}")
plt.show()

✅ 데이터 타입: <class 'torch.Tensor'>
✅ 이미지 모양: torch.Size([1, 28, 28])
✅ 이 이미지의 정답(Label): 5

import torch
from torchvision import datasets, transforms
import numpy as np
import sys

# 터미널/노트북에서 배열 생략 없이 전체를 보여주도록 설정
np.set_printoptions(threshold=sys.maxsize, linewidth=150)

# 1. 원본 데이터 로드 (전처리 없음)
dataset_raw = datasets.MNIST(root='./data', train=True, download=True)
img_raw, label = dataset_raw[0]
pixels_raw = np.array(img_raw)

# 2. 정규화 데이터 로드 (ToTensor + Normalize 적용)
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.1307,), (0.3081,))
])
dataset_norm = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
tensor_norm, _ = dataset_norm[0]
pixels_norm = tensor_norm.squeeze().numpy()

print(f"--- [첫 번째 이미지 (Label: {label}) - Raw 0~255] ---")
print(pixels_raw)

print("\n" + "="*50 + "\n")

print(f"--- [첫 번째 이미지 (Label: {label}) - Normalized Float] ---")
# 가독성을 위해 소수점 둘째자리까지 반올림
print(np.round(pixels_norm, 2))

--- [첫 번째 이미지 (Label: 5) - Raw 0~255] ---
[[  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   3  18  18  18 126 136 175  26 166 255 247 127   0   0   0   0]
 [  0   0   0   0   0   0   0   0  30  36  94 154 170 253 253 253 253 253 225 172 253 242 195  64   0   0   0   0]
 [  0   0   0   0   0   0   0  49 238 253 253 253 253 253 253 253 253 251  93  82  82  56  39   0   0   0   0   0]
 [  0   0   0   0   0   0   0  18 219 253 253 253 253 253 198 182 247 241   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0  80 156 107 253 253 205  11   0  43 154   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0  14   1 154 253  90   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0 139 253 190   2   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0  11 190 253  70   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0  35 241 225 160 108   1   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0  81 240 253 253 119  25   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0  45 186 253 253 150  27   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0  16  93 252 253 187   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0 249 253 249  64   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0  46 130 183 253 253 207   2   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0  39 148 229 253 253 253 250 182   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0  24 114 221 253 253 253 253 201  78   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0  23  66 213 253 253 253 253 198  81   2   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0  18 171 219 253 253 253 253 195  80   9   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0  55 172 226 253 253 253 253 244 133  11   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0 136 253 253 253 212 135 132  16   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]
 [  0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0]]

==================================================

--- [첫 번째 이미지 (Label: 5) - Normalized Float] ---
[[-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.39 -0.2  -0.2  -0.2   1.18  1.31  1.8  -0.09  1.69  2.82  2.72  1.19
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.04  0.03  0.77  1.54  1.74  2.8   2.8   2.8   2.8   2.8   2.44  1.77  2.8   2.66  2.06  0.39
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  0.2   2.61  2.8   2.8   2.8   2.8   2.8   2.8   2.8   2.8   2.77  0.76  0.62  0.62  0.29  0.07 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.2   2.36  2.8   2.8   2.8   2.8   2.8   2.1   1.89  2.72  2.64 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  0.59  1.56  0.94  2.8   2.8   2.19 -0.28 -0.42  0.12  1.54 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.25 -0.41  1.54  2.8   0.72 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  1.35  2.8   1.99 -0.4  -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.28  1.99  2.8   0.47 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  0.02  2.64  2.44  1.61  0.95 -0.41 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  0.61  2.63  2.8   2.8   1.09 -0.11 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  0.15  1.94  2.8   2.8   1.49 -0.08 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.22  0.76  2.78  2.8   1.96 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  2.75  2.8   2.75  0.39 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  0.16  1.23  1.91  2.8   2.8   2.21 -0.4  -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42  0.07  1.46  2.49  2.8   2.8   2.8   2.76  1.89 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.12  1.03  2.39  2.8   2.8   2.8   2.8   2.13  0.57 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.13  0.42  2.29  2.8   2.8   2.8   2.8   2.1   0.61 -0.4  -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.2   1.75  2.36  2.8   2.8   2.8   2.8   2.06  0.59 -0.31 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42  0.28  1.77  2.45  2.8   2.8   2.8   2.8   2.68  1.27 -0.28 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42  1.31  2.8   2.8   2.8   2.27  1.29  1.26 -0.22 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]
 [-0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42 -0.42
  -0.42 -0.42 -0.42 -0.42]]

import torch.nn as nn
import torch.nn.functional as F

class MLP(nn.Module):
    def __init__(self, input_size=784, hidden_size=128, num_classes=10):
        super(MLP, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)   # 784 -> 128
        self.fc2 = nn.Linear(hidden_size, 64)            # 128 -> 64
        self.fc3 = nn.Linear(64, num_classes)            # 64 -> 10
        
    def forward(self, x):
        # 입력 이미지를 1차원 벡터로 변환 (batch_size, 28*28)
        x = x.view(x.size(0), -1)
        
        # Hidden Layer 1 + ReLU
        x = F.relu(self.fc1(x))
        
        # Hidden Layer 2 + ReLU
        x = F.relu(self.fc2(x))
        
        # Output Layer (활성화 함수 없음)
        x = self.fc3(x)
        return x

model = MLP()
print("✅ MLP 모델 생성 완료")
print(model)

✅ MLP 모델 생성 완료
MLP(
  (fc1): Linear(in_features=784, out_features=128, bias=True)
  (fc2): Linear(in_features=128, out_features=64, bias=True)
  (fc3): Linear(in_features=64, out_features=10, bias=True)
)

import torch.optim as optim

# 1. 히스토리를 저장할 리스트 초기화
train_loss_history = []
train_acc_history = []

# 2. 손실 함수 및 최적화 설정
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

epochs = 30
model.to(device)

print(f"🚀 학습 시작 (기록 기능 활성화)")

for epoch in range(epochs):
    model.train()
    running_loss = 0.0
    correct = 0
    total = 0
    
    for images, labels in train_loader:
        images, labels = images.to(device), labels.to(device)
        
        # 순전파 및 가중치 업데이트
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        
        # 통계 기록
        running_loss += loss.item()
        
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
    
    # 에포크 종료 후 평균값 저장
    epoch_loss = running_loss / len(train_loader)
    epoch_acc = 100 * correct / total
    
    train_loss_history.append(epoch_loss)
    train_acc_history.append(epoch_acc)
    
    print(f"Epoch [{epoch+1}/{epochs}] - Loss: {epoch_loss:.4f}, Acc: {epoch_acc:.2f}%")

print("✨ 모든 학습 및 기록 완료!")

🚀 학습 시작 (기록 기능 활성화)
Epoch [1/30] - Loss: 0.2709, Acc: 92.03%
Epoch [2/30] - Loss: 0.1137, Acc: 96.52%
Epoch [3/30] - Loss: 0.0792, Acc: 97.54%
Epoch [4/30] - Loss: 0.0609, Acc: 98.08%
Epoch [5/30] - Loss: 0.0492, Acc: 98.43%
Epoch [6/30] - Loss: 0.0413, Acc: 98.67%
Epoch [7/30] - Loss: 0.0374, Acc: 98.80%
Epoch [8/30] - Loss: 0.0291, Acc: 99.02%
Epoch [9/30] - Loss: 0.0239, Acc: 99.22%
Epoch [10/30] - Loss: 0.0226, Acc: 99.24%
Epoch [11/30] - Loss: 0.0205, Acc: 99.34%
Epoch [12/30] - Loss: 0.0188, Acc: 99.35%
Epoch [13/30] - Loss: 0.0210, Acc: 99.33%
Epoch [14/30] - Loss: 0.0162, Acc: 99.44%
Epoch [15/30] - Loss: 0.0128, Acc: 99.57%
Epoch [16/30] - Loss: 0.0157, Acc: 99.48%
Epoch [17/30] - Loss: 0.0154, Acc: 99.47%
Epoch [18/30] - Loss: 0.0148, Acc: 99.47%
Epoch [19/30] - Loss: 0.0120, Acc: 99.59%
Epoch [20/30] - Loss: 0.0103, Acc: 99.67%
Epoch [21/30] - Loss: 0.0128, Acc: 99.57%
Epoch [22/30] - Loss: 0.0123, Acc: 99.61%
Epoch [23/30] - Loss: 0.0112, Acc: 99.63%
Epoch [24/30] - Loss: 0.0108, Acc: 99.68%
Epoch [25/30] - Loss: 0.0127, Acc: 99.60%
Epoch [26/30] - Loss: 0.0101, Acc: 99.64%
Epoch [27/30] - Loss: 0.0065, Acc: 99.78%
Epoch [28/30] - Loss: 0.0143, Acc: 99.59%
Epoch [29/30] - Loss: 0.0103, Acc: 99.69%
Epoch [30/30] - Loss: 0.0074, Acc: 99.77%
✨ 모든 학습 및 기록 완료!

# 1. 모델을 평가 모드로 전환
model.eval()

correct = 0
total = 0

# 2. 기울기 계산 비활성화 (메모리 절약 및 속도 향상)
with torch.no_grad():
    for images, labels in test_loader:
        # 데이터를 GPU로 전송
        images, labels = images.to(device), labels.to(device)
        
        # 순전파 연산
        outputs = model(images)
        
        # 가장 높은 점수를 받은 인덱스 선택 (예측값)
        _, predicted = torch.max(outputs.data, 1)
        
        # 전체 개수 및 맞은 개수 카운트
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

# 3. 최종 정확도 출력
accuracy = 100 * correct / total
print(f"🎯 테스트 데이터 최종 정확도: {accuracy:.2f}%")

🎯 테스트 데이터 최종 정확도: 98.00%

import matplotlib.pyplot as plt

# 1. 테스트 데이터에서 샘플 추출 및 예측
model.eval()
images, labels = next(iter(test_loader))
images, labels = images.to(device), labels.to(device)

outputs = model(images)
_, preds = torch.max(outputs, 1)

# CPU로 다시 옮겨서 시각화 준비
images = images.cpu().numpy()
labels = labels.cpu().numpy()
preds = preds.cpu().numpy()

# 2. 결과 시각화 (너비 100% 스타일)
plt.figure(figsize=(15, 4)) # 가로로 길게 설정

for idx in range(10): # 앞의 10개만 출력
    plt.subplot(1, 10, idx + 1)
    plt.imshow(images[idx].squeeze(), cmap='gray')
    
    # 정답 여부에 따라 타이틀 색상 변경 (맞으면 파랑, 틀리면 빨강)
    color = 'blue' if preds[idx] == labels[idx] else 'red'
    plt.title(f"P: {preds[idx]}\n(A: {labels[idx]})", color=color)
    plt.axis('off')

plt.tight_layout()
plt.show()

import matplotlib.pyplot as plt

# 1. 가로로 넓은 캔버스 설정 (18x5 인치)
plt.figure(figsize=(18, 5))

# --- [왼쪽: Loss 그래프] ---
plt.subplot(1, 2, 1)
plt.plot(range(1, epochs + 1), train_loss_history, marker='o', color='royalblue', linewidth=2, label='Train Loss')
plt.title('Training Loss Trend', fontsize=15, pad=15)
plt.xlabel('Epoch', fontsize=12)
plt.ylabel('Loss Value', fontsize=12)
plt.xticks(range(1, epochs + 1))
plt.grid(True, linestyle='--', alpha=0.7)
plt.legend(fontsize=12)

# --- [오른쪽: Accuracy 그래프] ---
plt.subplot(1, 2, 2)
plt.plot(range(1, epochs + 1), train_acc_history, marker='s', color='darkorange', linewidth=2, label='Train Accuracy')
plt.title('Training Accuracy Trend', fontsize=15, pad=15)
plt.xlabel('Epoch', fontsize=12)
plt.ylabel('Accuracy (%)', fontsize=12)
plt.xticks(range(1, epochs + 1))
plt.grid(True, linestyle='--', alpha=0.7)
plt.legend(fontsize=12)

# 레이아웃 정렬 및 출력
plt.tight_layout()
plt.show()

Step 5. MLP로 이미지 분류하기: MNIST 데이터셋 이해¶

1. MNIST란 무엇인가?¶

2. MLP(다층 퍼셉트론)의 이미지 처리 방식¶

데이터의 평탄화 (Flattening)¶

3. Step 5의 핵심 질문: "공간 정보의 손실"¶

2. 데이터 로드 및 전처리 (Data Loading & Preprocessing)¶

🌐 1) 데이터는 어디서 오나요? (datasets.MNIST)¶

🛠️ 2) 모델이 먹기 좋게 가공하기 (Transforms)¶

📦 3) 효율적인 배달 시스템 (DataLoader)¶

🔧 데이터 전처리: Normalization (정규화)¶

📊 왜 정규화가 필요한가?¶

🧮 정규화 수식¶

📈 변환 과정¶

🎯 정규화 효과¶

💡 예시¶

🏗️ MLP 모델 정의¶

📐 MLP (Multi-Layer Perceptron)란?¶

🧱 모델 구조¶

🔢 각 층의 역할¶

1️⃣ 입력층 (Input Layer)¶

2️⃣ 은닉층 1 (Hidden Layer 1)¶

3️⃣ 은닉층 2 (Hidden Layer 2)¶

4️⃣ 출력층 (Output Layer)¶

🎯 ReLU 활성화 함수¶

장점:¶

단점:¶

📊 파라미터 수 계산¶

🎯 손실 함수 및 옵티마이저¶

📉 손실 함수: CrossEntropyLoss¶

🧮 수식¶

📊 내부 동작¶

💡 예시¶

⚡ 옵티마이저: Adam¶

🧮 핵심 아이디어¶

✅ Adam의 장점¶

5.4 손실 함수, 최적화 및 학습 루프¶

1. 손실 함수 (Loss Function)¶

2. 최적화 도구 (Optimizer)¶

3. 학습 루프 (Training Loop)¶

🏋️ 학습 (Training)¶

🔄 학습 과정 (Epoch 개념)¶

📊 학습 루프 (Training Loop)¶

1️⃣ Forward Pass (순전파)¶

5.5 모델 평가 (Model Evaluation)¶

1. 평가 모드 (model.eval())¶

2. 기울기 계산 비활성화 (torch.no_grad())¶

3. 정확도(Accuracy) 계산¶

🌐 1) 데이터는 어디서 오나요? (`datasets.MNIST`)¶

🛠️ 2) 모델이 먹기 좋게 가공하기 (`Transforms`)¶

📦 3) 효율적인 배달 시스템 (`DataLoader`)¶

1. 평가 모드 (`model.eval()`)¶

2. 기울기 계산 비활성화 (`torch.no_grad()`)¶