Learn practical skills, build real-world projects, and advance your career
import warnings
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
warnings.filterwarnings("ignore")

1) 載入資料集

df_train = pd.read_csv('./data/Iris.csv')
df_train = df_train.drop(labels=['Id'],axis=1) # 移除Id
df_train

2) 手動編碼

處理名目資料 (Nominal variables) - 資料前處理
依據特徵資料的特性,可以選擇手動編碼或自動編碼。

使用編碼時機?

進行深度學習時,神經網路只能處理數值資料。因此我們需要將所有非數字型態的特徵進行轉換。

ex:

Iris-setosaIris-versicolorIris-virginica
123
label_map = {'Iris-setosa': 0, 'Iris-versicolor': 1, 'Iris-virginica': 2}

#將編碼後的label map存至df_train['Species']中。
df_train['Class'] = df_train['Species'].map(label_map)