このようなデータが含まれていると、
導き出される答えのバランスが良くない偏った答えとなってしまいます。
そこで、利用するデータは、正規化が必要になってきます。(推奨されてます)
正規化の方法としては、
特徴の平均を減算して標準偏差で除算
したものとなりますので、前回の温度のデータの場合ですと
こんな感じになります。
前回の記事は、こちら https://pillon-pg.blogspot.com/2019/08/tensorflow.html
# 平均
mean = dfTemp.mean(axis=0)
# 標準偏差
std = dfTemp.std(axis=0)
# 特徴の平均を減算して標準偏差で除算
#train_data = (train_data - mean) / std
print(str(mean))
print(str(std))
print("end")


0 件のコメント:
コメントを投稿