1 데이터 처리
데이터 입럭은 3가지 형태로 이루어진다. 1. 넘파이 배열. 일반적인 데이터과학에서 자주 사용되는 형태. 2. 텐서플로우의 데이터셋 오브젝트. 성능행상에 도움. 3. 파이썬 제너레이터.
tf.keras.preprocessing.image_dataset_from_directory turns image files sorted into class-specific folders into a labeled dataset of image tensors. tf.keras.preprocessing.text_dataset_from_directory does the same for text files.
2 사용
2.1 데이터 사전작업
의도 | 설명 | 방법 |
---|---|---|
정규화 | 일반적으로 데이터는 0~1 사이로 정규화한다. | |
csv 가져오기 | csv를 넘파이 배열화 해야 한다. | import pandas
csv = pd.read_csv("경로.csv") # 판다스를 이용하여 불러온다.
x = csv[['열1', '열2']].as_matrix() # 넘파이배열로 바꾸어 x에 담는다.
|
2.1.1 신경망 모델 제작
의도 | 설명 | 방법 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
모듈 불러오기 | .layers : 각 계층을 만드는 모듈.
models : 각 레이어들을 연결하여 신경망모델을 만든 후 컴파일하고 학습시키는 역할. |
from keras import layers. models
| ||||||||||
신경망 디자인 | ANN에 필요한 파라미터를 정해준다.
|
|||||||||||
모델링 | 다양한 방법으로 모델링. |
2.2 기타 활용
2.2.1 샘플데이터
의도 | 설명 | 방법 |
---|---|---|
손글씨 샘플 | mnist의 샘플데이터를 가져온다. | from keras.datasets import mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
|