1 데이터 처리
데이터 입럭은 3가지 형태로 이루어진다.
1. 넘파이 배열. 일반적인 데이터과학에서 자주 사용되는 형태.
2. 텐서플로우의 데이터셋 오브젝트. 성능행상에 도움.
3. 파이썬 제너레이터.
tf.keras.preprocessing.image_dataset_from_directory turns image files sorted into class-specific folders into a labeled dataset of image tensors.
tf.keras.preprocessing.text_dataset_from_directory does the same for text files.
2 사용
2.1 데이터 사전작업
의도
|
설명
|
방법
|
정규화
|
일반적으로 데이터는 0~1 사이로 정규화한다.
|
|
csv 가져오기
|
csv를 넘파이 배열화 해야 한다.
|
import pandas
csv = pd.read_csv("경로.csv") # 판다스를 이용하여 불러온다.
x = csv[['열1', '열2']].as_matrix() # 넘파이배열로 바꾸어 x에 담는다.
|
2.1.1 신경망 모델 제작
의도
|
설명
|
방법
|
모듈 불러오기
|
.layers : 각 계층을 만드는 모듈.
models : 각 레이어들을 연결하여 신경망모델을 만든 후 컴파일하고 학습시키는 역할.
|
from keras import layers. models
|
신경망 디자인
|
ANN에 필요한 파라미터를 정해준다.
인수
|
설명
|
Nin
|
입력계층 노드 수
|
Nh
|
은닉계층 노드 수
|
number_of_class
|
출력값이 가질 클래스 수
|
Nout
|
출력노드 수
|
|
|
모델링
|
다양한 방법으로 모델링.
|
|
2.2 기타 활용
2.2.1 샘플데이터
의도
|
설명
|
방법
|
손글씨 샘플
|
mnist의 샘플데이터를 가져온다.
|
from keras.datasets import mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
|
|
|
|