"TensorFlow"의 두 판 사이의 차이

Pywiki
둘러보기로 가기 검색하러 가기
잔글 (→‎개요)
221번째 줄: 221번째 줄:
 
|메모리 사용량이 너무 크다.
 
|메모리 사용량이 너무 크다.
 
|
 
|
 +
|-
 +
|WARNING:tensorflow:Your input ran out of data; interrupting training. Make sure that your dataset or generator can generate at least `steps_per_epoch * epochs` batches (in this case, 30000 batches). You may need to use the repeat() function when building your dataset.
 +
|케라스에서 제너레이터로 학습을 진행할 때 발생했다.
 +
'''steps_per_epoch''' 값이 너무 크기 때문으로 생각된다.
 +
|[https://foxtrotin.tistory.com/535 링크]
 
|}
 
|}
 
[[분류:딥러닝 라이브러리]]
 
[[분류:딥러닝 라이브러리]]

2022년 1월 25일 (화) 14:53 판

1 개요

머신러닝과 딥러닝에 많이 사용되어 머신러닝 라이브러리라 생각하는 사람들이 많은데, 실제로는 숫자계산을 위한 범용적인 라이브러리이다.

기본적으로 리눅스 환경에서 사용하기 위해 만들어진 라이브러리.

1.1 설치

설치가 까다로운 편이다. 요구하는 파이썬 버전 조건도 제한적이라 도커 안에서 다루는 편이 편할 것 같다.

1.1.1 의존성 확인

사용하는 버전이 안맞으면 계속 에러만 뜬다.

tensorflow 버전 알맞는 CUDA
2.4.x 11.1
2.3.x 10.1

1.1.2 OS에 따른 설치

OS 방법
Window
과정 설명
설치
  1. tensorflow가 요구하는 파이썬 버전 확인하고 설치해준다.(https://www.tensorflow.org/install?hl=ko)
  2. pip install --upgrade pip
  3. CPU만 쓴다면 pip install tensorflow, GPU를 사용한다면 pip install tensorflow-gpu(체감으론 GPU가 2배 정도 빠른듯)
  4. 위 작업에서 ERROR: Could not find a version that satisfies the requirement tensorflow가 뜬다면 파이썬이 64bit용이 아니기 때문이다.(텐서플로우는 64bit 기반)
  5. cpu stable 버전이 요구하는 넘파이 버전이 일정 미만일 수 있다.

텐서플로우 버전 확인

파이썬 콘솔에서 다음과 같이 진행하거나, 적당히 파일 실행해보자.
$ python
> import tensorflow as tf
> tf.__version__
import할 때 GPU 사용 가능한 버전에선 무언가가 없다며 오류가 뜰 것이다.
GPU사용준비 이 과정은 GPU를 사용할 때 진행한다.(CPU만 사용한다면 바로 설치로 넘어가면 됨.)
  • 텐서플로우 버전에 맞게 CUDA, cuDNN를 설치해준다. CUDA는 그냥 설치하면 되고, cuDNN은 맞는 것을 다운받아 압축을 푼 후 내부의 파일들을 CUDA의 이름이 겹치는 폴더에 내용물들을 복사해주면 된다.(그냥 CUDA 안에 전체 폴더를 끌어다 놓으면 파일들을 알아서 옮긴다.) 기본경로는 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v버전 형태이다.
  • 시스템 환경변수 편집 -> 고급 -> 환경변수(Edit environment for your account)에서 system variables 중 CUDA_PATH가 있는지 확인.
파이썬 콘솔에서 다음과 같이 다시 점검해보자. 위에서 떴던 오류가 이젠 없을 것이다.
$ python
> import tensorflow as tf
> tf.__version__

1.2 설치확인

과정 설명 방법
설치확인 텐서플로우 버전에 따라 명령어가 다르다. 버전 확인 후 알맞은 방법으로 hello를 표시해보자.
과정 설명
1.x버전
import tensorflow as tf

sess = tf.Session()
hello = tf.constant('hello')
print(sess.run(hello))
2.x버전 Session을 정의하고 run의 과정이 빠졌다.
import tensorflow as tf

node1 = tf.constant(3.0, dtype=tf.float32)
node2 = tf.constant(4.0)

tf.print(node1,node2)
학습 등의 이유로 굳이 Session의 정의가 필요할 땐 다음과 같은 코드를 상단에 넣는다. 그러면 1.x버전과 같은 용법을 사용할 수 있다.
# import tensorflow as tf
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()
버전확인
import tensorflow as tf

print(tf.__version__)

2 사용법

신경망 모델을 정의하기 위한 공간을 그래프, 모델을 실행하는 공간을 세션이라 부른다.

유의 : 1.x버전에서 세션을 정의하고 run 하는 과정이 2.x에선 생략되어 연산이 바로 실행된다.

의도 설명 방법
상수 정의 상수를 변수에 대입한다. 변수 = tf.constant(숫자)
변수 정의 변수 = tf.Variable(초기값)
플레이스홀더 정의 데이터를 담을 그릇을 만든다.

갯수에 해당하는 원소를 가진 배열이 들어오게 된다.

배열 크기에 제한을 두고 싶지 않다면 None을 넣는다.

변수 = tf.placeholder(자료형, [갯수])

2.1 활용

의도 설명 방법
데이터 시각화 TensorBoard. 로그데이터를 저장할 파일을 만들고 명령줄에서 tensorboard --logdir=경로 를 넣어주면 특정 포트에서 실행한다.

2세대 언어는 이것과 다를텐데...

import tensorflow as tensorflow

tb = tf.summary.FileWriter("log_dir", graph=)
데이터 다운 MNIST에서 제공하는 데이터 따위를 손쉽게 다운받을 수 있다.
from tensorflow.examples.tutorials.mnist import input_data  # 손글씨 분류데이터를 받아온다.

DB = input_data.read_data_sets('저장경로/', one_hot=True)

3 에러

3.1 패키지 버전관련

에러 원인 해결방법
Could not load dynamic library 'cudart64_110.dll'; dlerror: cudart64_110.dll not found 2.1버전 이후부터 패키지에 CPU, GPU버전이 모두 설치된다.

GPU 도구가 설치되지 않았을 때 발생.

  • CPU버전으로 실행(무시하고 진행하면 CPU버전으로 실행한다. 텐서플로우를 임포트 하기 전, 코드 상단에 os를 임포트하고 os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'를 넣어주면 에러메시지도 없앨 수 있다. 부작용으로... 에러메시지를 못본다.(기본적인 에러메시지는 뜬다.))
  • GPU를 사용할 수 있는 환경 갖추기.(위 설치 참고.)
위와 같은 에러

W tensorflow/stream_executor/platform/default/dso_loader.cc:60] Could not load dynamic library 'cudart64_110.dll'; dlerror: cudart64_110.dll not found

의존성 문제. ㅅㅂ.. CUDA10.1을 사용하고 있다면 pip install tensorflow==2.3.0을 사용하고,

tensorflow가 2.4.0 이라면 CUDA11.0 으로 올려야 한다.

AttributeError: module 'tensorflow' has no attribute 'Session' 2.X버전은 session정의가 없어진다. 1.x버전의 문법으로 명령을 실행할 때 나오는 에러. 위의 설치 참고.
ModuleNotFoundError: No module named 'tensorflow' 분명 설치했는데 안된다??

(설치했다 지우긴 했다;;)

터미널에서 pip install --ignore-installed --upgrade tensorflow를 시도해보자.

3.2 설치 전 인프라 관련

에러 원인 해결방법
importerror: could not find the dll(s) 'msvcp140_1.dll'. tensorflow requires that these dlls be installed in a directory that is named in your %path% environment variable. you may install these dlls by downloading "microsoft c++ redistributable for visual studio 2015, 2017 and 2019" for your platform from this url: https://support.microsoft.com/help/2977003/the-latest-supported-visual-c-downloads 마으크로소프트의 c++ redistributable for visual studio가 설치되 않았기 때문에 뜨는 에러.

위 설치 방법을 잘 따라왔다면 발생하지 않을 에러이다.

microsoft c++ redistributable for visual studio 2015, 2017 and 2019를 설치해주면 되는데... 어째서인지 설치페이지가 안열려 곤란하다. 아무리 검색해도 이에 관한 내용은 없고...

이런 경우 학교망, 회사망을 사용하고 있지 않은지 점검해보자. 학교망, 회사망에선 이의 설치를 막는 경우도 있다.

=> 집에서 설치하고 복귀

3.3 사용 관련

에러 원인 해결방법
I tensorflow/compiler/mlir/mlir_graph_optimization_pass.cc:185] None of the MLIR Optimization Passes are enabled (registered 2) 메모리 사용량이 너무 큰 게 원인인듯.
tensorflow.python.framework.errors_impl.ResourceExhaustedError:  failed to allocate memory 메모리 사용량이 너무 크다.
WARNING:tensorflow:Your input ran out of data; interrupting training. Make sure that your dataset or generator can generate at least `steps_per_epoch * epochs` batches (in this case, 30000 batches). You may need to use the repeat() function when building your dataset. 케라스에서 제너레이터로 학습을 진행할 때 발생했다.

steps_per_epoch 값이 너무 크기 때문으로 생각된다.

링크