"Scikit-learn:데이터 분석"의 두 판 사이의 차이

Pywiki
둘러보기로 가기 검색하러 가기
 
29번째 줄: 29번째 줄:
 
y_pred = pd.Series(model.predict(x), index=x.index)  # 회귀선을 얻을 수 있다.
 
y_pred = pd.Series(model.predict(x), index=x.index)  # 회귀선을 얻을 수 있다.
  
 
+
# 2차원 배열을 받아 행으 갯수만큼 y값을 반환한다.
 
print("변수에 대한 예상값 : ",model.predict([['임의값1', '임의값2', '임의값3', ...]]))
 
print("변수에 대한 예상값 : ",model.predict([['임의값1', '임의값2', '임의값3', ...]]))
 
</syntaxhighlight>
 
</syntaxhighlight>

2023년 1월 17일 (화) 08:51 기준 최신판

1 개요[편집 | 원본 편집]

데이터 분석과 관련한 기능.

2 선형 회귀분석[편집 | 원본 편집]

2.1 회귀선 그리기[편집 | 원본 편집]

from sklearn.linear_model import LinearRegression

x = # x축 데이터
y = # y축 데데이터

model = LinearRegression()
model.fit(x, y)

y_pred = pd.Series(model.predict(x), index=x.index)  # 회귀선을 얻을 수 있다.

2.1.1 여러 데이터를 사용하는 경우(다중 선형 회귀분석)[편집 | 원본 편집]

from sklearn.linear_model import LinearRegression

x = df[['변수1', '변수2', '변수3', ...]]  # x축 데이터
y = df[['결과']]  # y축 데데이터

model = LinearRegression()
model.fit(x, y)

y_pred = pd.Series(model.predict(x), index=x.index)  # 회귀선을 얻을 수 있다.

# 2차원 배열을 받아 행으 갯수만큼 y값을 반환한다.
print("변수에 대한 예상값 : ",model.predict([['임의값1', '임의값2', '임의값3', ...]]))

2.2 회귀 결과[편집 | 원본 편집]

의도 설명 방법
절편값 구하기 모든 변수가 0일 때의 y값 model.intercept_
회귀계수 구하기 기울기의 역할. model.coef_