"Scikit-learn:데이터 분석"의 두 판 사이의 차이
둘러보기로 가기
검색하러 가기
29번째 줄: | 29번째 줄: | ||
y_pred = pd.Series(model.predict(x), index=x.index) # 회귀선을 얻을 수 있다. | y_pred = pd.Series(model.predict(x), index=x.index) # 회귀선을 얻을 수 있다. | ||
− | + | # 2차원 배열을 받아 행으 갯수만큼 y값을 반환한다. | |
print("변수에 대한 예상값 : ",model.predict([['임의값1', '임의값2', '임의값3', ...]])) | print("변수에 대한 예상값 : ",model.predict([['임의값1', '임의값2', '임의값3', ...]])) | ||
</syntaxhighlight> | </syntaxhighlight> |
2023년 1월 17일 (화) 08:51 기준 최신판
1 개요[편집 | 원본 편집]
데이터 분석과 관련한 기능.
2 선형 회귀분석[편집 | 원본 편집]
2.1 회귀선 그리기[편집 | 원본 편집]
from sklearn.linear_model import LinearRegression
x = # x축 데이터
y = # y축 데데이터
model = LinearRegression()
model.fit(x, y)
y_pred = pd.Series(model.predict(x), index=x.index) # 회귀선을 얻을 수 있다.
2.1.1 여러 데이터를 사용하는 경우(다중 선형 회귀분석)[편집 | 원본 편집]
from sklearn.linear_model import LinearRegression
x = df[['변수1', '변수2', '변수3', ...]] # x축 데이터
y = df[['결과']] # y축 데데이터
model = LinearRegression()
model.fit(x, y)
y_pred = pd.Series(model.predict(x), index=x.index) # 회귀선을 얻을 수 있다.
# 2차원 배열을 받아 행으 갯수만큼 y값을 반환한다.
print("변수에 대한 예상값 : ",model.predict([['임의값1', '임의값2', '임의값3', ...]]))
2.2 회귀 결과[편집 | 원본 편집]
의도 | 설명 | 방법 |
---|---|---|
절편값 구하기 | 모든 변수가 0일 때의 y값 | model.intercept_ |
회귀계수 구하기 | 기울기의 역할. | model.coef_ |