|}문자열을 'C:\경로\note' 라고 기입할 때 \n을 개행으로 인식하여 줄을 바꾸어버리곤 한다. 이러한 사태를 막기 위해선 문자열 앞에 <code>r'내용'</code> 형태로 앞에 r을 붙이면 이스케이프 코드를 사용하지 않고 입력한 그대로 나타난다.
+
|}문자열을 'C:\경로\note' 라고 기입할 때 \n을 개행으로 인식하여 줄을 바꾸어버리곤 한다. 이러한 사태를 막기 위해선 문자열 앞에 <code>r'내용'</code> 형태로 앞에 r을 붙이면 이스케이프 코드를 사용하지 않고 입력한 그대로 나타난다.(r은 Raw string을 의미하는 것)
=문자열의 사용 =
=문자열의 사용 =
===따옴표 사용===
===따옴표 사용===
124번째 줄:
124번째 줄:
|replace
|replace
|특정 문자를 바꾸고자 할 때.
|특정 문자를 바꾸고자 할 때.
−
|문자열.replace("찾을문자", "바꿀문자")
+
|문자열 = 문자열.replace("찾을문자", "바꿀문자")
|-
|-
|split
|split
|특정 문자열을 기준으로 문자들을 나누고자 할 때.
|특정 문자열을 기준으로 문자들을 나누고자 할 때.
−
|문자열.split("나눌문자")
+
|문자열 = 문자열.split("나눌문자")
|-
|-
|join
|join
|특정 문자열을 사이에 두고 합칠 때.
|특정 문자열을 사이에 두고 합칠 때.
ex) 2021, 03, 22 형태의 파편화된 날짜데이터를 보기 좋게 합쳐줌.
ex) 2021, 03, 22 형태의 파편화된 날짜데이터를 보기 좋게 합쳐줌.
−
|'사이문자'.join(리스트)
+
|문자열 = '사이문자'.join(리스트)
|}
|}
==정규표현식==
==정규표현식==
155번째 줄:
155번째 줄:
</syntaxhighlight>
</syntaxhighlight>
|-
|-
−
|
+
|특수문자를 지정하고 싶을 때
−
|
+
|!, ,, ?, *등의 문자를 매칭할 때.
−
|
+
|영어와 ?, !, ,, 만 뽑아낼때.<syntaxhighlight lang="python">
+
import re # 정규표현식을 사용하게 해주는 모듈.
+
...
+
for one_word in text:
+
filtered = re.sub('[^a-zA-Z0-9\?\!\,\.]', ' ', one_word) # 글자 하나하나 비교해 영어+숫자만 추출. 아니면 공백.