파이썬에서 문자열을 다룰 때, `r`문자열과 `u`문자열이라는 두 가지 특별한 문자열 표기법이 자주 사용됩니다.
각각의 표기법은 문자열을 정의할 때 특정한 목적을 가지고 있습니다.
r 문자열(Raw String)
r
문자열은 이스케이프 시퀀스(예:\n
(개행),\t
(탭) 등)를 무시하고 문자열의 내의 모든 문자를 그대로
표현하고자 할 떄 사용됩니다. 즉, 백슬래시(\
)가 특별한 처리 없이 일반 문자로 취급됩니다.주로 정규 표현식과 같이 백슬래시를 자주 사용하는 문자열에서 유용하게 사용됩니다. 이는 백슬래시를 이스케이프할
필요 없이 편리하게 문자열을 정의할 수 있게 합니다.
raw_string = r"C:\Users\Example\Documents"
print(raw_string) # 출력: C:\Users\Example\Documents
u 문자열(Unicode String)
u 문자열은 유니코드 문자열을 나타낼 때 사용되었던 표기법입니다. 파이썬 2에서는 u 접두사를 붙여 유니코드 문자열을 명시적으로 표현했습니다.
파이썬 3 이상에서는 모든 문자열이 기본적으로 유니코드(UTF-8)로 처리되므로, u 접두사는 필수적이지 않게 되었습니다. 하지만, 파이썬 2 코드와의 호환성을 위해 여전히 사용될 수 있습니다.
unicode_string = u"Hello, World!"
print(unicode_string) # 출력: Hello, World!
요약:
r 문자열 (Raw String): 이스케이프 시퀀스를 무시하고 문자열을 그대로 처리하고 싶을 때 사용됩니다. 정규 표현식과 파일 경로를 다룰 때 유용합니다.
u 문자열 (Unicode String): 파이썬 2에서 유니코드 문자열을 명시적으로 표현하기 위해 사용되었습니다. 파이썬 3에서는 모든 문자열이 기본적으로 유니코드이므로, 주로 코드의 호환성을 위해 사용됩니다.
'프로그래밍 언어 > 파이썬' 카테고리의 다른 글
파이썬에서 접근제어 지시자 (0) | 2024.03.20 |
---|---|
Call by Assignment란? (0) | 2024.03.20 |
__repr__, __str__의 차이점 (0) | 2024.03.20 |
__new__, __init__ 차이점 (0) | 2024.03.20 |
매직메소드란? (0) | 2024.03.20 |