re 모듈의 sub 메소드 사용법

2021. 11. 28. 16:04·프로그래밍 언어/파이썬

 

# re.sub 함수의 형태
- `re.sub(pattern, repl, string, count=0, flags=0)`   == `re.sub('패턴, '바꿀 문자열', '문자열', '바꿀횟수')`
- cunt는 음수가 아닌 정수, count가 0 또는 생략이면 찾은 문자열을 모두 치환.

### sub함수를 통해 문자열 내의 특수문자를 제거 하기
- clean_text함수에서 입력 문자열 inputStirng에 대해 입력된 특수문자들을 찾아 ''공백으로 치환하여 변환된 문자열을 반환한다.




```python
import re

def clean_text(inputString):
    text_rmv = re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', ' ', inputString)
    return text_rmv

```

#### 특수문자가 포함된 문자열을 clean_text함수에 적용하여 결과를 확인하면 아래와 같다.


```python
input = '네덜란드 광장서 퍼진 "무궁화 꽃이 피었습니다" [포착]'
string = clean_text(input)
print(string)
```

    네덜란드 광장서 퍼진  무궁화 꽃이 피었습니다   포착
   

문자열 내에 포함된 특수문자들이 공백으로 치환된 것을 확인 할 수 있다.  
   
특수문자를 공백으로 치환하여 위에 출력된 문자열에는 공백의 위치에 여러개의 공백이 포함되어 있다.  
여러개의 공백을 제거하고 하나의 공백으로 나타내도록 split / join 함수를 이용해 clean_text함수에 코드를 추가한다.  

### split/ join [reference] `https://clolee.tistory.com/18`



```python
import re

def clean_text(inputString):
    text_rmv = re.sub('[-=+,#/\?:^.@*\"※~ㆍ!』‘|\(\)\[\]`\'…》\”\“\’·]', ' ', inputString)
    result = ' '.join(text_rmv.split())
    return result
```


```python
input = '네덜란드 광장서 퍼진 "무궁화 꽃이 피었습니다" [포착]'
string = clean_text(input)
print(string)
```

    네덜란드 광장서 퍼진 무궁화 꽃이 피었습니다 포착
   



 

저작자표시 (새창열림)

'프로그래밍 언어 > 파이썬' 카테고리의 다른 글

FastAPI를 이용한 TDD 개발 - 4  (0) 2024.03.14
FastAPI를 이용한 TDD 개발 - 3  (0) 2024.03.12
FastAPI를 이용한 TDD 개발 - 2  (0) 2024.03.11
FastAPI를 이용한 TDD 개발 - 1  (0) 2024.03.10
FastAPI를 이용한 TDD 개발  (0) 2024.03.10
'프로그래밍 언어/파이썬' 카테고리의 다른 글
  • FastAPI를 이용한 TDD 개발 - 3
  • FastAPI를 이용한 TDD 개발 - 2
  • FastAPI를 이용한 TDD 개발 - 1
  • FastAPI를 이용한 TDD 개발
hyeseong-dev
hyeseong-dev
안녕하세요. 백엔드 개발자 이혜성입니다.
  • hyeseong-dev
    어제 오늘 그리고 내일
    hyeseong-dev
  • 전체
    오늘
    어제
    • 분류 전체보기 (283)
      • 여러가지 (107)
        • 알고리즘 & 자료구조 (72)
        • 오류 (4)
        • 이것저것 (29)
        • 일기 (1)
      • 프레임워크 (39)
        • 자바 스프링 (39)
        • React Native (0)
      • 프로그래밍 언어 (38)
        • 파이썬 (30)
        • 자바 (3)
        • 스프링부트 (5)
      • 운영체제 (0)
      • DB (17)
        • SQL (0)
        • Redis (17)
      • 클라우드 컴퓨팅 (2)
        • 도커 (2)
        • AWS (0)
      • 스케쥴 (65)
        • 세미나 (0)
        • 수료 (0)
        • 스터디 (24)
        • 시험 (41)
      • 트러블슈팅 (1)
      • 자격증 (0)
        • 정보처리기사 (0)
      • 재태크 (5)
        • 암호화폐 (5)
        • 기타 (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    완전탐색
    ecs
    Spring WebFlux
    spring
    취업리부트
    자바
    프로그래머스
    WebFlux
    java
    DP
    #개발자포트폴리오 #개발자이력서 #개발자취업 #개발자취준 #코딩테스트 #항해99 #취리코 #취업리부트코스
    파이썬
    AWS
    백준
    Python
    Docker-compose
    OOP
    시험
    Spring Boot
    SAA
    항해99
    EC2
    그리디
    docker
    celery
    reactor
    mybatis
    Redis
    RDS
    FastAPI
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
hyeseong-dev
re 모듈의 sub 메소드 사용법
상단으로

티스토리툴바