일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 책추천
- 파킹통장추천
- GA설치
- 파이썬
- 유튜브
- GA4
- 파이썬내장함수
- 구글애널리틱스공부
- 국민내일배움카드
- 구글애널리틱스
- 메이크샵
- 파이썬프로그래밍
- GA강의
- 파이썬정규표현식
- 신용카드추천
- 페이스북광고
- 파이썬공부
- 구글애널리틱스강의
- 파이썬문자열
- GA가이드
- 마케팅
- 파킹통장
- GA공부
- 유튜브광고
- 구글ads
- 구글애널리틱스가이드
- 구글애널리틱스4
- 카페24
- 파이썬함수
- GA
- Today
- Total
목록파이썬정규표현식 (4)
정리왕
강력한 정규 표현식의 세계로 이제 07-2에서 배우지 않은 몇몇 메타 문자의 의미를 살펴보고 그룹(Group)을 만드는 법, 전방 탐색 등 더욱 강력한 정규 표현식에 대해서 살펴보자. 메타 문자 아직 살펴보지 않은 메타 문자에 대해서 모두 살펴보자. 여기에서 다룰 메타 문자는 앞에서 살펴본 메타 문자와 성격이 조금 다르다. 앞에서 살펴본 +, * , [ ], { } 등의 메타문자는 매치가 진행될 때 현재 매치되고 있는 문자열의 위치가 변경된다(보통 소비된다고 표현한다). 하지만 이와 달리 문자열을 소비시키지 않는 메타 문자도 있다. 이번에는 이런 문자열 소비가 없는(zerowith assertions)메타 문자에 대해 살펴보자. 1) | | 메타 문자는 or과 동일한 의미로 사용된다. A|B라는 정규식이..
파이썬에서 정규 표현식을 지원하는 re 모듈 파이썬은 정규 표현식을 지원하기 위해 re(regular expresssion의 약어) 모듈을 제공한다. re 모듈은 파이썬을 설치할 때 자동으로 설치되는 기본 라이브러리로 사용 방법은 다음과 같다. >>> import re >>> p = re.compile('ab*') re.compile을 사용하여 정규 표현식(위 예에서는 ab*)을 컴파일한다. re.compile의 결과로 돌려주는 객체 p(컴파일된 패턴 객체)를 사용하여 그 이후의 작업을 수행할 것이다. 정규식을 컴파일할 때 특정 옵션을 주는 것도 가능한데, 이에 대해서는 뒤에서 자세히 살펴본다. 패턴이란 정규식을 컴파일한 결과이다. 정규식을 사용한 문자열 검색 이제 컴파일된 패턴 객체를 사용하여 문자열 ..
정규 표현식의 기초, 메타 문자 정규 표현식에서 사용하는 메타 문자 (meta characters)에는 다음과 같은 것이 있다. . ^ % * + ? { } [ ] \ | ( ) ★메타 문자란 원래 그 문자가 가진 뜻이 아닌 특별한 용도로 사용하는 문자를 말한다. 정규 표현식에 위 메타 문자를 사용하면 특별한 의미를 갖게 된다. 자, 그러면 가장 간단한 정규 표현식부터 시작해 각 메타 문자의 의미와 사용법을 알아보자. 문자 클래스 [ ] 우리가 가장 먼저 살펴볼 메타 문자는 바로 문자 클래스(character class)인 [ ]이다. 문자 클래스로 만들어진 정규식은 '[ ]사이의 문자들과 매치' 라는 의미를 갖는다. 문자 클래스를 만드는 메타 문자인 [ ] 사이에는 어떤 문자도 들어갈 수 있다. 즉, ..
정규표현식 (regular expressions)은 복잡한 문자열을 처리할 때 사용하는 기법으로, 파이썬만의 고유 문법이 아니라 문자열을 처리하는 모든 곳에서 사용한다. 정규식을 배우는 것은 파이썬을 배우는 것과는 또 다른 영역의 과제이다. 정규 표현식은 왜 필요한가? 다음과 같은 문제가 주어졌다고 가정해 보자. 주민등록번호를 포함하고 있는 텍스트가 있다. 이 텍스트에 포함된 모든 주민등록번호의 뒷자리를 * 문자로 변경해 보자. 우선 정규식을 전혀 모르면 다음과 같은 순서로 프로그램을 작성해야 할 것이다. 1. 전체 텍스트를 공백 문자로 나눈다 (split) 2. 나뉜 단어가 주민등록번호 형식인지 조사한다. 3. 단어가 주민등록번호 형식이라면 뒷자리를 *로 변환한다. 4. 나뉜 단어를 다시 조립한다. 이..