[Python] Regular Expression | 정규 표현식

2020. 4. 20. 17:48

상단으로

Special Character	Description
.	- newline을 제외한 모든 문자에 매칭된다. - DOTALL Flag가 설정되면, newline문자를 포함한 모든 문자에 매칭된다.
^	- 문자열의 시작부분에 매칭된다. - MULTILINE Flag가 설정되면, 각각의 newline에서의 문자열 시작부분에 매칭된다.
$	- 문자열의 끝부분 또는 newline 바로 이전 부분에 매칭된다. - MULTILINE Flag가 설정되면, newline 바로 이전 부분에 매칭된다.
*	- 0개 이상의 반복되는 부분에 매칭된다.
+	- 1개 이상의 반복되는 부분에 매칭된다.
?	- 0회 또는 1회 반복되는 부분에 매칭된다.
*? +? ??	- 가능한한, 많은 문자에 매칭된다. (Greedy)
{m}	- 정확히 m회 반복되는 부분에 매칭된다.
{m, n}	- m회 이상, n회 이하 반복되는 부분에 매칭되는데, 가능한한 많은 횟수의 반복에 우선적으로 매칭된다. (Greedy)
{m, n}?	- m회 이상, n회 이하 반복되는 부분에 매칭되는데, 가능한한 적은 횟수의 반복에 우선적으로 매칭된다. (Non-Greedy)
\	- Escape Special Sequence를 표현하고자 하는 경우, \를 앞에 붙인다. - Escape Special Sequence는 '*' 문자, '?' 문자와 같이, re 모듈에서 특수 기능으로 사용되는 문자를 의미한다.
[<char-set>]	- 1개 이상의 문자로 구성된 <char-set>의 각각의 문자에 매칭된다. ex) [amk]의 경우, 문자 'a' 또는 'm' 또는 'k'에 매칭된다.
[<start>-<end>]	- <start> 문자 이상, <end> 문자 이하의 문자에 매칭된다. ex) [a-z]의 경우, 영문 소문자 1글자('a'~'z')에 매칭된다. ex) [0-9]의 경우, 숫자 1글자('0'~'9')에 매칭된다. (10진법수) ex) [0-5][0-9]의 경우, '00'에서 '59'에 매칭된다. (60진법수) ex) [0-9A-Fa-f]의 경우, '0'에서 'F'('f')에 매칭된다. (16진수)
[<escape-special-sequence>]	- Escape Special Sequence는 대괄호([ ]) 내에서는 기능이 상실된다. - 대괄호([ ])내에서 '[' 를 표현하고자 하는 경우, 그냥 '['를 기술하면 된다. - 대괄호([ ])내에서 ']' 를 표현하고자 하는 경우, '\]' 또는 ']'를 대괄호([ ])내에서 가장 앞에 위치시킨다. ex) [(+)]는 Literal Character '(', '+', '', ')' 에 매칭된다. ex) [()[\]{}]는 '(', ')', '[', ']', '{', '}'에 매칭된다. ex) []()[{}]는 '(', ')', '[', ']', '{', '}'에 매칭된다.
[^<char>]	- <char> 문자를 제외한 모든 문자에 매칭된다. (Complementing; 여집합)
<re1>\|<re2>	- 정규 표현식 <re1> 또는 정규 표현식 <re2>에 매칭된다. - <re1>의 매칭을 먼저 탐색한다. - <re1>과 <re2>에 모두 매칭될 경우, <re1>에 대한 매칭결과만 반환된다. (Non-Greedy)
(...)	- 소괄호(( ))내에 위치하는 정규 표현식에 매칭된다. - 소괄호(( )) 표현식의 결과는 \number Sequence를 통해 각각의 결과에 접근할 수 있다. - '('를 표현하고자 하는 경우, \(로 표현하거나 [(]로 표현한다. - ')'를 표현하고자 하는 경우, \)로 표현하거나 [)]로 표현한다.
(?...)
(?aiLmsux)
(?:...)
(?aiLmsux-imsx:...)
(?P<name>...)
(?P=name)
(?#...)
(?=...)
(?!...)
(?<=...)
(?<!...)
(?(id/name)yes-pattern\|no-pattern)

Special Sequence	Description
\number
\A
\b
\B
\d
\D
\s
\S
\w
\W
\Z
\u
\U
\N
\N{name}

Flag	Description
re.A
re.ASCII
re.DEBUG
re.I
re.IGNORECASE
re.L
re.LOCALE
re.M
re.MULTILINE
re.S
re.DOTALL
re.X
re.VERBOSE

Function	Description
re.compile(pattern, flags=0)
re.search(pattern, string, flags=0)
re.match(pattern, string, flags=0)
re.fullmatch(pattern, string, flags=0)
re.split(pattern, string, maxsplit=0, flags=0)
re.findall(pattern, string, flags=0)
re.finditer(pattern, string, flags=0)
re.sub(pattern, repl, string, count=0, flags=0)
re.subn(pattern, repl, string, count=0, flags=0)
re.escape(pattern)
re.purge()
re.error(msg, pattern=None, pos=None)

Exception	Description
msg
pattern
pos
lineno
colno

[Python] Regular Expression | 정규 표현식

Special Characters (특수 문자)

Special Sequences (특수 시퀀스)

re Module Flags

re Module Functions

re Module Exceptions

Regular Expression Objects

티스토리툴바

Object	Description
Pattern.search(string[, pos[, endpos]])
Pattern.match(string[, pos[, endpos]])
Pattern.fullmatch(string[, pos[, endpos]])
Pattern.split(string, maxsplit=0)
Pattern.findall(string[, pos[, endpos]])
Pattern.finditer(string[, pos[, endpos]])
Pattern.sub(repl, string, count=0)
Pattern.subn(repl, string, count=0)
Pattern.flags
Pattern.groups
Pattern.groupindex
Pattern.pattern
Match.expand(template)
Match.group([group1, ...])
Match.__getitem__(g)
Match.groups(default=None)
Match.groupdict(default=None)
Match.start([group])
Match.end([group])
Match.span([group])
Match.pos
Match.endpos
Match.lastindex
Match.lastgroup
Match.re
Match.string

패턴	\d	\D	\w	\W	\s	\S	\b	\B
일치	숫자	비숫자	알파벳 문자	비알파벳 문자	공백 문자	비공백 문자	단어 경계*	비단어 경계

패턴	일치	패턴	일치
abc	리터럴 abc	prev {m}	m회의 prev
(expr)	expr	prev {m, n}	m에서 n회의 최대 prev
expr1 \| expr2	expr1 또는 expr2	prev {m, n}?	m에서 n회의 최소 prev
.	\n을 제외한 모든 문자	[abc]	a 또는 b 또는 c (a\|b\|c와 같음)
^expr	소스 문자열의 시작 (Anchor)	[^abc]	(a 또는 b 또는 c) 가 아님
expr$	소스 문자열의 끝 (Anchor)	prev (?=next)	뒤에 next가 오면 prev
prev ?	0 또는 1회의 prev	prev (?!next)	뒤에 next가 오지 않으면 prev
prev*	0회 이상의 최대 prev	(?<=prev) next	전에 prev가 오면 next
prev*?	0회 이상의 최소 prev	(?<!prev) next	전에 prev가 오지 않으면 next
prev+	1회 이상의 최대 prev
prev+?	1회 이상의 최소 prev