| 语法 | 意义 | 说明 |
| "." | 任意字符 | |
| "^" | 字符串开始 | '^hello'匹配'helloworld'而不匹配'aaaahellobbb' |
| "$" | 字符串结尾 | 与上同理 |
|
"*" |
0 个或多个字符(贪婪匹配) |
匹配 |
|
"+" |
1 个或多个字符(贪婪匹配) |
与上同理 |
|
"?" |
0 个或多个字符(贪婪匹配) |
与上同理 |
|
*?,+?,?? |
以上三个取第一个匹配结果(非贪婪匹配) |
匹配 |
|
{m,n} |
对于前一个字符重复m到n次,{m}亦可 |
a{6}匹配6个a、a{2,4}匹配2到4个a |
|
{m,n}? |
对于前一个字符重复m到n次,并取尽可能少 |
‘aaaaaa'中a{2,4}只会匹配2个 |
|
"\" |
特殊字符转义或者特殊序列 | |
|
[] |
表示一个字符集 | [0-9]、[a-z]、[A-Z]、[^0] |
|
"|" |
或 | A|B,或运算 |
|
(...) |
匹配括号中任意表达式 | |
|
(?#...) |
注释,可忽略 | |
|
(?=...) |
Matches if ... matches next, but doesn't consume the string. |
'(?=test)' 在hellotest中匹配hello |
|
(?!...) |
Matches if ... doesn't match next. |
'(?!=test)' 若hello后面不为test,匹配hello |
| (? |
Matches if preceded by ... (must be fixed length). |
'(?)test' 在hellotest中匹配test |
| (? |
Matches if not preceded by ... (must be fixed length). |
'(?test' 在hellotest中不匹配test |
|
特殊序列符号 |
意义 |
|
A |
只在字符串开始进行匹配 |
|
Z |
只在字符串结尾进行匹配 |
|
|
匹配位于开始或结尾的空字符串 |
|
B |
匹配不位于开始或结尾的空字符串 |
|
d |
相当于[0-9] |
|
D |
相当于[^0-9] |
|
s |
匹配任意空白字符:[ ] |
|
S |
匹配任意非空白字符:[^ ] |
|
w |
匹配任意数字和字母:[a-zA-Z0-9] |
|
W |
匹配任意非数字和字母:[^a-zA-Z0-9] |
3.re的主要功能函数
常用的功能函数包括:compile、search、match、split、findall(finditer)、sub(subn)
compile
re.compile(pattern[, flags])
作用:把正则表达式语法转化成正则表达式对象
flags定义包括:
re.I:忽略大小写
re.L:表示特殊字符集 w, W, , B, s, S 依赖于当前环境
re.M:多行模式
re.S:' . '并且包括换行符在内的任意字符(注意:' . '不包括换行符)
re.U: 表示特殊字符集 w, W, , B, d, D, s, S 依赖于 Unicode 字符属性数据库
search
re.search(pattern, string[, flags])
search (string[, pos[, endpos]])
作用:在字符串中查找匹配正则表达式模式的位置,返回 MatchObject 的实例,如果没有找到匹配的位置,则返回 None。
match
re.match(pattern, string[, flags])
match(string[, pos[, endpos]])
作用:match() 函数只在字符串的开始位置尝试匹配正则表达式,也就是只报告从位置 0 开始的匹配情况,而 search() 函数是扫描整个字符串来查找匹配。如果想要搜索整个字符串来寻找匹配,应当用 search()。
下面是几个例子:
例:最基本的用法,通过re.RegexObject对象调用
这本书给出了一份关于python这门优美语言的精要的参考。作者通过一个完整而清晰的入门指引将你带入python的乐园,随后在语法、类型和对象、运算符与表达式、控制流函数与函数编程、类及面向对象编程、模块和包、输入输出、执行环境等多方面给出了详尽的讲解。如果你想加入 python的世界,David M beazley的这本书可不要错过哦。 (封面是最新英文版的,中文版貌似只译到第二版)
1
说明一下:r是raw(原始)的意思。因为在表示字符串中有一些转义符,如表示回车' '。如果要表示表需要写为'\'。但如果我就是需要表示一个''+'n',不用r方式要写为:'\n'。但使用r方式则为r' '这样清晰多了。
例:设置flag
split
re.split(pattern, string[, maxsplit=0, flags=0])
split(string[, maxsplit=0])
作用:可以将字符串匹配正则表达式的部分割开并返回一个列表
例:简单分析ip
findall
re.findall(pattern, string[, flags])
findall(string[, pos[, endpos]])
作用:在字符串中找到正则表达式所匹配的所有子串,并组成一个列表返回
例:查找[]包括的内容(贪婪和非贪婪查找)
finditer
re.finditer(pattern, string[, flags])
finditer(string[, pos[, endpos]])
说明:和 findall 类似,在字符串中找到正则表达式所匹配的所有子串,并组成一个迭代器返回。同样 RegexObject 有:
sub
re.sub(pattern, repl, string[, count, flags])
sub(repl, string[, count=0])
说明:在字符串 string 中找到匹配正则表达式 pattern 的所有子串,用另一个字符串 repl 进行替换。如果没有找到匹配 pattern 的串,则返回未被修改的 string。Repl 既可以是字符串也可以是一个函数。
例:
subn
re.subn(pattern, repl, string[, count, flags])
subn(repl, string[, count=0])
说明:该函数的功能和 sub() 相同,但它还返回新的字符串以及替换的次数。同样 RegexObject 有:
python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号