表一:一般符号

表二:特殊符号

特殊符号	描述
\d	匹配任何的十进制数字([0-9])
\D	匹配非数字(与\d相反)
\w	匹配数字字母下划线([a-zA-Z0-9_])
\W	与\w相反
\b	匹配任何单词边界
\B	与\b 相反
\c	匹配特殊字符. 比如: . 匹配. _ 匹配_ 其实就是使用\作为转义字符用而已.

表示择一匹配的管道符(|), 表示一个"从多个模式中选择其一的操作". 它用于分割不公的正则表达式

at|home 匹配的字符串: at, home

r2de|c3po 匹配的字符串: r2de, c3pro

bat|bet|bit 匹配的字符串: bat, bet, bit

使用这个符号, 增强了正则表达式的灵活性. 择一匹配有的时候也称之为并(union)或者(logical OR)

使用()可以对正则表达式进行分组, 则在匹配对象中可以获取到匹配到的子组的字符串.

在用到数量词的匹配时, 默认的是贪婪模式.

贪婪模式的意思是说, 匹配的时候, 尽量多匹配, 不行在慢慢的减少匹配

import re

reg = "\d{2,4}"
result = re.match(reg, "12345abc")    # 贪婪模式, 尽量多的匹配, 所以能匹配 4 个数字
print(result.group())

懒惰匹配模式是正好和贪婪模式相对的一种模式.

懒惰匹配模式是尽量的少匹配, 不行再慢慢的去增加匹配的个数.

启用懒惰模式只需要在数量词的后面添加?即可.

import re

reg = "\d{2,4}?" # 懒惰模式, 会尽量的少匹配
result = re.match(reg, "12345abc") 
print(result.group())