碎言博客

Python 采集数据三步曲之[正则表达式 re.py]

J.sky 2017-09-01 13:09:49 Python基础

越来越多的朋友开始注意并喜欢上python,有时做为一个新手或是一个从其它编程语言转投过来的新人可能会稍稍有些迷茫,Python的学习应该从哪里开始呢?虽然雄心壮志万丈目标宏伟,但我们是否应该先订一个小小的目标呢?比如说先码一个简单的Python采集器

如何用 Python 开始一个简单的正则表达式?

其实很简单,从

import re

引入 Python 的正则表达式支持模块开始。

开始使用 re 模块

#codeing=utf-8
import re
p = re.compile(r'17python')#创建Pattern对象
m = p.match('17python.com')
if m :
    print(m.group())
# 输出结果为:17python

另一种方式:

#使用re模块方法代替实例方法
print(re.match('17python', '17python.com').group())
# 输出结果为:17python

re模块及正则实例常用方法演示

p = re.compile(r'17python')
s1 = '17python.com'
s2 = 'www.17python.com'
s3 = '17python.com17python.com'
s4 = 'abc.com'
p4 = re.compile('abc')
print(p.match(s1).group())
print(p.search(s2).group())
print(p.findall(s3))
print(p4.sub('17python', s4))

以上只是 Python re模块中最常用的方法,这些后边采集数据的时候都会用到。更多方法的详细介绍可以参考 Python 文档 re模块详解

元字符 (参见 python 模块 re 文档)

更详细的 Python re正则表达式教程

本文源码下载:

发现错误?想参与编辑? 在 GitHub 上编辑此页!

如果您有什么问题,欢迎加入Python/Javascript学习讨论群询问

Python/Javascript学习QQ群号:217840699