如何使用正则表达式和 Python 匹配不以模式开头的字符串

liftword2周前 (06-18)技术文章5

需要在 Python 中使用正则表达式来匹配不以给定模式开头的字符串吗?

如果是这样,你可以使用下面的语法来查找所有的字符串,除了那些不以https 开始的字符串。

r"^(?!https).*"
复制代码

第一步:匹配不以模式开头的字符串

在这个例子中,我们有一个 URL 的列表。假设你想得到所有不以https 开始的网址。

为了这个目的,我们将使用负数查找。

import re
texts = [
'https://en.wikipedia.org/wiki/Main_Page/',
'http://en.wikipedia.org/wiki/National_Park_Service/',
'https://en.wikipedia.org/wiki/Hoover_Dam/',
'http://en.wikipedia.org/wiki/United_States_Bureau_of_Reclamation/',
'https://en.wikipedia.org/wiki/Central_African_Republic/',
'en.wikipedia.org/wiki/Africa/',
'ftp://en.wikipedia.org/wiki/Central_African_Republic/',
]
for text in texts:
    print(re.findall(r"^(?!https).*", text))
复制代码

其结果是。

[]
['http://en.wikipedia.org/wiki/National_Park_Service/']
[]
['http://en.wikipedia.org/wiki/United_States_Bureau_of_Reclamation/']
[]
['en.wikipedia.org/wiki/Africa/']
['ftp://en.wikipedia.org/wiki/Central_African_Republic/']
复制代码

它是如何工作的?

  • ^ - 断定位置在字符串的开头
  • (?!https) - 负向查找 - 断言重码不匹配 - https
  • .* - 匹配0到无限次之间的任何字符

第2步:匹配不以几个模式开始的字符串

现在,让我们试着找到所有不以......开头的字符串。

  • https
  • ftp

我们可以使用| ,也就是在regex语法中 -r"^(?!https|ftp).*" 。

for text in texts:
    print(re.findall(r"^(?!https|ftp).*", text))
复制代码

结果是。

[]
['http://en.wikipedia.org/wiki/National_Park_Service/'] [
]
['http://en.wikipedia.org/wiki/United_States_Bureau_of_Reclamation/']

[
]
['en.wikipedia.org/wiki/Africa/' ]
[]

注意:你可以用| 添加许多模式。

第3步:匹配不以列表中的字符开始的字符串

最后让我们看看如何匹配所有不以几个字符开头的字符串,比如。

  • f
  • h

这次我们要列出方括号内的所有字符:[^hf] 。语句[hf] 意味着匹配字母 -f 或h ,而^ 则否定匹配。

换句话说,匹配列表中不存在的单个字符 -[hf] 。

所以我们可以使用。

for text in texts:
    print(re.findall(r"^[^hf].*", text))
复制代码

这将给我们带来。

[]
[]
[]
[]
[]
['en.wikipedia.org/wiki/Africa/']
[]

相关文章

Python 中 字符串处理的高效方法,不允许你还不知道

以下是 Python 中 字符串处理的高效方法,涵盖常用操作、性能优化技巧和实际应用场景,帮助您写出更简洁、更快速的代码:一、基础高效操作1.字符串拼接:优先用join()代替+原因:join() 预...

浅学python | 使用正则表达式对象处理字符串

分享兴趣,传播快乐,增长见闻,留下美好!亲爱的您,这里是LearningYard学苑。欢迎大家继续访问学苑内容,今天小编为大家带来有关Python的知识。Share interest, spread...

Python爬虫中正则表达式的用法,只讲如何应用,不讲原理

Python爬虫:正则的用法(非原理)。大家好,这节课给大家讲正则的实际用法,不讲原理,通俗易懂的讲如何用正则抓取内容。·导入re库,这里是需要从html这段字符串中提取出中间的那几个文字。实例一个对...

Python中使用正则表达式

正则表达式(Regular Expression,简称Regex)是一种强大的文本处理工具,它使用一种特定的模式(Pattern)来描述要搜索的文本字符串的集合。Python通过内置的re模块提供了对...

Python学不会来打我(8)字符串string类型深度解析

2025年全球开发者调查显示,90%的Python项目涉及字符串处理,而高效使用字符串可提升代码效率40%。本文系统拆解字符串核心操作,涵盖文本处理、数据清洗、模板生成等八大场景,助你掌握字符串编程精...