python实现正则表达式获取html图片目录

2024-04-28 22:51 python实现正则表达式获取html图片目录已关闭评论

要使用Python实现通过正则表达式从给定的HTML img 标签中提取图片目录,您可以编写以下代码:

import re

html_img_tag = '<img alt="" src="images/tb/批量文本生图工具.png" />'

pattern = r'src="(.*?)"'  # 正则表达式匹配src属性值

match = re.search(pattern, html_img_tag)
if match:
    image_path = match.group(1)  # 获取匹配到的src属性值
    image_directory = '/'.join(image_path.split('/')[:-1])  # 提取目录部分

    print("图片目录:", image_directory)
else:
    print("未找到图片src属性")

这段代码首先导入Python的正则表达式模块re,然后定义了要匹配的HTML img 标签内容。接下来,我们定义了一个正则表达式模式,它会查找以 src=" 开始,以 " 结束的字符串,并捕获其中的内容(即图片路径)。使用 re.search() 函数在给定的HTML标签中搜索该模式。

如果找到了匹配项,match.group(1) 将返回捕获的图片路径。接着,我们使用 split('/')[:-1] 将路径分割成目录和文件名,取除最后一个元素(即文件名),然后使用 '/'.join() 将剩余的目录部分重新组合成完整的目录字符串。最后,打印出提取到的图片目录。

若未找到匹配的 src 属性,则输出提示信息。运行上述代码,您将得到图片所在的目录:“images/tb”。

当前文章价值6.93元,扫一扫支付后添加微信提供帮助!(如不能解决您的问题,可以申请退款)

你可能感兴趣的文章

来源:每日教程每日一例,深入学习实用技术教程,关注公众号TeachCourse
转载请注明出处: https://www.teachcourse.cn/3408.html ,谢谢支持!

资源分享

分类:python 标签:, ,
浅谈GC机制 浅谈GC机制
关于universal-image-loader如何防止Bitmap OOM的说明 关于universal-image-loader如何
Handler方法解析 Handler方法解析
Android学习笔记六:Java基础知识 Android学习笔记六:Java基础知

评论已关闭!