要使用Python实现通过正则表达式从给定的HTML img
标签中提取图片目录,您可以编写以下代码:
import re
html_img_tag = '<img alt="" src="images/tb/批量文本生图工具.png" />'
pattern = r'src="(.*?)"' # 正则表达式匹配src属性值
match = re.search(pattern, html_img_tag)
if match:
image_path = match.group(1) # 获取匹配到的src属性值
image_directory = '/'.join(image_path.split('/')[:-1]) # 提取目录部分
print("图片目录:", image_directory)
else:
print("未找到图片src属性")
这段代码首先导入Python的正则表达式模块re
,然后定义了要匹配的HTML img
标签内容。接下来,我们定义了一个正则表达式模式,它会查找以 src="
开始,以 "
结束的字符串,并捕获其中的内容(即图片路径)。使用 re.search()
函数在给定的HTML标签中搜索该模式。
如果找到了匹配项,match.group(1)
将返回捕获的图片路径。接着,我们使用 split('/')[:-1]
将路径分割成目录和文件名,取除最后一个元素(即文件名),然后使用 '/'.join()
将剩余的目录部分重新组合成完整的目录字符串。最后,打印出提取到的图片目录。
若未找到匹配的 src
属性,则输出提示信息。运行上述代码,您将得到图片所在的目录:“images/tb”。
当前文章价值6.93元,扫一扫支付后添加微信提供帮助!(如不能解决您的问题,可以申请退款)
评论已关闭!