ASP正则提取内容里所有图片SRC路径的实现代码附示例

文章目录▼CloseOpen

为什么ASP开发里提取图片SRC非要用正则？
ASP正则提取图片SRC的具体步骤，附我自己用过的代码
本文常见问题（FAQ）

这篇文章就聚焦“ASP使用正则提取内容里所有图片SRC路径”的具体需求，帮你绕过“查语法、调代码”的麻烦：我们会拆解正则匹配图片SRC的逻辑，给出完整的实现代码，还附带上可直接复制运行的示例——从创建正则对象、编写匹配规则，到遍历结果拿到所有SRC，每一步都讲得清楚。不管你是刚接触ASP的新手，还是想快速解决问题的老开发，跟着文中的步骤走，都能轻松提取内容里的所有图片路径，帮你省出时间专注更重要的开发任务。

去年帮做本地生活服务的朋友改ASP项目，他那平台里商家上传的文章全是富文本，要把里面的图片迁到新的CDN，得把所有图片SRC提出来。他手动扒了3篇就崩溃了——有的图片标签是src="https://xxx"，有的是src='https://xxx'，还有的压根没引号，漏了好几个。我当时说“用电正则啊，我之前做企业站的时候用过，一次就能全提出来”，结果不到10分钟就搞定了，他直说“早知道找你了”。

为什么ASP开发里提取图片SRC非要用正则？

其实一开始我也没想着用正则，朋友先试了字符串分割，比如用""分割内容，再找包含"src="的片段，结果碰到src用单引号的情况就傻了——分割出来的字符串里src='https://xxx'，他的代码只认双引号，根本提不出来。后来我跟他说，富文本里的图片标签写法太灵活了，有的前端写的时候会加空格，比如src = "http://xxx"，有的会把src放img标签的比如，手动处理或者字符串分割根本覆盖不了所有情况。

正则就不一样了，它是按“模式”匹配的，不管标签怎么写，只要符合标签的结构，能找到src属性，就能把值提出来。比如我朋友那项目里，有个商家的文章里图片标签是，没有引号，字符串分割根本处理不了，但正则一下就抓住了。再说了，正则是批量处理，不管内容有多长，几百篇文章也能一次跑完，比手动省太多时间——我朋友之前手动搞3篇用了2小时，正则跑完整站500多篇只用了10分钟。

还有个更重要的点：正则能避免“漏匹配”。比如有的图片标签里src后面跟着其他属性，比如，正则能准确抓住第一个src的值，而不会把data-src的值带进来——我之前做企业站的时候，就碰到过有人把data-src当src用的情况，正则模式里加了src=的限定，直接就避开了。

ASP正则提取图片SRC的具体步骤，附我自己用过的代码

其实ASP里用正则很简单，就几步，我把当时给朋友写的步骤拆开来给你讲，你跟着做就行——亲测这个方法能覆盖99%的图片标签情况。

第一步：创建ASP里的正则对象

ASP用的是VBScript的RegExp对象，得先把这个对象建出来，还要设置两个关键属性：

IgnoreCase=True：忽略大小写，因为有的前端写SRC或者Src，得统一处理；

Global=True：全局匹配，要把所有图片都找出来，不能只找第一个。

代码长这样，直接复制就行：

Dim regEx
Set regEx = New RegExp
regEx.IgnoreCase = True ' 忽略大小写
regEx.Global = True ' 全局匹配

第二步：写能覆盖99%情况的正则模式

这一步是核心，我试了三四个模式才定下来，现在用的这个能处理几乎所有图片标签写法：

regEx.Pattern = "]src=('|""|)([^'"" >]+)1[^>]>"

别看着像天书，我用大白话拆给你看：

]：匹配开头，后面跟着任意不是>的字符（比如alt、class这些属性都在这部分）；

src=：明确找src属性，避免匹配到data-src或者srcset；

('|""|)：匹配单引号、双引号或者没有引号（最后那个|后面是空），因为有的标签不用引号；

([^'"" >]+)：真正要找的图片路径——意思是“不是单引号、双引号、空格或者>的字符”，直到碰到这些字符为止；

1：反向引用前面的引号（比如前面用了双引号，后面也得用双引号），避免匹配到src="https://xxx'这种混着用的情况；

[^>]：跳过img标签里剩下的内容，直到>结束。

这么写的好处是，不管图片标签里有多少花里胡哨的属性，不管src用什么引号，甚至没有引号，都能准确抓住路径——我朋友那项目里的图片标签比这还乱，都没难住它。

第三步：执行匹配，拿到所有SRC

创建好对象、写好模式，接下来就是执行匹配了。用RegExp的Execute方法，把要处理的富文本内容传进去，会返回一个MatchCollection集合，里面是所有匹配到的结果。遍历这个集合，就能拿到每个图片的SRC。

给你看我自己用过的完整代码，直接复制就能运行：

<%
Dim content, regEx, matches, match, srcList
' 模拟要处理的富文本内容（可以替换成你项目里的真实内容）
content = "
这是一篇测试文章"
' 创建正则对象
Set regEx = New RegExp
regEx.Pattern = "]src=('|""|)([^'"" >]+)1[^>]>"
regEx.IgnoreCase = True
regEx.Global = True
' 执行匹配
Set matches = regEx.Execute(content)
srcList = "" ' 用来存所有SRC的变量
' 遍历结果，拿到每个SRC
For Each match In matches
 ' 用Trim去掉路径前后的空格，避免空路径
 If Trim(match.SubMatches(1))  "" Then
 srcList = srcList & match.SubMatches(1) & "
"
 End If
Next
' 输出结果
Response.Write "提取到的图片SRC：
" & srcList
%>

我朋友当时直接把这段代码粘到他的ASP页面里，替换了content变量（换成他项目里的富文本内容），结果不到10秒就把所有图片SRC提出来了——之前他手动搞3篇用了2小时，这差距你想想。

我自己的“避坑指南”

最后再跟你唠两句我踩过的坑，帮你少走点弯路：

一定要测试正则模式：我一般用regex101.com这个工具，把模式粘进去，再贴点要处理的内容，就能实时看匹配结果。比如我当初没加1，结果匹配到src="https://xxx'这种混着用的情况，加了1才解决；

处理空路径：有的图片标签src是空的（比如），所以遍历的时候一定要用Trim(match.SubMatches(1)) ""判断，不然会把空路径加进去；

注意VBScript的字符串拼接：ASP里字符串拼接要用&，别用+——我之前犯过错，把"http://xxx"和"http://yyy"用+拼，结果变成了"http://xxxhttp://yyy"？不对，是碰到数字的话会自动相加，比如"123"+"456"会变成579，所以一定要用&。

给你看个表格，我把常见的图片标签写法和正则匹配结果列出来了，你一眼就能明白这模式有多好用：

图片标签写法	正则匹配到的SRC路径
	http://old-cdn.com/1.jpg
	http://old-cdn.com/2.png
	http://old-cdn.com/3.gif
	http://old-cdn.com/4.jpeg

如果你按这些步骤试了，不管是成功了还是碰到问题，都欢迎留言告诉我——毕竟我当初也是踩了好几次坑才摸清楚这些门道的，能帮到你省点时间，我也开心～

本文常见问题（FAQ）

正则真的能处理所有图片标签的写法吗？

当然能，我朋友之前碰到过各种乱写法——有的src用双引号，有的用单引号，还有的压根没引号，字符串分割根本处理不了，但正则是按“模式”匹配的，不管标签怎么写，只要符合 ASP正则提取内容里所有图片SRC路径的实现代码附示例十九结构能找到src，就能提出来。比如他那项目里有个标签是 ASP正则提取内容里所有图片SRC路径的实现代码附示例 20 ，没有引号，正则一下就抓住了，比手动省太多时间。

ASP里创建正则对象得注意啥？

主要是两个属性：IgnoreCase和Global。IgnoreCase设成True，因为有的前端写SRC或者Src，得忽略大小写；Global设成True，要全局匹配所有图片，不然只能找第一个。我之前忘了设Global，结果只提了第一个图片，后来加上才搞定所有的。

正则模式里的1是干啥用的？

这是反向引用，就是管引号一致的。比如前面src用双引号，后面也得用双引号，要是混着用比如src=”http://xxx’，1就能避开这种情况。我当初没加1的时候，匹配到好多混引号的路径，加了之后就正常了。

提取的时候怎么避免空路径啊？

有的图片标签src是空的，比如 ASP正则提取内容里所有图片SRC路径的实现代码附示例七，所以遍历的时候得判断一下——用Trim(match.SubMatches(1)) “”，要是不空再加进去。我朋友一开始没加这个，结果提了好多空路径，后来加上就解决了。

ASP里字符串拼接为啥要用&不用+？

因为+会搞混字符串和数字，比如”123″+”456″用+会变成579（数字相加），但用&就是”123456″（字符串拼接）。我之前犯过这错，把两个路径用+拼，结果变成数字相加了，后来换成&才对。

原文链接：https://www.mayiym.com/51677.html，转载请注明出处。