w3h5

利用正则批量清理Teleport Ultra/Pro冗余代码

Teleport 是一款非常优秀的网站离线浏览工具(即网站整站下载工具),但该软件下载的网页文件里会包含大量冗余代码(如:tppabs),手动去修改工作量很大。

下面介绍如何通过软件进行正则表达式批量替换冗余代码。

清除 tppabs 标签:

html文件中:

查找: \btppabs="h[^"]*"

替换:(空)

注意:\btppabs="h[^"]*" 前面有一个空格。

CSS文件中的图片链接(以gif图片为例):

查找: tpa=http://[^\s]*.gif

替换:(空)

注意:tpa=http://[^\s]*.gif 前面也有一个空格。

CSS文件中的注释:

查找:/\*tpa.*?\*/

替换:(空)

修复confirm链接:

查找:href=" *javascript:if\(confirm\('(htt[^"\s]*).*?"

替换:href="$1"

冗余代码示例:

href="javascript:if(confirm('http://www.xxxxx.com/ \n\n 该文件无法用 Teleport Ultra 下载,因为 不可用,或放弃了下载,或项目即将停止。 \n\n你想在服务器上打开它?'))window.location='http://www.xxxx.com/'"

示例替换后结果:href=http://www.xxxx.com/

常用的软件有 Notepad ++ ,快捷键:Ctrl+H

勾选 左下角 查找模式下的 正则表达式,即可使用正则替换。

利用正则批量清理Teleport Ultra/Pro冗余代码 经验总结 第1张

也可以使用 WebStrom 等软件,快捷键:Ctrl+R

需要勾选 Regex 选项。

利用正则批量清理Teleport Ultra/Pro冗余代码 经验总结 第2张

赞 (0)
分享到: +More |

评论 沙发

换个身份