[新手上路]批处理新手入门导读[视频教程]批处理基础视频教程[视频教程]VBS基础视频教程[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动[批处理精品]CMD命令50条不能说的秘密[在线下载]第三方命令行工具[在线帮助]VBScript / JScript 在线参考
返回列表 发帖

[技术讨论] [分享]Powershell提取html网页标题,过滤后重命名html文件名

本帖最后由 wxyz0001 于 2021-4-26 17:33 编辑

▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
原文件名:
573.html
688.html
741.html

html源文件里的标题<title>行:
<title>两幅油画的故事 - 读者文摘杂志(dzwzzz.com)</title>
<title>马克·扎克伯格的“脸谱” - 读者文摘杂志(dzwzzz.com)</title>
<title>戏比天大情比海深 - 读者文摘杂志(dzwzzz.com)</title>
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
代码如下:
  1. $thePath="E:\news"  #获取目录路径
  2. Get-ChildItem -Path $thePath -Filter "*.html"|ForEach-Object{
  3. $extension=$_.Extension #取扩展名
  4. $fileName=((get-content $_.FullName)|Select-String -Pattern "<title>" -Encoding default).Line -Replace([Regex]::Escape("<title>")),"" -Replace([Regex]::Escape(" - 读者文摘杂志(dzwzzz.com)</title>")),"" #取文件名-过滤
  5. $newName='{0}{1}' -f $fileName,$extension #过滤后的文件名+扩展名-格式化
  6. Rename-Item -Path $_.FullName -NewName $newName} #重命名文件名
复制代码
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
原文件名                  重命名后的html文件名:
----------------------------------------------------------
573.html                 两幅油画的故事.html
688.html                 马克·扎克伯格的“脸谱”.html
741.html                 戏比天大情比海深.html

bat批量重命名html文件名的代码:
http://www.bathome.net/thread-54266-1-1.html

TOP

返回列表