Board logo

标题: 【完成】epub文档添加字符(80元) [打印本页]

作者: lxh623    时间: 2024-11-3 20:03     标题: 【完成】epub文档添加字符(80元)

本帖最后由 lxh623 于 2024-11-4 18:14 编辑

当前文件夹下有许多文件夹,这些文件夹下\OEBPS\Text里面有多个xhtml。
正文:
<p><span class="text_1">..............</span></p>
如果行首算起大于624个字符,段落后</span></p>改为★</span></p>

谢谢!
作者: flashercs    时间: 2024-11-3 21:03

本帖最后由 flashercs 于 2024-11-4 21:58 编辑
  1. <#*,:
  2. @echo off
  3. cd /d "%~dp0"
  4. set "batchfile=%~f0"
  5. Powershell -ExecutionPolicy Bypass -C "Set-Location -LiteralPath ([Environment]::CurrentDirectory);. ([ScriptBlock]::Create([IO.File]::ReadAllText($env:batchfile,[Text.Encoding]::GetEncoding(0) )) )"
  6. pause
  7. exit /b
  8. #>
  9. # <p><span class="text_1">..............</span></p>如果行首算起大于624个字符,段落后</span></p>改为★</span></p>
  10. $re = [regex]'(?s)(<p(?>[^>]*)>)(.*?)(</p>)'
  11. $evaluator = [System.Text.RegularExpressions.MatchEvaluator] {
  12.   param([System.Text.RegularExpressions.Match]$m)
  13.   if (($m.Groups[2].Value -replace '<[^>]*>').Length -gt 600) {
  14.     # 除了代码,纯粹汉字和标点符号是超过600个。
  15.     $m.Groups[1].Value + $m.Groups[2].Value + '★' + $m.Groups[3].Value
  16.   } else {
  17.     $m.Value
  18.   }
  19. }
  20. Get-ChildItem -Path '.\*\OEBPS\Text\*.xhtml' | Where-Object { $_ -is [IO.FileInfo] } | ForEach-Object {
  21.   $_ | Resolve-Path -Relative
  22.   $text = [IO.File]::ReadAllText($_.FullName)
  23.   $text = $re.Replace($text, $evaluator)
  24.   [IO.File]::WriteAllText($_.FullName, $text)
  25. }
复制代码

作者: lxh623    时间: 2024-11-4 18:14

谢谢!请查收。
作者: lxh623    时间: 2024-11-4 20:00

本帖最后由 lxh623 于 2024-11-4 20:35 编辑

回复 2# flashercs
有一个小问题,能不能帮我再修改,谢谢!
除了代码,纯粹汉字和标点符号是超过600个。
段落中间有代码的话,也希望一样处理。比如,
  1. 一切相智樂苦,</span><span class='corr'><span class="text_1">若</span></span><span class="text_1">行四
复制代码

作者: flashercs    时间: 2024-11-4 21:59

回复 4# lxh623


    上面修改了.




欢迎光临 批处理之家 (http://bbs.bathome.net/) Powered by Discuz! 7.2