txtformat中文版是一款功能超多的文本处理软件,它集合了文本批量更改,文本编码格式转换(方便用来更改EPUB转换出来的txt文本的编码格式更改),文本文件合并,文本章节统计等等功能,另外txtformat2.10比2.09版本的功能多了一个一键审核功能(也就是上面的图4),对文本校对非常有帮助
txtformat软件特点:
1、它带有乱码转换,十二种格式转换,比如txt转jar、epub转txt、pdb转txt等,而且还带有繁体简体转换功能,乱码功能是自动查找并修复的,所以使用其他也很容易,当然此软件的核心功能还是各种文本格式之间的转换功能。
2、txtFormat最新版可以对文本进行合并分割及广告删除,是小说类文本处理的利器,支持各种文本编码,支持批处理功能,还可以整理文本里的每个标题
txtformat软件功能:
1、文件分割
2、文件合并
3、自动排版
4、HTML 代码删除
5、格式整理
6、正则表达式搜索替换
7、目录合并
8、文本搜索替换
9、乱码修改
10、通配符搜索替换
11、广告删除
12、文件更名
13、块搜索替换
14、一键审核
15、文本统计
使用说明:
一.利用分组功能进行章节名规范化
-------------------------------
txtFormat 支持正则表达式的分组,在正则表达式中,可以用小括号来指定组。一对小括号括起来的内容,就是一个组。
使用小括号指定一个子表达式后,匹配这个子表达式的文本(也就是此分组捕获的内容)可以在表达式或其它程序中作进一步的处理。默认情况下,每个分组会自动拥有一个组号,规则是:从左向右,以分组的左括号为标志,第一个出现的分组的组号为1,第二个为2,以此类推。
在 txtFormat 中,若要引用一个组,在一个 $ 符号后面加上想要引用组的组号。
例1
---
正则表达式 (【)([一二三四五六七八九十].{0,6})、(.*?)(】)用于捕获象下面这样的内容:
【一、aaa】
【二、bbb】
【三、ccc】
在该表达式中,一共有四个分组。假定我们想把以上内容规范化为形如以下的内容:
第一章 aaa
第二章 bbb
第三章 ccc
则可以采用替换的方法:
查找
(【)([一二三四五六七八九十].{0,6})、(.*?)(】)
并将查找的结果替换为:
第$2章 $3
在上述替换中,引用了第二个和第三个组的结果。忽略了第一个组内容(【)和第四个组的内容(】)。由于第一个组和第四个组的内容没有引用到,所以以上替换可以简化为:
查找
【([一二三四五六七八九十].{0,6})、(.*?)】
并将查找的结果替换为:
第$1章 $2
二. 广告的查找和删除
--------------------
方法1 - 自动:
-------------
首先打开一个要想删除广告的小说,然后从“常用正则表达式”下拉列表中选择“查找广告及其它问题……”。此时,用于匹配广告的正则表达式显示在窗口右上方的文本框中。如果你熟悉正则表达式,可以在这里按你的需要修改此正则表达式。
然后,单击工具条上的“广告检查或字符串计数”按钮。
注意,当你点击工具条上的“广告检查或字符串计数”按钮时:
1 如果你复选了“使用正则表达式进行查找/替换”复选框,并且窗口右上方的文本框中的内容是一个合法的正则表达式,txtFormat 将在你打开的文档中查找匹配的串并将这些串写入一个名为 remove.txt 的文本文件中,并用系统的记事本程序打开 remove.txt 供你检查修改。
2 如果你没有复选“使用正则表达式进行查找/替换”复选框,那么 txtFormat 将认为你要查找的是一个一般的简单字符串。则 txtFormat 将只查找并计数你要查找的字符串在文档中出现的次数。
3 如果在窗口右上方的查找和替换文本框中都没有内容,而你又点击了工具条上的“广告检查或字符串计数”按钮。txtFormat 将认为你是要查找文档中的广告内容,它将使用默认的广告匹配正则表来进行广告查找。
广告查找视你的文档的大小及广告内容的多少,可能会花一些时间。当找到的广告文本在记事本程序中打开后,请逐行仔细检查 remove.txt 文档中的广告内容。并把不是广告的内容删除,在检查时要特别小心每一行的开始和结尾处,有没有非广告的字符,如果有,则把这些非广告的字符删。
当你确信 remove.txt 文档中的内容全部都是广告内容后,保存并关闭它。然后,单击工具栏中的“自定义替换”按钮。txtFormat 将会把文档中的、与 remove.txt 中的内容相符的广告全部删除。
方法2 - 手动:
-------------
打开一个小说,然后从“常用正则表达式”下拉列表中选择“查找广告及其它问题……”。
此时,用于匹配广告的正则表达式显示在窗口右上方的文本框中。如果你熟悉正则表达式,可以在这里按你的需要修改此正则表达式。
然后,单击“查找*”按钮,光标将停留在第一个找到的内容上,并选定找到的内容。此时,如果你能确定找到的内容是广告,则单击“替换此处”按钮来删除此找到的内容。如果找到的内容不是广告,则单击“查找下一个”按钮来查找下一个广告内容且不删除当前找到的内容。
重复上述步骤,直到到到文件结束。
手动删除广告中的技巧
--------------------
1。
当你找到一个广告时,你可以单击“使用正则表达式进行查找/替换”复选框来清空“将字符串”文本框中的内容,然后单击“全部替换”按钮来将文档中所有的、与刚找到内容匹配的内容删除。
然后再次从“常用正则表达式”下拉列表中选择“查找广告及其它问题……”,并单击“查找下一个”继续从当前位置开始查找(注意,不是再次从头开始查找)。
2。如果你一次没能处理完整个文档,那么当你下一次打开同一文本时,光标将会停留在你上次处理到的地方,你可以接着从上次处理到的地方继续处理(而不是从头处理。)
3。你可以一次查找/替换多行内容(也就是所谓的块查找/替换)
方法:
清空“将字符串”文本框中的内容。
选定文档中的多行内容(也就是你想查找的内容)。
按 ctrl C 复制选定的多行内容。
单击“查找*”或“全部替换”来查找或替换你所选定的多行内容。
三. 其它杂项技巧
----------------
很多小说中包含类似以下的信息:
16K小说网 更新时间:2010-3-4 13:02:57 本章字数:4143
因此在处理时,先选择"查找 更新时间…本章字数"然后“全部替换”
这样可以在以后的处理中排除这一部分的干扰。
否则这一部分内容也会进入到 remove.txt 中,会占相当大的内容。
另外有些网站的小说会直接在章节名后面加上 " 字数:????"。在此情况下,你应该从正则表达式列表中选择"查找 字数:xxxx",然后单击“全部替换*”来清除这些字数信息。
另外,有时候,在一篇小说中,会有少部分的章节是硬回车断行的。遇到这种情况,我建议:选定该章节,然后从右键菜单中选择“对选定内容进行格式”。这样就不用对整篇文章进行格式整理了(因为有时候这样做太费时间了)
★★★
当文档太大,而你不愿意花太多时间进行格式整理时,以下持巧也许会对你有帮助:
1 用正则表达式来删除空白行。
2 用正则表达式来在章节名所在行的前后各加一个空行
3 选定整个文档,用 tab 和 shift tab 来调整缩行(受选项设置中的“行首缩进”中设置的影响,说明如下)。
四. 选项设置中的“行首缩进”设置对文档操作和格式整理结果的影响
--------------------------------------------------------------
“选项设置”中的“行首缩进”选择不但直接决定文档最终的缩行。而且也会对用 tab 键和 shift tab 键来调节选定内容缩行的效果发生影响。
在用 shift tab 键来减少缩行时,txtFormat 无论你设置的是 tab 键还是半角空格或是全角空格。txtFormat 都会减小一个单位的缩行(也就是说,如果你选择的是 tab 键缩行,按一次 shift tab 时,txtFormat 会减少一个 tab 位的缩行。如果你选择的是半角空格缩行,按一次 shift tab 时,txtFormat 会减少一个半角空格的缩行。同样,如果你选择的是全角空格缩行,按一次 shift tab 时,txtFormat 会减少一个全角空格的缩行。)
而在用 tab 键来增加缩行时,如果你选择的是 tab 键缩行,则按一次 tab ,txtFormat 会增加一个 tab 位的缩行。余类推。
五. 格式整理都做了什么?
------------------------
txtFormat 最强大的功能之一就是“格式整理”,那么在格式整理时,txtFormat 都做了些什么呢?
在进行“格式整理”时,txtFormat 将做以下工作:
1. 除去每一行行尾的空格(包括半角,全角及制表符)。
2. 如果标记了“以句号为段落标记重新分段”,则遇句号就提行。
3. 根据用户的设置,转换标点符号为用户所需要的格式(如半角转全角,全角转半角等)。这里面有以下几种情况不转换:
a 数字间的小数点不转换
b 英文字符间的标点符号不转换
c 以下符号/-*|\c1=^@,#&[]<>及空格也不转换
http 后面的 : 不转换,数字和字母后面的 ; 不转换,数字和字母前后的 .?% 不转换。
4. 根据用户的设置,除去非标题行中的空格。
5. 如果行尾不是正常的行终止符,而且行的长度大于用户设定的长度,则将此行续写于前一行尾部(文档中硬回车的处理)。
6. 将文档中的 unicode 码转换成中文。
什么是“文档中的 unicode 码”?
在有此文档中,有形如 #29234; #21843; #34886; #40637; 或 爲 啓 衆 麽 这样的内容(前面的 & 与 # 可能是全角的)。
这些内容究竟是什么?你可以在 google 中搜索 爲 或 啓 就会明白。它们是字符,只不过表示的方法不同。我自己私下把它们称为“文档中的 unicode 码”。我相信一般人遇到这样的内容就只能靠猜测来确定它们所代码的内容。而 txtFormat 在进行格式整理时,会把这些内容自动转达换成相对应的中文字符。此功能相当于常用正则表达式列表中的“查找 Unicode 码”正则表达式的作用。
7. 除去文档中可识别的广告文本。
8. 根据用户的设置,设定文档的排版样式。
9. 类似于“少*妇”、“成*人”这样简单的屏蔽码的还原。
10. 类似于“sè”、“xìng”这样的汉语拼音的还原。
11. 常见的标点符号的规范化。
六. 常用正则表达式
------------------
目前 txtFormat 提供了 30 个在文档整理时常用正则表达式,以下顺序说明它们的用途及用法。
在对常用正则表达式进行说明前,我先说一下正则表达式的一些特殊语法:
a.可有可无的匹配:
()?
? 匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 。? 等价于 {0,1}。
b.排除单个字符,可以用[^abc],这样就可以排除a或者b或者c了
c.排除一个字符串,比如排除 baidu
((?!baidu)\w)+
这里使用了顺序否定环视:(?!Expression),它表示所在位置右侧不能匹配 Expression
其它几种环视为:
(?<=Expression) 逆序肯定环视,表示所在位置左侧能够匹配Expression
(?<!Expression) 逆序否定环视,表示所在位置左侧不能匹配Expression
(?=Expression) 顺序肯定环视,表示所在位置右侧能够匹配Expression
(?!Expression) 顺序否定环视,表示所在位置右侧不能匹配Expression
d.多行匹配
[\S\s]*?
如果要匹配括号括起来的多行内容:
[\((][\s\S]*?[\))]
e.重复
{n,m} 表示重复前面的内容 n 到 m 次。
实例:匹配以ps开头的行
基本式:ps.*?$
增强式1:(?<!g)ps.*?$ 增强:不能以 g 开头,以防止错误地把 gps 开头的串也找出来
增强式2:(?<!g)ps(?!p).*?$ 增强:ps后面不能跟随 p,以防止错误地把 psp 开头的串也找出来
增强式3:(?<![gGqGg])[PpрPp][SsSs](?![PpPp]).*?$ 同时匹配大小写不同,半角全角不同的ps
以下按顺序对常用正则表达式列表中的正则表达式进行说明:
1.查找 广告及其它问题……
这个正则表达式是由多个独立的正则表达式组成的,下面分别说明:
查找 unicode 码(前面有该正则表达式的说明)
(([&&])?[##][0-9]\d*[;;]|[&&](amp)?[;;][##][0-9]\d*[;;])
查找常见屏蔽码
(风言\*+|十有\*+|(兜|绕|绕起了|绕起|转着)\*+|盏\*+|\*+(通明|辉煌)|万家\*+)
查找数字间的句号
[0-90-9]\d*[。.][0-90-9]\d*
查找奇书网
奇.{0,2}([书書]|[sSsS][HhhH][UuuU]).{0,2}[網网](.{0,2}收.{0,2}集.{0,2}整.{0,2}理|.{0,2}整.{0,2}理.{0,2}提.{0,2}供)?
查找你下载的文件
[您你].{0,2}下.{0,2}[载載].{0,2}的.{0,2}文.{0,2}件.*?$
查找我看书斋\e书天空手打
我.{0,2}看.{0,2}[书書].{0,2}斋|e书天空手打
查找 手打
(手机电子书中心|wap.bookwap.net|booknet|手机风月网|灯火|七星阁|请支持|风语|沸腾文学会员|沸腾|沸teng|飞库小说|飞库网站|www.101.du|fei-腾|fei腾-|fei腾|feitengwenxue|fei-teng文学|fei-teng|feiteng|fei-teng-文学|fei-腾-wen-学|手.{0,2}机.{0,2}墨.{0,2}香.{0,2}书.{0,2}苑.{0,2}会.{0,2}员|墨.{0,2}香.{0,2}书.{0,2}苑.{0,2}会.{0,2}员|墨.{0,2}香.{0,2}书.{0,2}苑|飞库|提供本章节最新|feiku|会.{0,2}员.{0,2}|94书|www.94shu.com)?(?<![只轻举垂旗棋凶几停拍负信甩老抬球抖下助大魔空单枪白骑箭选交旗徒起一对着打右左随动副伸身出用摆挥双的入杀联失拱顺收高扬摇亲])手([\x20-\x7e]+)?打(更新|来源灯火书城|网\,提供最新文字版小说阅读|小说bbs\.feiku\.com|小说http://飞库论坛|小说http://|小说网\,提供最新手_打_版小说阅读|,转载请说明|转载请说明)?(整理)?
查找不得转载
(本书)?17k((专属|签约)作品[,\,]非[常法]转载请注明)?(首发,敬请订阅正版)?(文学网首发)?(首发,未经授权请勿转载)?
查找书城
(一.{0,2}剑.{0,2})?(一手原创)?(手打)?[书書].{0,2}城(.{0,2}独.{0,2}家.{0,2}首.{0,2}发)?(.{0,2}会.{0,2}员.{0,2}手.{0,2}打)?(.{0,2}手.{0,2}打)?(首发)?(一手手打,转载请说明)?(3g.16k.cn希望你加入支持手打组)?(3g.16k希望你加入支持手打组)?(,手机访问手打最快!)?(,手机访问booknet手打最快!)?(,手机访问http://booknet手打最快!)?(,手机访问wap.bookwap.net手打最快!)?
查找 中文网
(一.{0,2}路.{0,2}看.{0,2})?(千.{0,2}载.{0,2})?(天天)?(传盛)?中.{0,2}文.{0,2}[網网](.{0,2}小.{0,2}说.{0,2}齐.{0,2}全)?(.{0,2}首.{0,2}发)?(16k)?(16k.cn)?( \(看手打章节请到.Se\))?( \[\.Se提供最新最快的手打章节\])?(\.101123\.Se)?(\[\.Se\]首发文字版)?
淘太郎(第一时间)?(国庆特别)?(奉献)?(更新)?(发布)?(首发)?(外篇)?(,wap手机书站第一)?(,wap书站速度第一)?(领先所有站点手打发布)?(上传国庆特别上传更新)?(独家更新)?(领先发布)?(领先更新)?(领先首发)?(上传国庆特别上传更新)?(手打发布)?(手打更新)?(wap书站首发)?(第一时间更新)?(上传更新wap书站速度第一)?(上传更新)?(上传)?
查找未完待续(前面可能有括号)
([\((])?未.{0,2}完.{0,2}待.{0,2}续.*?$
查找括号中的内容
[\(\[\{\<〈﹛〔([≤<〖](?![0-9一二三四五六七八九十她他上中下]).*?[〗>≥])〕﹜〉\>\}\]\)]+
查找空的括号
[\(\[\{\<〈﹛〔(【[≤<〖][〗>≥]】)〕﹜〉\>\}\]\)]+
查找作者的话
^.*?新[书書].{0,40}收藏.*?$
^.*?收藏.{0,40}支持.*?$
^.*?更新时间.{1,60}本章字数.+$
^.*?第.{1,2}[章更]到.*?$
^.*?(冲榜|月票|[书書]评|[书書]友).*?$
^.*?(推荐.{0,20}收藏|收藏.{0,20}推荐).*?$
^.*?求(收藏|推荐票).*?$
^.*?(谢谢.{0,20}打赏|打赏.{0,20}谢谢).*?$
^.*?欢迎.{0,20}[阅閱][读讀].*?$
^.*?感谢.{0,20}[书書]友.*?$
^.*?还.{0,1}有一[更章].*?$
^.*?[^\((\{]第[一二三四五六七八九十0-90-9]{1,2}更.*?$
^.*?[推荐|砸|红|黑|月]票.*?$
^.*?([收藏|推荐]本[书書]).*?$
查找以ps开头的行
(?<![gGqGg])[PpрPp][SsSs](?![PpPp]).*?$
查找点击察看图片链接
点击察看图片链接.*?$
查找常用广告,这个是广告查找的核心。
(?![#\*/·、\. :-a-zA-Z0-90-9A-Za-z]{20,}|.{0,3}[?。!]|[\) \? \]VIP章节目录 )#`\-~.、:,!品支问腾入步群火直知名推版喜提留种起关供加看后本光明大去事>八吧板不布超城出打到道得的地第点定读多发凡飞格好户幻机家间剑接节进经精就居开来乐理了六陆录路们目你您齐奇轻趣圈然让如三上时式是受书数说速同完网微为文纹屋武下校新星行续学迅意影由友于语月越云载在站章者正址制中注转子字自作])([」}』Jj《》0-9a-zA-ZńЁⅹ⌒☉ξ{{} 。\(\)★…η[⑸⒌⒉⒛②③╰-′’()≮︴「∥≦≧=^^@w+$#`,㈦⑦_,∫~\[\]<>…<>℃|^、|\\ㄧ:⑴⑹.①⑥!+.·∴∵∞≈÷#@&*※§〃№〓○●△▲◎☆★◇◆□■▽▼㊣℅ˉ ̄_﹉﹊﹍﹎﹋﹌﹟﹠﹡♀♂⊕⊙↑↓←→↖↗↙↘∥∣/\∕﹨▋áǎàōóǒòēéěèīíǐìūúǔùǖǘǚǜüêɑńňɡ160A-Za-zfFΑΒΕΖΗΙΚΜΝΟΡΤΧαικνοπρστυχωАВЕИКМНОРСТУХЬабвекмнорстухъьё. -/:‘ ̄$?\?;~.|『〗あいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわを♂♀┅╔╗╚╝原名录业进明世机阿爱八巴吧扳坂板版榜保本编不布步部藏超城持出创翠达打大待到道得的灯登地第点點电顶定读渎牍讀独镀多恶发凡访飞非沸费风负阁格更供关光好何后戶户华欢幻火或机機及纪加家间建剑荐接节盡尽进经精敬九久就居卷爵均开看库快来乐理连了临麟灵零留六陆录陸路论们擝萌盟迷免名明墨目脑你涅您爬排盘泡品七期齐奇麒起千轻清请請去趣圈全诠荃铨群然让热任如入三闪上十时拾世式事是适收手首受书書熟数爽说說松速锁坛腾提同推完万网網忘望微为未文纹蚊问汶屋吾武勿希喜下享霄小校谢新星行续轩玄学學迅雅业一议意迎影用优幽悠滺憂優由友于语域欲原月阅粤越閱云载載在摘站章者整正支知直址制中种猪注专转轉子吇字自最作]{10,})(?<![!?]|[…\(,:(。xX 、武机品推种作火欲名飞多期光坛欢字去你影小久最入八或《本不出待到道得的地第电定独格关好何后华家间接经就卷开看来了六路目脑您排然如上十时事数松速提同完万为屋下享星行意幽悠由友于语月越云在章整正支直制中子自剑九千三城闪手让点微精轻翠注们就是一大的建第部正玄更出来受不知灵正十论起])(?<!完全|数千)
查找 首发
(本书)?(booknet)?(小说520)?(本书)?(文字版)?(=)?(\^)?(\^)?(([㈦七⑦7].{0,2}星.{0,2}阁.{0,2}))?首([\x20-\x7e]+)?[发發](小说)?(520)?(=)?(\^)?(\^)?|(\()?[㈦七⑦7].{0,2}星.{0,2}阁(.{0,2}手打)?(.{0,2}手机站:)?(,请支持正版)?(.com,请支持正版阅读)?(.com)?(。)?(17k文学网)?(www.17k.com,请支持正版阅读)?(www.17k.com)?(www.ngzw.com)?(文学网)?(一起看文学网)?(于起点中文网http://cmfu.com/)?
查找文学网
(孔子)?(一起看)?(16k)?(吾爱)?文.{0,2}[學学].{0,2}[網网]
查找杂项
您的轻轻一次点击(,温暖我整个码字人生,)?(本书军史频道首发,请勿转载)?(本书军史频道首发,请支持正版)?(本书首发,请勿转载,支持正版)?(本书一起看军史频道首发,请勿转载)?(本书一起看文学网首发,请支持正版)?(本书军史频道首发)?(本书一起看军事频道首发)?(本书首发)?(本书一起看军史频道首发)?(本书军事频道首发)?(。)?
查找手打快
手.{0,1}打.{0,1}快
查找手机书苑
手.{0,1}机.{0,1}书.{0,1}苑
查找电脑站
电.{0,2}脑.{0,2}[站网]
查找本书转载
本.{0,2}[书書].{0,2}[转轉].{0,2}[载載].{0,}中.{0,2}文.{0,2}[網网]
查找手机站
手.{0,2}[机機].{0,2}站(zuilu)?(wap\.)?
查找全文字
全.{0,2}文.{0,2}字(小说阅读,尽在)?(小說閱讀)?
查找大家读书院
大.{0,2}家.{0,2}[读讀].{0,2}[书書].{0,2}院
查找泡书吧
泡.{0,2}[书書].{0,2}吧(小.{0,2}[说說].{0,2}[網网]|[独獨].{0,2}家.{0,2}首.{0,2}[發发].{0,2}文.{0,2}字)?|(中文)?[\.。.]se(首[發发])?|(首.{0,4}[發发].{0,4})?君.{0,4}子.{0,4}堂(.{0,4}首.{0,2}[發发])?
查找八路中文
八路中文(联盟)?(会员)?(手打)?(上传)?
查找麒麟文学
麒麟(小说|文学|70xs.com首发|.com首发|www…com|www.)
查找幻剑书盟
(本书为)?幻.{0,2}剑.{0,2}书.{0,2}盟(首[發发],未经本站同意请勿转载!扫较|扫校)?
查找 一路看文学网
((一路看)|(一起看))((小说网)|(文学网))
禁书请删除|"|分.{0,2}割.{0,2}线|字数[::][0-9]\d*
查找独家首发
[独獨].{0,2}家.{0,2}(首.{0,2}[发發])
查找理想文学
理.{0,2}想.{0,2}文.{0,2}[學学]
查找灯火书城
(看一手小说希望你加入.{0,2})?(更新最快)?(手[机機])?(更新最快)?[灯燈].{0,2}火.{0,2}[书書].{0,2}城([獨独]家.{0,2}手.{0,2}打)?([獨独]家.{0,2}首.{0,2}[發发])?(希望你登陆)?(希望登陆)?(bookwap\.net)?(希望你加入支持)?(.{0,2}手.{0,2}打)?([独獨]家首[發发])?
城.{0,2}[书書].{0,2}火.{0,2}灯
查找飞库
飞.{0,1}库(.{0,1}手.{0,1}打)?([網网])?(feiku)?(站)?(整理)?(小说)?(论坛)?(feiku)?(wap书站速度第一)?
查找风语
(?<![言])风(语|yu)(网)?(首发)?(小说网)?(wap\.)?(手打更新!)?(手打整理!)?
查找一六开
[壹一十拾].{0,2}[六陆陸路].{0,2}[开看KkKkΚκ](.{0,2}更新快)?(,看小[说說]就来一六开)?(小说网手机阅读访问)?(文.{0,4}[學学].{0,4}[網网])?(官方)?(文学手打员手打,谢谢大家支持)?
[\|壹一十拾1①ㄧ1⑴l].{0,2}[六陆陸路6б6⑹⑥].{0,2}[开看KkKkΚκ](.{0,2}[xXXxχхХΧ×].{0,2}[SsSs])?(.{0,2}小.{0,2}说)?(.{0,2}[网站])?(整理)?(.{0,4}[cCсcCС℃].{0,4}[nNNΝnη])?(.{0,2}更.{0,2}新.{0,2}最.{0,2}快)?(16k)?(16k.cn)?(希望你加入支持)?
查找更多章节
更.{0,2}多.{0,2}章.{0,2}节|章节内容开始
查找文心阁
文.{0,4}心.{0,4}阁.{0,4}首.{0,4}[发發]
查找圏子网/圈子网
(欢迎访问)?([\.。.])?[WwWwω].{0,2}[AaAaаαà].{0,2}[PpрPp].{0,2}[圏圈].{0,2}子(.{0,2}网.{0,2}友.{0,2}收.{0,2}集)?(.{0,2}文.{0,2}学.{0,2}收.{0,2}藏)?(.{0,2}网)?(收藏)?
查找 101du
[\|1①ㄧ1⑴l].{0,2}[0O0o].{0,2}[\|1①ㄧ1⑴l].{0,2}[DdDd].{0,2}[UuUu](\.)?(。)?(net会员手打)?(手打)?
查找 由数字,字母,标点组成的行
(?<= | | |\t)([。,;:!·\#¥%※×—+,\"\'!@#$%^\&*-=‘’“”\.;:!a-zA-Zб℃āáǎàōóǒòēéěèīíǐìūúǔùǖǘǚǜü一0-90-9A-Za-zΑΒΕΖΗΙΚΛΜΝΟΡΤΧαβγδεηθικλμνοπρστυχωАБВИКЛМНОПРСТУХШЩЪЬЯабвгезиклмнопрстуфхчшщъьё]{1,})\r\n
查找电脑阅读
电.{0,4}脑.{0,4}[阅閱].{0,4}[读讀]
查找手机阅读
手.{0,2}[机機].{0,2}[阅閱].{0,2}[读讀](.{0,2}整理)?(16k)?
查找云轩阁
云.{0,4}轩.{0,4}阁
查找 小说网
(手机)?(中文)?(经典)?小.{0,4}[说說].{0,4}[吧網网]
查找电子书
(天空)?电.{0,2}子.{0,2}[书書]
查找沸腾文学
(欢迎访问)?((feiteng)|(fei.{0,2}腾)|(沸.{0,2}teng)|(沸.{0,2}腾))((.{0,2}文.{0,2}[學学])((收.{0,2}藏))?|(收.{0,2}藏)|(.{0,2}会.{0,2}员.{0,2}手.{0,2}打)|(.{0,2}手打))(.{0,2}手.{0,2}打.{0,2}团.{0,2}倾.{0,2}情.{0,2}奉.{0,2}献)?(.{0,2}会.{0,2}员.{0,2}手.{0,2}打)?(.{0,2}收.{0,2}藏)?(.{0,2}101du.net收藏)?
查找(欢迎访问)?沸.{0,2}腾.{0,2}文.{0,2}学(.{0,2}手.{0,2}打.{0,2}团.{0,2}倾.{0,2}情.{0,2}奉.{0,2}献)?(.{0,2}会.{0,2}员.{0,2}手.{0,2}打)?(.{0,2}收.{0,2}藏)?(.{0,2}101du.net收藏)?
查找 .bbs
([\.。.])?[ΒBbBb].{0,2}[ΒBbBb].{0,2}[SsSs]
本[书書].{1,9}[學学][網网]
查找看书就来
([\((])?看.{0,2}[书書].{0,2}就.{0,2}来
本站(web网站)?开通(umd,jar格式下载)?(umd,jar手机电子书下载)?(umd,jar小说下载)?(umd,jar格式小说下载)?
查找 手打
(?<![只轻举垂旗棋凶几停拍负信甩老抬球抖下助大魔空单枪白骑箭选交旗徒起一对着打右左随动副伸身出用摆挥双的入杀联失拱顺收高扬摇亲])手打
查找支持正版
[支持|订阅|购买]正版.+$
查找友情推苊
友情推荐|下一章|存稿|你还在看二手书吗|投票|最新章节
查找更新
(手机)?更新
查找恶灵中文
恶.{0,2}灵.{0,2}中.{0,2}文
查找$#@
[$@#].{1,3}[$@#](提供)?
查找醉露书院
zuilu(书院)?|醉露书院|zui\*露书院|ZuiLU.Net
查找起点
(?<![这候白的想生一行个地溅仙便泛发能了为知立,])起点(中文)?(网)?(首发)?(.{0,2}授.{0,2}权.{0,2}[發发].{0,2}布)?
查找不规则组合的标点符号
[.\.。,\,、·]{2,}|…+[.\.\,、·]+|[.\.。,\,、]+…+[.\.\,、·]+
查找百度吧
百度.{2,7}吧.{0,7}(手打团手打)?(首.{0,2}[發发])?(手打)?
查找墨香书苑
(手.{0,2}[机機].{0,2})?(访.{0,2}问.{0,2})?墨.{0,7}香.{0,2}书.{0,2}苑(.{0,2}会.{0,2}员)?(.{0,2}手.{0,2}打)?(搜集)?(整理)?
查找华夏中文
(巍.{0,2}峨.{0,2}[华華].{0,2}夏|[华華].{0,2}夏[(.{0,2}会.{0,2}员.{0,2}收.{0,2}集.{0,2}上.{0,2}传)?(.{0,2}会.{0,2}员.{0,2}手.{0,2}打)?(.{0,2}会.{0,2}员.{0,2}打)?(.{0,2}小.{0,2}说.{0,2}网.{0,2}收.{0,2}藏)?(.{0,2}小.{0,2}说.{0,2}网)?(.{0,2}小.{0,2}说)?(.{0,2}中.{0,2}文.{0,2}网.{0,2}玄.{0,2}幻.{0,2}武.{0,2}侠huaxiazw\.com)?(.{0,2}中.{0,2}文.{0,2}网.{0,2}友.{0,2}收.{0,2}藏)?(.{0,2}中.{0,2}文.{0,2}网.{0,2}友.{0,2}录)?(.{0,2}中.{0,2}文.{0,2}网.{0,2}收.{0,2}藏)?(.{0,2}中.{0,2}文.{0,2}网)?(.{0,2}中.{0,2}文.{0,2}转.{0,2}载)?(.{0,2}中.{0,2}文)?(.{0,2}转.{0,2}载)?(.{0,2}网)?]+)
查找3G华夏网
[33][gGqGg](华.{0,2}夏.{0,2}[網网])?
查找无敌龙
无.{0,2}敌.{0,2}龙(.{0,2}书.{0,2}屋)?(.{0,2}手.{0,2}打)?(.{0,2}整.{0,2}理)?
查找灯火书城
查找(看一手小说希望你加入.{0,2})?(更新最快)?(手[机機])?灯.{0,2}火.{0,2}书.{0,2}城(bookwap\.net)?(希望你加入支持)?(.{0,2}手.{0,2}打)?([独獨]家首[發发])?
查找城.{0,2}书.{0,2}火.{0,2}灯
查找风语
风.{0,2}语.{0,2}(手.{0,2}打.{0,2})?(电脑)?小.{0,2}说(.{0,2}网)?
查找手打小说(网)
手.{0,2}打.{0,2}小.{0,2}说(.{0,2}网)?
查找白马书院
白.{0,2}马.{0,2}书.{0,2}院
查找移动书城
移.{0,2}动.{0,2}书.{0,2}城
查找云霄阁
云.{0,2}霄.{0,2}阁(.{0,60}整理收藏)?
查找天下书库
天.{0,2}下.{0,2}书.{0,2}库
查找万卷书屋
万.{0,2}卷.{0,2}书.{0,2}屋
查找尽在......文学网
[盡尽].{0,2}在.{0,10}文.{0,2}[學学].{0,2}[網网]
查找更新最快
更.{0,2}新.{0,2}[超最].{0,2}快
查找小说整理发布于
小.{0,2}说.{0,2}整.{0,2}理(.{0,2}[發发].{0,2}布)?(.{0,2}于)?
查找小说手机站
小.{0,2}说.{0,2}手.{0,2}[机機].{0,2}站
查找.net
(97r)?([\.。.])?[NnNnη].{0,2}[EeEe].{0,2}[TtTt]
查找.www
([\.。.])?[WwWwω].{0,2}[WwWwω].{0,2}[WwWwω]([\.。.])?
查找.web
([\.。.])?[WwWwω].{0,2}[EeEe].{0,2}[BbBb]
查找.cn
([\.。.])?[cCсcCС℃].{0,2}[nNNΝnη]
查找.wap
([\.。.])?[WwWwω].{0,2}[AaAaаαà].{0,2}[PpрPp]([\.。.])?
查找.com
([\.。.])?[cCсcCС℃].{0,2}[OoΟ○0ОOοoоóòōǒ0].{0,2}[mMMmМΜм]
查找杂项
感谢作者授权发布|共同保护作者权益|授权发布|首页返回书目|首页返回书页|小说原创门户|进行前后翻页阅读
查找特殊字符及由其组成的串
(&1t;|<|>|&qut;)|(?<![0-90-9])%|[\\/\*\^@\|\]\[^_#$&丶#@&*※§〃№〓○●△▲◎☆★◇◆□■▽▼㊣℅ˉ ̄_﹉﹊﹍﹎﹋﹌﹟﹠﹡♀♂⊕⊙↑↓←→↖↗↙↘∥∣/\∕﹨▋]+|([-\-—#…]{5,})
查找中文间空格
查找(?<![\n0-9a-zA-Z0-9A-Za-z \t章节節回集卷文篇])[ \t]+(?![0-9a-zA-Z0-9A-Za-z \t第])
查找*号
\*{1,80}
=======================================================================
2.查找 更新时间…本章字数
=========================
.{0,60}更新时间.{1,40}本章字数.+
很多小说中包含类似以下的信息:
XX小说网 更新时间:2010-3-4 13:02:57 本章字数:4143
此正则表达式就是为了查找和删除这些内容而设置的。
3.查找 字数:xxxx
================
( )?字数[::][0-90-9.]+
有些网站的小说会直接在章节名后面加上 " 字数:????"。此正则表达式就是为了查找和删除这些内容而设置的。
4.查找 半角标点符号
===================
[(\x2b-\x2f|(\x21-\x29)|(\x3a-\x40)|(\x5b-\x60)|(\x7b-\x7e)]
5.查找 硬回车
=============
\n(?!.*第[一二两三四五六七八九十○零百千0-90-9]{1,12}(章|节|節|回|集|部|卷)).*?[^]^}^※^〕^:^:^》^】^.^。^?^?^”^"^…^!^'^’^)^)^\n^!^—^〗^\-]\r\n
这个不单是查找硬回车,同时也查找以,,、“‘等符号结束的行
6.查找 数字串
=============
[0-90-9.]\d*
这个是查找由半角全角数字组成的内容。它还有一个功能:在找到阿拉伯数字串后,会在替换栏中显示相应的中文数字。
7.查找 字母数字串
=================
([a-zA-Záǎàōóǒòēéěèīíǐìūúǔùǖǘǚǜüêɑńňɡ0-90-9A-Za-zΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρστυφχψωАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюяёあいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわを])+
8.查找 字母串
=============
([a-zA-ZáǎàōóǒòēéěèīíǐìūúǔùǖǘǚǜüêɑńňɡA-Za-zΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρστυφχψωАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюяёあいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわを])+
9.查找 网络地址
===============
[a-zA-zA-Za-zΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩαβγδεζηθικλμνξοπρστυφχψωАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюяёあいうえおかきくけこさしすせそたちつてとなにぬねのはひふへほまみむめもやゆよらりるれろわを]+://[^\s]*
10.查找 含有 ps 的行
====================
(?<![gGqGg])[PpPp][SsSs](?![PpPp]).*?$
在好多小说的章节未尾,作者会发表一些感言,说明,通知之类的与小说内容无关的内容,而这些内容有时候会以 ps 开头。
此正则表达式就是为了查找和删除这些内容而设置的。
该正则表达式在前面有详细说明。
11.查找 各种括号括起来的内容
============================
[\(\[\{\<《〈﹛〔([≤<〖].+[〗>≥])〕﹜〉》\>\}\]\)]
好多广告或作者感言甚至手打者的感言都会出现在括号中
12.查找 括号括起来的内容(包括多行)
==================================
[\((][\s\S]*?[\))]
这个是为了匹配类似于以下多行内容的:
(推荐一本新书:
《a new book of mine》!!!!!
书号12345,本书简介...... )
13.查找 【】括起来的内容
========================
【.*?】
【】是个异类,它有时会出现在章节名中,所以把它单独提出来
14.查找 章节名
==============
(?<=[ \t\n])(第)([-\-一二两三四五六七八九十○零百千0-90-9]{1,12})([章节節回集卷部].*?\r\n)
这个会找出 第一章、第1章、第1章这样的内容。如果找到的是第1章或第1章,则在替换栏中会显示出“第一章”,以方便用户进行替换。
该正则已经修改,它只会查找行首的或以空格(包括全角、半角、制表符)开始的章节名
15.查找 HTML 标识
=================
<.+?>
也就是<>及其括住的内容
16.查找 日期时间
================
((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-)) (20|21|22|23|[0-1]?\d):[0-5]?\d:[0-5]?\d
好象没什么太太意义,似乎在下一版本中应去掉?
17.查找 Unicode 码
==================
(([&&])?[##][0-9]\d*[;;])
前面有详细说明
18.查找 干扰符
==============
(?![ ]+)[\x01-\x09\x0b-\x0c0x0e-\xff]{8,}(?<![ \r\n])
如果象下面一样,文档的每一行的尾部及行间都有些乱其八糟的内容,是不是很令人崩溃?
<aaDW
罗云初哪里不知道是他心疼自己? +MZO%4
rz }lL)2WKFT
傍晚的时候,大郎他们回来了。 Xq"9TYf$
v8uUv%Hkd
罗云初给两人倒了两碗凉开水,随口问道:“大哥,情况怎么样?” qoph#\
d `?EEO
“媳妇,别急,先让大哥三弟喘口气儿嘛。” 7 oYD;li$k
)OlYz!#?
“呵呵,不要紧。我嘴笨,让三弟说吧。”大郎笑道。 D* HK[_5
zb9vUxN [
用这个正则表达式来处理它。
注:这种东西在一般的小说中还真不多见。它主要是当你想从一些网站用复制粘贴来采集文档时,采集到的内容会有这些干扰符。
19.查找 中文间的空格
====================
(?<![\n0-9a-zA-Z0-9A-Za-z \t章节節回集卷文篇])[ \t]+(?![0-9a-zA-Z0-9A-Za-z \t第])
有个书友说 txtFormat 未能找出文档中的空格并加以删除,可以没有找到是是全角空格或制表符吧。
现在用这个来处理吧。注意,它只查找中文间的半角空格、全角空格和制表符。标准格式的标题中的空格也可以识别出。
20.查找 重复的章节名
====================
(正文 )?(第[-\-一二两三四五六七八九十○零百千0-90-9]{1,12}[章节節回集卷].{0,80})\r\n.*?(\r\n.*?){0,10}([ \t]+)?\2
这个用到了分组。当你用查找或查找下一个时,如果找到在替换栏中会显示出用于替换的章节名。如果你想一次全部替换,请在替换栏中输入 $2 ,并按“全部替换”来替换整个档中的所有重复的章节名,要慎用。
21.查找 引号/括号不匹配
=======================
“[^”]*\n.*?”|‘[^’]*\n.*?’|\([^\)]*\n.*?\)|([^)]*\n.*?)
在做精校书中,这样的查找是必要的。
22.查找不规则的标点符号(新增)
[.\.。,\,、·`]{2,}|…+[.\.\,、·`]+|[.\.。,\,、`]+…+[.\.\,、·`]+
在做精校书中,这样的查找是必要的。
它不仅仅只是查找,还会给出建议的替换内容。
23.查找 包含指定字符(串)的行
===========================
.*?指定字符(串).*?$
这是个半自定义正则表达式,你不能直接使用它。它是用来供你按需修改而用的。
例如,你想查找包含“更新”的行。那么把该表达式中的“指定字符(串)”改为“更新”:
.*?更新.*?$
24.查找 从指定字符(串)到行尾的行
===============================
指定字符(串).*?$
半自定义正则表达式,功能同上
25.查找 以指定字符(串)开始的行
=============================
^指定字符(串).*?$
半自定义正则表达式,功能同上
26.查找 同时含有串1和串2的行
===========================
^.*串1.{0,30}串2.*?$
半自定义正则表达式,功能同上
27.从指定字符(串)开始到下一个空行的内容
=====================================
指定字符串[\s\S]*?^[ \t]*\r\n
半自定义正则表达式,功能同上,但更强大。用于匹配章节尾的广告。慎用。
28.将4个半角空格或两个全角空格转换成换行
======================================
“ | ”
选择后,要单击“全部替换*”,才能生效。
29.删除空白行
=============
^[ \t]*\r\n
选择后,要单击“全部替换*”,才能生效。
30.删除空白行中的空格(空行仍保留)
=================================
[ \t]+\r\n
选择后,要单击“全部替换*”,才能生效。
因为有书友告诉我,格式整理后,章节名前后的空白行中有空格字符,要我想法处理。
于是有了这个表达式。
31.章节名所在行的前后各加一个空行
===============================
(^[\s\t ]{0,20}(正文[\s\t ]{0,4})?第([-\-一二两三四五六七八九十○零百千0-90-9]{1,12})[章节節回集卷].*?$)
替换为
\r\n$1\r\n
选择后,要单击“全部替换*”,才能生效。
这个东西一般作为 28 项(删除空白行)的后续处理。
32.以句号为段落标记,强制分段
(。(?:’)?(?:”)?)
替换为
$1\r\n
选择后,要单击“全部替换*”,才能生效。
这个与格式整理中的功能有一点区别。这个问题正则表达式在查找替换时,如果找到的是。”,就从双引号后换行,如果找到的是。’,就从单引号后面分行。如果是纯粹的句号,就从句号后面分行。
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
★★★ 以上正则表达式每次更新时都可以改变,以更新后的最新版本为准 ★★★
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
七. 自定义正则表达式
--------------------
在 txtFormat.exe 所在目录,创建一个名为 custreg.txt 的文本文件,在其中写入你的自定义正则表达式,格式如下:
每一个正则表达式由三行文本组成:
第一行是表达式说明,它是程序运行后显示在“常用正则表达式”下拉列表中的内容,用于提示用户此表达式的用途。
第二行内容是正则表达式内容。
第三行是你想用来替换的内容,如果想删除找到的匹配内容,则保留该空行。
一但 txtFormat.exe 所在目录中存在着 custreg.txt 且该文件的内容又符合要求,则该文件中所定义的正则表达式将出现在“常用正则表达式”列表的下方。
这样你就可以使用这些你自定义的正则表达式了。
八. 章节检查
有书友要求增加章节检查功能。我想了一下,章节检查应该就是把章节标题、章节大小全部列出,让用户检查有没有重复、缺失的章节。这个功能在“文件分割”功能中已经有了。现在增强了一下,应该可以了。
九. 其它
1查找硬回车功能已经增强,现在在查找硬回车时不会把章节标题也找出来了。
2添加了“查找不规则的标点符号”
[.\.。,\,、·`]{2,}|…+[.\.\,、·`]+|[.\.。,\,、`]+…+[.\.\,、·`]+
在做精校书中,这样的查找是必要的。
它不仅仅只是查找,还会给出建议的替换内容。
这个功能只是把它从“查找广告及其它问题”中分离出来,并作了适当的增强。
3 在“章节整理”中添加了“规范化章节标题”功能,它可以把 第032章,第032章,第零三二章这样的章节名转换成 第三十二章。
4 在“章节整理”中的章节名称列表框添加了“顺序”列,用于显示该章节的顺序。如果在该顺序号后面有三个问号,你就应该小心检查一下上下的章节是否有问题了(短章,重复的章,章节名称不规范等)。
5 在“章节整理”中添加了“删除选定章节”功能,用于删除重复的章节(注意:是连重复的章节名及章节内容一起删除,请慎用)。
自定义正则合集功能介绍
1、引号引住的多行硬回车的处理(使用前提:排除缺字缺标点的情况下)
以《都市少帅》为例:
【双行】
“那你们以
前躲在哪里?”
【三行】
楚天给自己倒了杯红酒,轻轻摇晃喝下两口,淡淡道:“江湖
事自然以江湖方式解决,你们打伤我四个兄弟,加上这三个金陵废
物,如果沈会长真有诚意的话,那就斩下七根手指,我保证今天的
事就此一笔勾销!”
【四行】
凡间点点头。挥手让人把指令发出去,随即试探着问:“少帅
。唐大龙留着始终是个祸害,这次唐门攻打杭村冒出那么多余孽分
子接应,就可以看出他的根深蒂固,要不咱们把他干掉绝了余孽分
子的希望?”
【五行】
楚天点点头:“像今天这种情况,应该采用‘机动灵活’方针。
能打则打,不能打则退,有战机时,狠狠地打他一下,但是,必须让各位将领明白,保存兵力不是目的,而是为了有效地消灭敌人。
这样做,各作战部队就可以充分挥他们作战的主动性和机动性。”
●处理方法●
引号引住的多行硬回车的处理(双行):
(“[^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,}”)
替换为$1$2
引号引住的多行硬回车的处理(三行):
(“[^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,}”)
替换为$1$2$3
引号引住的多行硬回车的处理(四行):
(“[^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,}”)
替换为$1$2$3$4
引号引住的多行硬回车的处理(五行):
(“[^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,})[^”。!?…]\n(?:[ \t]+)?([^”“\n]{0,}”)
替换为$1$2$3$4$5
2、非引号引住的硬回车处理(使用前提:排除缺字缺标点的情况下)
以《都市少帅》为例:
【双行的】
周兆森知道行踪已经被发现,警察很快就会
追查过来,楚天他们很快也会追杀而来,周兆森现在才发觉,京城虽大,却没有自己的藏身之地。
【三行的】
依旧是在昨晚的豪华厢房。依旧是山珍海味和美酒,但坐在酒
席中间的人却不同了,李大雕父子,张荣贵以及楚天,望着楚天波
澜不惊的神情,李大雕知道自己玩不过人家了,于是轻轻叹息,仰头喝下半杯酒。
【四行的】
楚天离开之后并没有直接回云水山居,而是让帅军兄弟取道去
龙泉山庄,在道上混了那么久,跟各种人都打过交道,唯独没有跟
军火分子有什么来往。自己也没有想到,他们会成为自己的间接杀
手。
【五行的】
他缓缓低下头,一把两寸宽的匕首刺在胸口处,他顺着滴血的
匕首,抬起头想要看向它的主人。却没有见到任何人,唐门领队直挺挺的跪在地上。身子还是在抽挠,眼睛张得大大的,随即又听扑
扑的枪响。他身后的手下正被人枪击,每颗子弹都要了他们的命,有两个
家伙刚抬枪寻找目标,太阳穴就被枪口阴森森的顶着,这两人明智
的举起手来。想要有活命的机会,但他们想错了,扑扑两声。子弹从脑门穿过。
●处理方法●
(?<=\n)(?!.*第[壹贰叁肆伍陆柒捌玖一二两三四五六七八九十○零百千O0-90-9]{1,12}(?:章|节|節|回|集|部|卷|篇))(.*?[^]^}^※^〕^:^:^》^】^.^。^?^?^”^"^…^!^'^’^)^)^\n^!^—^〗^\-^─])(\r\n)(?:[ \t]+)?(.*?)\r\n
替换为$1$3
或者
(?<=\n)(?!.*第[壹贰叁肆伍陆柒捌玖一二两三四五六七八九十○零百千O0-90-9]{1,12}(?:章|节|節|回|集|部|卷|篇))(.*?[^]^}^※^〕^:^:^》^】^.^。^?^?^”^"^…^!^'^’^)^)^\n^!^—^〗^\-^─])(?:\r\n)(?:[ \t]+)?(.*?)\r\n
替换为$1$2
3、章节缺少‘章’字
『示例』
第二百五十三 见到学姐
……
第四百零八 击杀天狼
……
●处理方法●
(第[-\-壹贰叁肆伍陆柒捌玖一二两三四五六七八九十○零百千O0-90-9]{1,12}) (?!章)(.*?)\r\n
替换为$1章 $2\r\n
4、章节缺少‘第’字
『示例』
一千零一十二章 敌人狡猾
……
一千零一十三章 杀伐
……
●处理方法●
(?<=[ \t\n])(?<!第)([-\-壹贰叁肆伍陆柒捌玖一二两三四五六七八九十○零百千O0-90-9]{1,12}章.*?)\r\n
替换为第$1
5、查找章节标题的.号并去除
『示例』
第1807章 大.杀四方
第.1808章 再展雄风
第1.817章 最后之战
……
第1895章 山.雨欲来
第1895章 山雨.欲来
第1895章 山雨欲.来
……
●处理方法●
(第)(?:\.)?([0-9]+)(?:\.)?([0-9]+)(?:\.)?(章)(?: )?(?:\.)?([\x4e00-\x9fa5]+)(?:\.)?
替换为$1$2$3$4$5
6、不规则重复章节
『示例』
第一百五十二章 扫场子
第一百五十二章扫场子
……
第963章 凶狠淘汰
第963章凶狠淘汰
……
第六百三十章 又见烈翌
第六百三十章
……
第803章 开始行动(上)
第803章
……
第1711章 风云变色
第1711章风云变色(4更求花)
……
●处理方法●
(第[-\-壹贰叁肆伍陆柒捌玖一二两三四五六七八九十○零百千O0-90-9]{1,12}[章节節回集卷部篇])( )?(.{0,80})\r\n.*?(\r\n.*?){0,5}([ \t]+)?\1.*?\r\n
替换为$1$2$3\r\n
7、提取章节前后行
『示例』
此月第16更砸到,鲜花至240朵,谢谢兄弟们的支持!HOho
第1663章 败敌
连续两更,继续求花。
……
●检查章节前后行的广告是否清除干净,是否缺行、缺段。
先删除所有空白行,在搜索框输入.+\n.*第[0-9]章*.+\n.+,然后点击‘广告检查及字符串计数’就能提取出来了。
8、引号单独一行
『示例』
林大炮哈哈笑了起来爽朗的说:“
少帅真是人中之龙虎帮创立至今少帅是唯一有胆量有身手带着棺材进入华都别墅还能面不改色的跟林某谈笑风生真实佩服。”
●处理方法●
:“\r\n[ \t]+
替换为:“
9、连续句号
『示例』
欧阳采薇望着离去的楚天等人。眼里闪烁着杀机。但很快就恢复了平静。今晚虽然让楚天逃脱围杀。但不代表他还有机会躲过所以击杀。想到这里。欧阳采薇也领着刺下的四名高手消失在长街。唯有空气中弥留些许的幽香。
……
●处理方法●
([\x4e00-\x9fa5]+)。([\x4e00-\x9fa5]+。.*\n)
替换为$1,$2
10、同行重复章节
([0-9]{1,12}章).*?\1.*?\r\n
○如:234章 XXX 234章 OOO
11、添加页码
『示例』
第1章 转世重生
第2章 新的环境
第3章 初战实力
第4章 老古董
第5章 出名
……
○这个是我制作E书用的,在章节行后添加按顺序排列的页码。
(第)([壹贰叁肆伍陆柒捌玖一二两三四五六七八九十○〇零百千O0-90-9]{1,12})(章)(.*?\r\n)
替换为$1$2$3$4- $2 -\r\n
12、提取建议行、的得地行
.*建议:.*
○这个是我提取黑马校对的勘误文本用的。
13、行尾右引号前缺少叹号
『示例』
转身向佣人吩咐道:“吴妈。备饭”
……
●处理方法●
([\x4e00-\x9fa5])”\r\n
替换为$1!”
14、查找超过5行的段落。
.{339,}\n
15、查找重复行
(.{4,}\n)\1
16、冒号后面的双引号
(:)\r\n(?:[ \t]+)?(“)
替换为$1$2
17、冒号后添加“
:(?!“)
替换为:“