工具:
Flashget、Txteasy!,DreamEdit.
操作步骤流程:
寻找小说 ——》下载html(htm)——》 html转换成txt——》txt合并成全本——》全本平均分成N份txt文件——》成功
格式转换流程:
html各章节文件——》txt各章节文件——》txt全本文件——》txt统一大小文件——》成功
文学网站—》文学论坛—》搜索引擎
文学网站一般都有本站的搜索条,只是有的网站需要登陆才可以使用,有的则不需要(比如起点、爬爬),当然,如果你还没有定下要找的目标的话,那么这些网站的众多排行榜也是你参考的重要依据哦……
文学论坛——这类论坛多是盗版文章的集合地,这里也可以说是龙蛇混杂各种小说都可能有,所以你想要的小说倒也很有可能会在这里找到。
搜索引擎——这不用我多说吧,现在搜索引擎满天飞,随手都能抓出一把来。用搜索引擎时很有可能会搜到一些早已被关闭的网页,自求多福吧……
当然,以上只是出于普通大众方法来寻找小说,各位自有妙计吧^-^
下载html-Flashget(我想大家都有,就不提供下载了)
我的目标是做成全本的txt文件,所以在诸如起点等可全本阅读的网站下载小说的网友们可跳过此段(在全本页,用文件另存为文本文件即可)
文学网站的小说都是有其目录页面的,在该目录页面——》右击——》“使用网际快车下载全部连接(这里有点经验的就会先在 选择特定 里将所有站点去掉,再把 选择扩展名 栏把HTML(HTM)选中。有时会用到 工具 栏,实在不会就自己在要下载的文件打勾即可)(愚公精神,汗一个....)——》保存到某个单独目录即可。
也有网站是提供html打包下载的,这自然是更加方便啦。
当然,也有网站的目录链接的不是最终的html地址,而是先跳转到某个……呃……那个理论用语我也说不了,反正就是,你用网际快车下到的是一堆什么.asp或是其他格式的无用文件,如果你碰到这种网站的话,我的建议是——》换家网站(汗....)
这些下载到的html文件都有相同的特点:它们都是以数字命名的,也许数字并不是很连接,不过按其顺序来读却也是整篇文章没错了。
【html转换成txt】- Txteasy!(傻瓜都会,,不说了...).TxtEasy!.rar
【txt文件排版(重头戏)】-DreamEdit在这里..(上传不了..给个下载吧~~
http://www.onlinedown.net/soft/22455.htm!!)
文件-打开-把下载的文件全部打开(不管多少个,我最高一次一共打开过200+,速度还可以..晕....),ALT+T+Z+W(ALT始终按着不放!)写下开始删除行数,由于在同一网站下载,一般只要随便找一个打开的文件数一下就可以了..)这样所有文件的开始几行就淘汰出局了~同样ALT+T+Z+X 删除最后几行!!
排版-ALT+M+K+S+N-随便写个名字-确定-保存。
在排版设置里,在1-选择删除 里 删除行首行尾的空 和 删除连续的重复 打钩。2-特殊处理 里 忽略行首为以下字符串 打钩。3-全面替换 全部数字替换为半角 和 全部字母替换为半角 打钩(驱除乱码!!) 。下面 进行字符串替换 和 两个以上同一字符组成字符串替换为 打钩。4-智能分段 标题居中 和 空行作为分段依据 、以字符作为分段依据 打钩 5-段落分行 一段就是一行(可选)(这样选可以最大限度的紧密文本,但有些人回看不习惯....)打钩。 矫正段内以下成对符号 打钩。---确定!!点中配置,设为默认(重要!)!!!(以后就可以省掉这段了)
排版ALT+M+Y.(漫漫等.....)
ALT+F+M 合并(按个人喜好,如果你们还要做JAR电子书就最好并在1M以内,太大可能打不开...)
ALT+F+U 拆分(自己看)
保存!!!好了。
这是我自己摸索的一点经验,有什么不足的还请各位大大指出。。呵呵