如何备份新浪博客

今天帮单位作家老大备份他的新浪博客,总共有1143篇文章。顺便把Epile这次新浪博客的备份思路说一下,方便有同样需要的人。

说明:

  • 本备份思路只备份文章和图片,并不备份评论。
  • 本备份思路把每天文章存储为html文件,页面内容为文章标题、发表时间和文章正文,无页面上的五关内容。

网上搜索到博客备份的方案,有爱数博客备份软件V2006、Blog Backup、Blogbus搬家工具、maikr博客备份工具。爱数博客备份软件为2006年推出的,官方已经撤下了这款软件,软件并没有针对博客提供商进行配置,只是一款类似离线浏览的软件,所以抓取很不准确,把很多外部链接都Down下来了,我开了3个小时都没有备份完,而且它并不支持新浪的图片防盗链!maikr博客备份工具官方都打不开了,所以没有下载到。Blogbus搬家工具是网页版的,能够把博客文章转换为xml文件,不过Epile用的时候当文章抓取到300多篇的时候,进度就不走了,很奇怪的说。最后Epile采用了Blog Backup这款小巧的绿色软件。软件下载地址:http://www.pt42.cn/

blog_backup

Blog Backup针对不同博客商进行配置,之前用过它备份了Blogcn的博客,非常成功,可以把博客文章连同图片一起备份下来。今天最终就用它来备份的新浪博客。软件是通过尝试列表页进行备份,如果无法访问列表页的下一页软件就会认为博客文章备份完毕。所以网络不够好的,请在参数设置里把延迟开大点。

用了大概半个小时的时间就把文章备份下来了。导出选项可以选择RSS,Atom,单个Html,多个Html。为了方便使用,Epile选择了多个Html文件,这样软件会为我们生成index.htm列表和数字序号命名的单篇文章页面。

导出来的原始页面并不是很好看。这时候Epile将给它们添加css调整外观,并修改少量的Html代码以使页面更好看。这时候Epile用到了Blog Backup作者的另一款软件MultiRE。它是一款文本替换软件。

Epile先用Dreamweaver定义好一页文章之后,通过MultiRE对其他页面进行批量修改。最后再用了Framk框架把界面弄成左边列表右边文章。

这个时候基本接近尾声了,可是新浪的防盗链使得图片无法自动下载。这时候Epile用了一个很傻很有效的方法。再次打开Blog Backup软件,把博客导出为单个Html文件。然后用IE打开这个文件,等IE载入完所有的图片后,把网页另存为“网页,全部”。这样所有图片都会在“网页名__files”文件夹下了。

新浪的图片地址为这种类型的http://static3.photo.sina.com.cn/bmiddle/470cfc75g584d96b3c0b2。用IE另存为后图片会自动命名为470cfc75g584d96b3c0b2.jpg。我们只需要再次用MultiRE把470cfc75g584d96b3c0b2前后的地址进行更换,前面更换为本地图片目录,后面添加.jpg。具体操作可以自行研究MultiRE。

所有备份完成。

sinabackup

您可能还对以下内容感兴趣

  • 无相关文章

目前有10条评论 Add your own

  1. wenzi3355 说道:

    似乎是个蛮有用的软件

  2. 小明猪 说道:

    估计是用不上了,但好文章还是要支持滴~

  3. Jutoy 说道:

    话说这个工具我用过……

  4. slyar 说道:

    直接走rss不行么…

  5. 右仔 说道:

    请原谅我是小白。。。
    最后那个MultiRE将网络图片链接换成本地文件的我还是没明白。。。
    不会用啊。。。
    望指教

    • Epile 说道:

      我用Blog Backup把所有的博文导出为一页文章,在IE里打开,等IE显示完所有的图片后,再把页面另存为。这样所有图片就会在一个文件夹里。
      把文件夹命名为images
      之后用MultiRE搜索”http://static3.photo.sina.com.cn/bmiddle/”替换成”images/”,搜索“/>”替换成”.jpg/>”
      不过如果写博时间比较长这个图片地址有几种样式,需分别替换。

      • 右仔 说道:

        我就泪了。。TAT
        我用那个方法弄完以后图片不显示。。。都是红叉叉
        图片还带着超链接的框。。属性里的地址已经变成本地文件了。。。就是不显示。。
        博主能给做个特别详细的步骤图发给我么?
        回复