@ZEAL Blog·厉
WWW Zeal Blog
We stand alone,
TOGETHER.

从和讯网摘到美味书签

Posted by zeal on 2005-11-23 02:54 , 760 characters |  + 1 - 0   English
转载请保留本行原始出处声明信息 : http://www.zeali.net/entry/239 MaDe1nZEAL
标签 ( WebDev ):  , 

厌倦了和讯网摘的不道德(网摘显示的地址都是和讯的跳转页面而非最终url)和功能的不完整(至今也没有提供API和导出功能),而365key上面充斥着太多的垃圾条目,兜来兜去,我决定还是用回到美味书签。

好在我放在和讯上的网摘数量不多,总共一百多条,分页显示也就两页内容,可以很容易的把所有网摘的html代码拷贝下来。就算数量多,用程序去循环抓取也还简单。

原始信息有了,需要把它们解析出来导入到del.icio.us中。我选择用来对原始html进行整理生成一个PHP数组变量,然后通过REST API把所有的网摘一次性导入(del.icio.us目前似乎屏蔽了导入功能,否则直接生成标准格式的bookmark文件就可以导入了,可以省去调用它的API接口的麻烦)。当然要注意执行导入的PHP脚本文件应该是UTF-8格式。

导入过程还算顺利,只是有几点小问题:

  1. 和讯网摘列表对于单个网摘只显示最多两个tag,所以对于两个以上的tags就只好让它丢失了
  2. 和讯网摘的网摘描述可以放很长一段文字,以至于我以前收录的时候有时候把文章正文全部作为描述放进去了,而del.icio.us支持的描述文字长度有限(中文字大概100个左右),所以只能把超长的文字截去
  3. 中文tags有些字造成乱码,好在数量不多(两三个),导入以后需要手工修改一下这几个网摘的tags

不管怎么说,所造成的问题在我能接受范围之内。

Last Modified on 2007-05-28 10:45
没有评论.
日志存档
2014年
2013年
2012年
2011年
2010年
2009年
2008年
2007年
2006年
本 Blog 原创内容
遵循以下授权:

Creative Commons
(创作共用) CC

署名-非商业性
-相同方式分享
ZEAL Blog 基于
Powered byPivot - 1.24.1: 'Arcee'
Pivot1.24.1
开发
系统部署于
Linode.com
Launched @
2005-04-27
Since 2005.04.27  梦想 就像鸡蛋 要么孵化 要么臭掉RSS Feed (Entries) | About me | Back To Home | @ZEAL | zbird.com | 沪ICP备05024379号