梦想 就像鸡蛋
要么孵化 要么臭掉
要么孵化 要么臭掉
从和讯网摘到美味书签
Made In Zeal 转载请保留原始链接:http://www.zeali.net/entry/239
标签 ( Tags ): 网摘 , javascript
厌倦了和讯网摘的不道德(网摘显示的地址都是和讯的跳转页面而非最终url)和功能的不完整(至今也没有提供API和导出功能),而365key上面充斥着太多的垃圾条目,兜来兜去,我决定还是用回到美味书签。
好在我放在和讯上的网摘数量不多,总共一百多条,分页显示也就两页内容,可以很容易的把所有网摘的html代码拷贝下来。就算数量多,用程序去循环抓取也还简单。
原始信息有了,需要把它们解析出来导入到del.icio.us中。我选择用javascript来对原始html进行整理生成一个PHP数组变量,然后通过REST API把所有的网摘一次性导入(del.icio.us目前似乎屏蔽了导入功能,否则直接生成标准格式的bookmark文件就可以导入了,可以省去调用它的API接口的麻烦)。当然要注意执行导入的PHP脚本文件应该是UTF-8格式。
导入过程还算顺利,只是有几点小问题:
- 和讯网摘列表对于单个网摘只显示最多两个tag,所以对于两个以上的tags就只好让它丢失了
- 和讯网摘的网摘描述可以放很长一段文字,以至于我以前收录的时候有时候把文章正文全部作为描述放进去了,而del.icio.us支持的描述文字长度有限(中文字大概100个左右),所以只能把超长的文字截去
- 中文tags有些字造成乱码,好在数量不多(两三个),导入以后需要手工修改一下这几个网摘的tags
不管怎么说,所造成的问题在我能接受范围之内。
This Entry was Last Modified on 2007-05-28 10:45
没有评论.
发贴统计

我的地盘