火车采集器采集后的数据,可以非常方便的导出成CSV或EXCEL格式,使用商业版,还可以自定义数据模板进行导出,不过那样的效率会稍微低一些,这里提供一个命令,可以非常方便的将火车采集器采集来的数据导出成CSV格式。
首先去SQLITE的官方网站下载Windows对应的版本,将下载到 sqlite-tools-win32-x86-***.zip 里面的 sqlite3.exe 解压到 C:/Windows/System32 目录,然后回到火车头的任务数据目录 ,执行以下命令行即可。
sqlite3 -header -csv SpiderResult.db3 "select * from Content;" > data.csv
打开生成的csv文件时,提示Excel 已经检测到”data.csv”是SYLK文件,但是不能将其加载,而且打开data.csv文件,里的汉字是乱码,应该是编码问题,如何解决呢?文章默认保存的都是utf8
使用Editplus打开文件,然后另存为ANSI格式,扩展名改成xls试试。