现螅岔出礤在做自媒体的通常都是一人多号、多平台同步更新,其中一部分都是自有网站或博客的站长,小编就是其中之一。小编就利用当前最盛行的博客程序WordPress搭建起了自己的网站,因为刚开镫炜茛玳始做自媒体,内容还不够多,所以用火车头采集器采集了一些数据来充实自己网站。但是因为在采集过程中没有验证标题是否唯一,从而导致出现大量标题重复的文章。为了解决这个问题,我需要从本地火车头采集器数据和服务器WordPress数据中分别删除重复的数据。火车头采集器使用的是access数据库,WordPress使用的是MySQL数据库。
工具/原料
电脑
互联网
方法/步骤
1、access数据库删除重复数据保留唯一记录1.打开火车头本地数据文件SpiderResult.mdb,依次点击菜单“创建”——“查询设计”打开查询设计窗口。
2、2.打开查询设计窗口会提示添加表,这里不添加所以点击“关闭”,然后在设计窗口空白处点击右键,选择“SQL试图(Q)”。
3、3.复制下面的代码,点击工具栏中的“运行”按钮。access数据库去重复代码:DELETEidFROMcontentWHEREidnotin(selectmin(id)fromcontentgroupby标题);
4、4.稍等片刻会提示“您正准备从指定表中删除XXX行”,点击“是”按钮即可。
5、MySQL数据库删除重复数据保留唯一记录1.登陆MySQL数据库管理工具phpMyAdmin,在左侧数据库列表中选择要操作的数据“wordpress”,点击工具栏“SQL”按钮打开sql编辑器,复制下面的代码粘贴到编辑器,然后点击“执行”按钮,
6、2.几傻钱库岛秒钟之后会提示“你的SQL语句已经成功运行”,每一行代码执行后面会提示影响了多少行数据。MySQL数据库去重复代码:CREATETABLEmy_tmpAS惺绅寨瞀SELECTMIN(ID)AScol1FROMwp_postsGROUPBYpost_title;DELETEFROMwp_postsWHEREIDNOTIN(SELECTcol1FROMmy_tmp);DROPTABLEmy_tmp;