简介说明
- 1. 站长主动向百度搜索推送数据,可缩短爬虫发现网站链接时间,可加快爬虫抓取速度,但无法解决网站内容是否收录问题。
- 2. 百度搜索资源平台为站长提供链接提交通道,但不保证一定能够收录提交的链接。
- 3.通过程序代码方式,将根据自己需要将网站的链接提交给百度蜘蛛。
- 4.本程序代码是将文章的id提取出来,再和单页页面组合成新的数组,提交的时候按20条进行分割,最终提交给百度蜘蛛。
<?php //豫章小站出品 include ( "wp-config.php" ) ; require_once (ABSPATH.'wp-blog-header.php'); global $wpdb; $qianzui = "https://blog.mydns.vip/"; //更改为自己的域名 $houzui = ".html";//URL网址链接后缀 $sql="SELECT ID FROM wp_posts WHERE post_type = 'post' AND post_status = 'publish' ORDER BY ID DESC limit 0,195"; $myrows = $wpdb->get_results($sql); foreach ($myrows as $b) { $id=$b->ID; $url=$qianzui.$id.$houzui; $ar[] = $url; } $urls = array( 'https://blog.mydns.vip/tools/checkATS.html', 'https://blog.mydns.vip/tools/ipinfo.html', 'https://blog.mydns.vip/tools/qrcode.html', 'https://blog.mydns.vip/tools/pic.html', 'https://blog.mydns.vip/links_1-html', ); $num=array_merge_recursive($urls,$ar); $chunk_result = array_chunk($num, 20); foreach ($chunk_result as $a){ $api = 'http://data.zz.baidu.com/urls?site=https://blog.mydns.vip&token=*****'; //这里要替换为自己在百度官方的api地址,如何获取文章有介绍 $ch = curl_init(); $options = array( CURLOPT_URL => $api, CURLOPT_POST => true, CURLOPT_RETURNTRANSFER => true, CURLOPT_POSTFIELDS => implode("\n", $a), CURLOPT_HTTPHEADER => array('Content-Type: text/plain'), ); curl_setopt_array($ch, $options); $result = curl_exec($ch); echo $result; } ?>
将上述代码保存命名为push.php,上传到网站根目录,然后就可以直接访问http://xxx.xxx.com/push.php这个页面来推送给百度蜘蛛了,可以每隔几天访问一次。
参数说明:
1、$sql语句中,limit 0,195这里是提取最近195篇文章,可以根据自己需要调整。
2、$houzui 网址后缀,有些站长可能没有用.html这种方式,比如是https://www.xxx.com/1437/这种链接,那么$url=$qianzui.$id.$houzui这段就要修改为$url=$qianzui.$id
3、$urls变量是自定义需要提取的链接地址,可以根据自己需要添加,如果不需要可以删除这部分代码,删除以后后面$chunk_result = array_chunk($num, 20);就需要修改为$chunk_result = array_chunk($ar, 20);
百度蜘蛛主动推送的api获取方式如下图:
如果有什么疑问,可以联系小站站长。
» 本文链接地址:https://blog.mydns.vip/2094.html
最新评论
我的站目前每天120个IP,其中刷的是100个。 不知道为什么升级到4H8G5M的标准服务器还是偶尔会崩,CPU占满,但是内存一般这种时候只占50%左右,这是为什么呢?max_children我也设
麻烦发下检测工具
让我下载