注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

WWW.LOGO880.CN

WWW.LOGO880.CN 作品会说话 创意来呐喊

 
 
 

日志

 
 

php168采集规则总结  

2009-12-19 03:22:54|  分类: 博客|笔记 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

一、php168如何在文章中插入广告

新浪默认采集中,要去除本文转载于 新浪网***的提示

只要打开admin/gather.php,查找(Ctrl+F)

本文转载于 新浪网:{$titledb[$page][′url′]} ,去除即可。

二、php168如何在文章中插入广告

万能的内容页,默认的模板文件是:bencandy_1.htm (万能目录/template/default/bencandy_1.htm)

打开此文件后,查找下面的代码

<td align="left" class="content_word"><font id="zoom" face="宋体"><span id="post1">$rsdb[content]</span></font></td>

改成这样看看:

<td align="left" class="content_word"><font id="zoom" face="宋体"><span id="post1"><div><div style="float:right;margin-left:5px">广告代码</div>$rsdb[content]</div></span></font></td>

在内容页模板中修改,官方默认的路径为:template/default/bencandy.htm

用记事本打开此文件后,查找下面的代码:

                <td align="left" class="content_word">$rsdb[content]</td>

将上面的代码改成如下:

                <td align="left" class="content_word"><div><div style="float:right;margin-left:5px">广告区</div>$rsdb[content]</div></td>

红色标记的部分为增加的部分.

三、PHP168干扰码防采集插件

修改bencandy.htm文件即可以实现干扰码防采集,防复制功能

实现了段落</p>插入干扰码
实现了换行</br>插入干扰码
其它自己找规则加入吧.

bencandy.htm第二行
<!--
<?php
下面插入以下代码


$String=rands(35);//获取随机字符
$class = "id=′$String′";
$fontColor = "#FFFFFF";//字体颜色
$webwoo .=  "<div class= ′$String′ style= ′display:none′;id=′$String′><font color=′$fontColor′>
咸宁在线版权所有webwoo.net!这里可以修改成你网站的信息</font></div>";
$webwoo .= "<div class=′$String′><font color=′$fontColor′>请不要复制,
品牌设计版权所有webwoo.net!</font></div>";
$rsdb[content]=str_replace( "<\br>", "<\br>".$webwoo,$rsdb[content]);//换行后面加干扰码
$rsdb[content]=str_replace( "</p>", "</p>".$webwoo,$rsdb[content]);//段落后面加干扰码
$rsdb[content]=str_replace( "<div", "<div ".$class,$rsdb[content]);
$rsdb[content]=str_replace( "<p", "<p ".$class,$rsdb[content]);

四、PHP168 p8 常被挂马的几个文件及屏蔽方法

  
images/default/inc.js
images/default/default.js
global.php

用龙城的方法试下:

木马一般是利用iframe框架来调用外域JS代码的。
就算现在最新的<scripe>也是调用iframe框架再调用外域JS代码的。
中这种木马,一般是WINDOWS服务器中毒.并且一般是iis服务器
把以下代码放到你的网页最底部.即foot.htm模板的最底部,把"php168.com"替换成你的域名.即是不过滤你的域名的框架网页.
<SCRIPT LANGUAGE="JavaScript">
<!--
document.write("<iframe src=′about:′ width=0 height=0></iframe>");
function filtrate_iframe(){
    obj=document.body.getElementsByTagName("iframe");
    for(var i=0;i<obj.length;i++){
        if(obj.src.indexOf("http://")!=-1&&obj.src.indexOf("php168.com")==-1){
            obj.src=′′;
        }
    }
}
filtrate_iframe();
//-->
</SCRIPT>


然后再修改head.htm模板.查找
<body
替换成
<body  onload="filtrate_iframe()"

通过以上办法,即可非常有效的把木马屏蔽掉.也就是说只是屏蔽而已.

五、PHP168 p8采集器修改,自动放弃不匹配页面。

  
此次修改原因:有的时候规则是对的,但就是部分页面会出错,那么就没有必要再留着,自动放弃。

优点不说。

缺点:可能不太好检查规则是否错误,可能只适合会写采集规则的朋友,要不出错了也找不到原因。

打开gather.php文件。




Copy code
//过滤文章前面无效内容


替换为


Copy code
//采集内容出错自动放弃,开始
        if(!$value2){
              $page++;
              echo "正在采集第[$page]页,请耐心等待............<hr><font color=red>发生错误:找不到匹配的内容,请仔细检查规则是否有错或<a href={$urldb[$page]} target=_blank><b>浏览出错页</b></a>............5秒后自动跳转到下一页。</font><br><br>出错页情况:<a href={$urldb[$page]} target=_blank><b>{$urldb[$page]}</b></a>";
              if($urldb[$page]){
              $p=$page-1;
              echo "<META HTTP-EQUIV=REFRESH CONTENT=′5;URL=?lfj=$lfj&action=$action&id=$id&system_type=$system_type&GetFile=$GetFile&file_dir=$file_dir&makesmallpic=$makesmallpic&showpic=$showpic&username=$username&fid=$fid&testgather=$testgather&page=$page′>";
              exit;
            }else{
              $num=count($urldb);
              if($testgather){
              jump("测试采集完毕,模拟总共采集了{$num}篇,其实没有入数据库","index.php?lfj=$lfj&job=list",20);
            }else{
              jump("采集完毕,总共采集了{$num}篇","index.php?lfj=$lfj&job=list",10);
              }
            }
          }
        //采集内容出错自动放弃,结束

        //过滤文章前面无效内容


可能这次是最后一次修改采集器程序,因为我不是官方的开发团队成员,以后不方便大家更新。

 

 

 

 

  评论这张
 
阅读(303)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017