推荐专题：

1000字范文 > php搜索引擎开源源码 PHP搜索引擎源代码

php搜索引擎开源源码 PHP搜索引擎源代码

时间：2018-08-21 15:17:48

相关推荐

php搜索引擎开源源码 PHP搜索引擎源代码

简单PHP搜索引擎源代码，需要开启PHP的cURL扩展。功能：对某一网址进行检索，获取网站基本信

息，同时提取网站的所有连接。

class Engine{

private $_url = ''; //URL地址

private $_sites = ''; //页面信息

public function __construct($url){

$this->_url = $url;

}

//启动引擎

public function start(){

//$content = $this->socketOpen($this->_url);

$content = $this->getContent($this->_url);

$this->_sites['url'] = $this->_url;

$this->_sites['meta'] = $this->getMeta($content);

$this->_sites['title'] = $this->getTitle($content);

//$this->_sites['detail'] = $this->getDetail($content);

$this->_sites['links'] = $this->getLinks($content);

}

//获取meta内容

public function getMeta($content){

$file = 'metaCache';

file_put_contents($file,$content);

$meta = get_meta_tags($file);

return $meta;

}

//获取body内容

public function getDetail($content){

preg_match('/

(.*?)/i',$content,$matchs);

$body = $this->stripHTML($matchs[1]);

return substr($body,0,400);

}

//获取title内容

public function getTitle($content){

preg_match('/

(.+)/i',$content,$matchs);

return $matchs[1];

}

//获取a链接

public function getLinks($content){

$pat = '/](.*?)href="(.*?)"(.*?)>(.*?)/i';

preg_match_all($pat,$content,$matchs);

$result['href'] = $matchs[2];

$result['name'] = $this->stripTags($matchs[4]);

return $result;

}

//Socket监听

public function socketOpen($url){

$fp = fsockopen($url,80,$errno,$errstr,30);

if($fp === false){

echo "连接失败:$errstr($errno)

";

return false;

}

else{

$out = "GET/HTTP/1.1\r\n";

$out .= "Host:$url\r\n";

$out .= "Connection:Close\r\n";

fwrite($fp,$out);

$content = '';

while(!feof($fp)){

$content .= fgets($fp,1024);

}

fclose($fp);

var_dump($content);exit;

return $content;

}

}

//获取指定url内容

public function getContent($url){

$ch = @curl_init($url);

@curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE

7.0; Windows NT 5.0)");

ob_start();

$result = @curl_exec($ch);

$content = ob_get_clean();

ob_end_clean();

@curl_close($ch);

return $content;

}

//取出script和style标签

public function stripHTML($string){

$pat = array(

"/

"/

);

$rep = array('','');

return preg_replace($pat,$rep,$string);

}

//去除数组元素的标签

public function stripTags(&$arr){

foreach ($arr as $key => $val )

{

if(is_array($val)){

$this->stripTags($arr[$key]);

}

else{

$arr[$key] = strip_tags($val);

}

}

return $arr;

}

function show(){

echo "

";

print_r($this->_sites);

echo "

";

}

//End Class Engine

}

$engine = new Engine('');

$engine->start();

$engine->show();

?>

这只是引擎的主要部分，接下来要做的就是把相关信息存入数据库，然后接着对所有获取的连接再

去检索，然后把相关信息再存入数据库，那么核心部分就是我们获取了这些信息之后根据信息内容

来设定网站的关键字，然后给他一个排名，供以后搜索。设定网站的排名和关键字只能你自己去想

了。

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

单页php搜索引擎聚合源码单页PHP搜索引擎聚合梦在脚下搜索源码+教程

2019-07-15

网盘搜索引擎php源码最新百度云网盘搜索引擎源码附带Python爬虫+PHP网站+Xuns

2022-08-14

站内搜寻引擎 php mysql_迅搜(xunsearch) - 开源中文全文搜索引擎|PHP全文检

2020-01-01

PHP 开源搜索引擎Yioop! 0.80 发布

2019-03-17

扩展阅读

: 学习如何使用PHP查看网页源代码

: 软文发稿新闻文章发布自助推广平台PHP源码

: 扩散！PHP在线加密文件网站源码分享人手一份方便加密

: 「PHP教程」PHP判断语句（二合一）

: PHP 语言地位遭受挑战 PHP 程序员路在何方？

: 如何填写PHP服务器地址以搭建PHP网页服务器

最近发布

我眷恋的家园：高中生活中的情感表达

2024-05-09

有关雨的优美句子 1000字

2024-05-09

复活的 1000字读后感

2024-05-09

关于白血病的作文 1000字

2024-05-09

论考大学的作文 1000字

2024-05-09

教育的观后感 1000字

2024-05-09

推荐专题

城南旧事读后感1000字军训小结1000字高一数学论文1000字历史检讨1000字临床营养学论文1000字自我成长分析1000字大学入团申请书1000字左右宿舍卫生检讨书1000字篮球课心得体会1000字格列佛游记读书笔记1000字劳动作文1000字人生规划1000字高考满分作文1000字迟到万能检讨书1000字优秀作文1000字