1000字范文,内容丰富有趣,学习的好帮手!
1000字范文 > 爬虫用java还是python_网络爬虫是用python比较好 还是Java比较好呢?

爬虫用java还是python_网络爬虫是用python比较好 还是Java比较好呢?

时间:2024-01-10 17:33:59

相关推荐

爬虫用java还是python_网络爬虫是用python比较好 还是Java比较好呢?

eechen

/07/11 14:17

可以看看PHP的几个DOM操作库: Simple-HTML-DOM , phpQuery, Ganon

比如轻松抓取PHP官方首页新闻的标题和发布时间:

<?php

require dirname(__FILE__).'/simple_html_dom.php';

$html = file_get_html('');

$news = array();

foreach($html->find('article.newsentry') as $article) {

$item['time'] = trim($article->find('time', 0)->plaintext);

$item['title'] = trim($article->find('h2.newstitle', 0)->plaintext);

//$item['content'] = trim($article->find('div.newscontent', 0)->plaintext);

$news[] = $item;

}

var_export($news);

//输出

array (

0 =>

array (

'time' => '07 Jul ',

'title' => 'PHP 7.1.0 Alpha 3 Released',

),

1 =>

array (

'time' => '27 Jun ',

'title' => 'PHP 7.1.0 Alpha 2 Released',

),

2 =>

array (

'time' => '23 Jun ',

'title' => 'PHP 5.5.37 is released',

),

3 =>

array (

'time' => '23 Jun ',

'title' => 'PHP 5.6.23 is released',

),

4 =>

array (

'time' => '23 Jun ',

'title' => 'PHP 7.0.8 Released',

),

5 =>

array (

'time' => '09 Jun ',

'title' => 'PHP 7.1.0 Alpha 1 Released',

),

)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。