29
2017
07

PHP简单抓取网络邮箱的程序

<?php
include 'curl.php';

$con_data_order = mysql_connect("xx.xx.xx.xx:3306", "aoplee", "aoplee");
if (!$con_data_order) {
    die('Could not connect: ' . mysql_error());
}
mysql_select_db("db_splders", $con_data_order);

$i = 10;
while ($i) {

    $sql = 'select * from tb_urls where iStatus =1 limit 1';
    $result = mysql_query($sql);
    $row = mysql_fetch_array($result);
    //获取到url
    $sUrl = $row['sUrls'];
    $file = Curl::get($sUrl);
    //找到链接
    $url_array = preg_match_all(
        '/\b(?:(?:https?|ftp):\/\/|www\.)[-a-z0-9+&@#\/%?=~_|!:,.;]*[-a-z0-9+&@#\/%=~_|]/i',
        $file,
        $matchs
    );
    //找到邮箱
    $mails_array = preg_match_all(
        '/([\w\-]+\@[\w\-]+\.[\w\-]+)/',
        $file,
        $matchs_mail
    );
    //保存urls
    foreach ($matchs[0] as $key => $value) {
        //排除图片
        $premix = substr($value, -3);
        $premix2 =substr($value,0,22);

        if ($premix != 'jpg' && $premix != 'png' && $premix != 'ico' && $premix != 'gif' && $premix != 'dtd' && $premix != 'exe') {
            if($premix2 == 'http://tieba.baidu.com'){
                if (empty(mysql_fetch_array(mysql_query('select * from tb_urls where sUrls="' . $value . '"')))) {
                    //不存在url才插入
                    $sql_insert = 'insert into tb_urls(sUrls,iStatus,dtCommitTime) values("' . $value . '",1,now())';
                    mysql_query($sql_insert);
                }
            }
        }
    }
    //保存mails
    foreach ($matchs_mail[0] as $key => $value) {
        //首先判断是否存在
        if (empty(mysql_fetch_array(mysql_query('select * from tb_mails where sMail="' . $value . '"')))) {
            $sql_insert_mail = 'insert into tb_mails(sMail,iStatus,dtCommitTime) values("' . $value . '",1,now())';
            mysql_query($sql_insert_mail);
        }
    }

    //将次条记录update
    $sql_update = 'update tb_urls set iStatus =2, dtUpdateTime = now() where id = ' . intval($row['id']);
    echo $sql_update . "\n";
    mysql_query($sql_update);
}

mysql_close($con_data_order);
« 上一篇 下一篇 »

评论列表:

1.yuanmouren1hao  2017-07-29 20:46:17 回复该评论
hello world
1.yuanmouren1hao  2017-07-29 20:46:30 回复该评论
hhh
1.yuanmouren1hao  2017-07-29 20:46:34 回复该评论
fgsdfgfasd
1.yuanmouren1hao  2017-07-29 20:46:37 回复该评论
sdfgsdfgs

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Top