记个流水帐-写写今天下午的劳动成果 一个天气的采集
看到 淄博天气 淄博天气预报 这个词百度量还可以 又实在不想在自己站上挂个js
就自己写一个吧演示
http://www.liuquan.net/zibotianqi.php
我的环境是php,这个破服务器不知道杂回事function getcontent($url) {
if($handle = fopen ($url, "rb")){
$contents = "";
do {
$data = fread($handle, 2048);
if (strlen($data) == 0) {
break;
}
$contents .= $data;
} while(true);
fclose ($handle);
}
else
exit("地址不对");
return $contents;
}
这个函数用了n会了竟然不能用file()也不行 baidu google了一下 说是服务器的问题,又要开着开那开了也不一定管用 (谁解决过这问题说下)发现有人给出了另外一个函数 $ch = curl_init();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, 'http://www.baidu.com/s?wd=%D7%CD%B2%A9%CC%EC%C6%F8');
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents = curl_exec($ch);
curl_close($ch);一用还可以 目标是抓去百度 搜索 淄博天气 的那页来回切一下
function cut($file,$from,$end){
$message=explode($from,$file);
$message=explode($end,$message[1]);
return $message[0];
} $from='Zibo.html" target="_blank">淄博天气</a></font>';
$to='</td></tr>';
$file_contents=cut($file_contents,$from,$to); //去掉标记 就是自己想要得了
采集就是这么简单 在这技术上再加上 正则提取 和 替换就好了 我的理解 |