/*功能:获取最新百度关键词新闻
* 要输入$keywordlink。百度RSS的关键词网页链接:如:‘金融’关键词链接:http://news.baidu.com/ns?word=%BD%F0%C8%DA&tn=newsrss&sr=0&cl=2&rn=20&ct=0
* 返回值:数组 =》
title:标题
link:链接
date:时间
con:内容(仅数组第一个元素有,即:第一条新闻有这内容,如带图片,内容开头就是图片,图片已处理掉)
*/
function keywordnews($keywordlink){
$result="";
//RSS源地址列表数组
$rssfeed = array($keywordlink);
//设置编码为UTF-8
header('Content-Type:text/html;charset= UTF-8');
//分解开始
for($i=0;$i<sizeof($rssfeed);$i++){
$buff = "";
$rss_str="";
//打开rss地址,并读取,读取失败则中止
$fp = fopen($rssfeed[$i],"r") or die("首次打开页面,速度会较慢,请刷新一遍");
while ( !feof($fp) ) {
$buff .= fgets($fp,4096);
}
//关闭文件打开
fclose($fp);
//建立一个 XML 解析器
$parser = xml_parser_create();
//xml_parser_set_option -- 为指定 XML 解析进行选项设置
xml_parser_set_option($parser,XML_OPTION_SKIP_WHITE,1);
//xml_parse_into_struct -- 将 XML 数据解析到数组$values中
xml_parse_into_struct($parser,$buff,$values,$idx);
//xml_parser_free -- 释放指定的 XML 解析器
xml_parser_free($parser);
$link="";
$title="";
$con="";
$date="";
$i=0;
// print_r($values);exit;
foreach ($values as $val) {
$value="" ;
$tag = $val["tag"];
$type = $val["type"];
if(array_key_exists('value', $val)){
$value = $val["value"];
}
//标签统一转为小写
$tag = strtolower($tag);
//title 和 link con date
if($value!="")
{
if ($tag == "title"){$title = $value;}
if ($tag == "link"){$link = $value;}
if ($tag == "pubdate"){$date = $value;}
if ($tag == "description"){$con = $value;}
if($link=='news.baidu.com'){$link="";}
if($title=='news.baidu.com'){ $title="";}
if($con=='news.baidu.com'){ $con="";}
if($date=='news.baidu.com'){ $date="";}
if($link=='http://news.baidu.com'){$link="";}
if($title=='http://news.baidu.com'){$title="";}
if($date=='http://news.baidu.com'){$date="";}
if($con=='http://news.baidu.com'){$con="";}
}
//当两项都不为空时,输出并清空
if($title<>""&&$link<>"")
{
//只显示第一条新闻内容,如带图片,内容开头就是图片
//返回形式:数组
if($i==1){
$result[0]['con']=$con;
$result[]=array('title'=>$title,'link'=>$link,'date'=>$date,'con'=>$con);
}
else{
$result[]=array('title'=>$title,'link'=>$link,'date'=>$date,'con'=>$con);
}
//时间化
if($i>0){
$result[$i-1]['date']=date("Y-m-d",strtotime($date));
}
// echo "<a href='".$link."' target=_blank>".$title."</a><br />";
//返回形式:字符串 $result.='<li><a href="'.$link.'" alt="'.$title.'" target=_blank>'.$title.'</a></li>';
$i++;
$title="";
$link="";
$con="";
$date="";
}
}
//数组最后一个元素时间化,
$n=count($result)-1;
$result[$n]['date']=date("Y-m-d",strtotime($result[$n]['date']));
foreach ($result as $k=>$v){
$result[$k]['con']=strip_tags($result[$k]['con']);
}
//返回数组结果
return $result;
}
}