A、一个专利采集分析的系统,需要一个完整的操作界面,一个采集进度的动态进度条。(AJAX)
用AJAX来实现,通过ajax不停地访问服务器,,通过setInterval来设置间隔时间,访问backend.php文件,获得已经采集的数量,然后更新页面相应DOM的内容即可。
jQuery学得不太好,代码比较丑陋,demo如下:
1 jQuery(document).ready(function($) { 2 3 $('#submit').click(function(){ 4 setInterval("updateMsg()", 1000); 5 $.post('total.php', $('#form1').serialize(), function(data, textStatus){ 6 var new_data = "本次所要采集的专利总数为:" + data + "
"; 7 $('#total_area').html(new_data); 8 $('#monitor_area').html('正在初始化信息监控.....
'); 9 }); 10 $.post('test.php',$('#form1').serialize()); 11 return false; 12 });13 14 function updateMsg(){ 15 $.get("backend.php",{},function(data, textStatus){ 16 var now_total = "目前已采集数量:" + data + "
"; 17 $("#monitor_area").html(now_total); 18 }); 19 }
B、一个邮件发送提醒的应用。(消息队列)
一个报名系统,想在第一时间知道报名者的信息并与其取得联系,并发极低,可能十多天就那么一条报名信息。
手机提醒用了发邮件到139的方法。
但是有一个问题,就是将发邮件的代码写到用户提交个人信息的程序段里以后,提交的过程会变得非常慢,可能达到3S多,简直无法忍受。
对于邮件发送这种耗时很长的东西,采用了“队列”的方法。当然,这个队列没有RabbitMQ和ZeroMQ这种东西这么高级,其实就是将信息存到数据库里,算作是入队列了,然后设置一个cron来处理数据库里的这些信息,处理了,也就是出队列的,这也是个笨办法了。
C、那些听说过没有用过的高级方法
1.自然就是到处都是的消息队列了,自己用数据库模拟的,只不过是最低端的方法而已,不是针对并发的,若是面对高并发,必然会挂掉。这个时候,用上传说中的RabbitMQ这些东西,性能应该有极大的提升。还有就是Redis数据库,用过这个东西,感觉用它的list来做消息队列,应该也是非常棒的。
2.CURL的方法,curl_multi据说也是个好东西,但是由于CUROPT_TIMEOUT最小是1,所以客户端至少要等待1S,这也是硬伤。
3.popen()函数,打开一个指向进程的管道,该进程由派生给定的 command 命令执行而产生。
pclose(popen("/home/xinchen/backend.php &", 'r'));
4.fsockopen()方法,这个方法要自己拼接处http头来才行。
5.PHP多进程,其实这个方法自己用过,就是将要处理的大段数据按照for循环,用vim处理分成小段,然后在CLI模式下跑
php –f example1.php &php –f example2.php &用这种笨办法将PHP的进程放到后台来执行……
后来才知道,原来PHP在*uinx下可以直接pcntl类似于C那样fork出进程来,才知道了这个方法,在采集数据的时候,挺好用的,配合CURL和fsockopen,速度飞快。可惜,可惜的是,刚爽了一会,然后IP就被封掉了……
这个的处理,还是很方便的。
1 for($i = 0; $i " . time(). "\n"; 8 //这里就可以放信息采集抓取等东西的代码了。 9 exit(0);//子进程要exit否则会进行递归多进程,父进程不要exit否则终止多进程10 }11 }
6.gearman分布式计算,开很多的worker来支持将job分布到不同机器上去执行,这个,自己接触不到,传说中了。
参考的那些资料:
1.当然是鸟哥的博客了,风雪之隅,这几种异步方法都是在他那儿看到的。
2.张宴的博客,多进程的内容。