bash多进程批量处理

首先看需求:
同时控制1000台linux服务器做同一件事。
怎么办?肯定用脚本批量处理,因为我目前还没有1000台linux,所以我们用一些脚本来模拟。
1.首先模拟我需要做的事,假设我处理一台Linux需要费时5s 那么我的模拟脚本如下:

cat nothing.sh  
#!/bin/bash  
sleep 5        //发呆5echo `date`    //输出当前系统日期  
    好,那么这件事我要做1000次,那么for循环走起:  
#!/bin/bash  
for i in `seq 1000`  
do  
sh nothing.sh  
done  
exit 0

运行的时候,你会发现每过5s 输出了1行 date 的值,我们循环了1000次,那这个脚本执行完需要的时间至少是1000*5s 大约等于1个半小时。由于循环是串行的,脚本必须等待上一条循环结束,才能进行下一步的循环。
这个时候我们就有需求了:
我肯定不能等那么久,既然现在的CPU都是多进程的,我能不能开多个进程去同时完成我需要的任务呢?答案是肯定的。
一个新的多进程并发脚本:

#!/bin/bash  
tmp_fifofile="/tmp/$$.fifo"       
mkfifo $tmp_fifofile            //新建一个fifo类型的文件  
exec 6<>$tmp_fifofile        //将标示符(fd6)指向fifo类型文件  
rm -rf $tmp_fifofile            //可删可不删  
 
thread=1000                //这里定义了我需要多个进程去干活  
for ((i=0;i<$thread;i++))    
do  
echo ""  
done >&6        //就是在fd6中放置了$thread个空行  
 
for ((i=0;i<1000;i++))        //1000次循环,开了1000个进程  
do  
read -u6        // 一次read -u6 就从fd6中去掉一个空行,然后向下执行,如果fd6中的空行没有了,就停在这里等待位置,从而实现了进程数量的控制。所以如果 我thread的值设为50个,那么其实我就是在用这50个进程就干活,如果进程开满了,就不会再开新的进程,如果旧的进程结束了,那么就会有新的进程进来继续干活。  
        {  
        sh nothing.sh        //这里是我需要干什么活  
        echo "">&6            //每个进程结束后,向fd6返回一个空行,告诉它, 我的活干完了,我的位置腾出来。  
        } &            //命令是放在后台执行的  
done  
wait            //等待所有后台进程结束  
exec 6>&-    //关闭fd6  
 
exit 0

这样的话我们,如果按照我上面的脚本,就是开了1000个进程去同时执行nothing.sh脚本,那么我们总共花费的时间,其实也就是一个进程执行的时间,大约5.5s 。相比于1个半小时,我们节约了太多的时间。
(下一篇将带来python版)

注意:如果你的系统设置了进程上限,请使用 ulimit -s unlimited 来更改为无限制。

1

还没有评论,快来抢沙发!

发表评论

  • 😉
  • 😐
  • 😡
  • 😈
  • 🙂
  • 😯
  • 🙁
  • 🙄
  • 😛
  • 😳
  • 😮
  • emoji-mrgree
  • 😆
  • 💡
  • 😀
  • 👿
  • 😥
  • 😎
  • ➡
  • 😕
  • ❓
  • ❗
  • 70 queries in 0.899 seconds