一、问题的提出
随着设计手段的不断提高,CAD软件已成为设计、分析、仿真的强有力工具。从陌生到熟练地应用,从排斥到喜欢甚至离不开它,因为它的加入,我们的设计变得更快、更好、更及时。然而,在MDA系统中,随着使用部门和使用人数的增加,CAD软件也面临着另外一个问题:软件资源和系统资源问题。具体表现是:
CAD有设计、分析、仿真、工业设计多个软件,这些软件分散管理,没有集中监控,机器多和软件多,造成管理工作量极大。
用户完成软件后往往不主动退出应用程序,造成license(许可证)被无效占用,降低了license的使用效率。
在部门内部,无法实现计算机资源共享,网络中有的机器繁忙,有的机器却空闲,无法自动将繁忙机器上的作业分流到空闲的机器上。
对管理层而言,无法从总体上把握机器的使用状况,不利于制定精确的采购计划,以最少的开支满足用户最大的需求。
对系统管理员而言,系统的使用基本上处于黑箱状态,无法确切知道系统是如何被使用的。
使用的过程中,我们采用了多种办法来缓和这些矛盾,如编程来限制用户的使用软件license(许可证)个数;增加软件的许可证数量;人为地让性能好的机器承担更多的任务;还有人工的协调,但这一切只能缓和却不能解决矛盾。
如何让最少的资源发挥最大的作用,这是我们需要解决的问题,这样不仅能够节约成本,也能提高效率。为此,我们使用了动态资源管理系统。
二、动态资源管理的分析
动态资源管理,就是监控分布式计算环境,并根据现存的资源动态地重新配置系统和负载。确保客户的计算机系统得以安全、有效、高效率、低消耗运行。
动态资源管理按功能分为以下几个部分:
● 统一管理软、硬件及用户
在硬件级,我们的MDA硬件资源存在平台多样化,包括IRIX、HPUX、Windows等,性能差异也较大,有最新款的双CPU 1G内存的主机,也有使用七八年的老机型,任务就是您使用的那台机器提供执行,常常会出现性能好的机器还没有性能弱的机器任务繁重,造成资源的浪费和工作效率的降低。
动态资源管理软件LSF base&Batch能把我们的MDA服务器纳入统一管理,由Master Server服务器根据负载调配作业,使用户的应用程序尽量均匀地运行在机群中,并总在满足资源要求负载最轻的机器上执行,提高机器的利用率,又从总体上缩短了作业完成时间。同时,我们可通过任何运行LSF的机器监控所有服务器的系统负载(如:内存、CPU利用率、许可证的当前使用情况等)、用户运行应用程序情况,并管理整个机群。
在软件级, LSF base&Batch将把所有应用程序按队列管理,不同的应用程序对应不同的队列,并按队列配置不同的管理策略,还可以按照应用程序的许可证的可用数量来调度用户的应用程序。我所的MDA系统中有设计、仿真、分析、数据清理、备份等,可以根据任务的不同,轻重缓急分成不同的队列执行,比如说大计算量的ansys分析、MDA数据清理工作就可以安排在night队列执行,而I-deas三维设计则安排在优先级最高的I-deas队列。这样既保证了应用程序之间的独立,也有利于所有应用程序的集中统一管理。
在用户级,LSF base&Batch可按项目、部门将所有用户进行分组,从而针对不同项目或部门实行不同的管理策略。我们可以在LSF内部定义用户和组,也可以引用外部用户和组,分配给不同的组别不同的权限。比如,一般的用户只赋予他提交任务的权限,但是只有项目主管和系统管理员才有权限删除任务或者是改变任务的优先级。
● 实现统计、分析和模拟计费和成本核算
利用动态管理软件LSF Analyzer可以提供如下统计、分析报表:
详细的机器使用情况,如CPU,内存的利用率曲线
用户对机器的使用情况,如用户使用CPU,许可证时间
许可证的使用情况,如许可证的利用率
用户提交的所有作业的情况,如作业名、作业数等使计算资源的使用
通过对我所的MDA系统的观测,可以从产生的数据中获得,我所的MDA设计工作的瓶颈不是在硬件资源上,而是在软件的许可证不能很好的满足用户的需求。 所以我们会用到下面的Llicense管理。
●License管理
LSF可以对软件license进行完全量化管理
LSF将软件license作为一种资源纳入到完备的资源管理机制中。license的使用也就是资源的使用,用户可以通过LSF提供的各种命令和机制对license的使用进行监控。我所的MDA软件license使用一直都是一个矛盾,一味的增加Licesen数量并不能解决问题。通过对license的量化管理,我们可以把license计费,统计设计人员使用的license情况和工作效率,达到软件更有效的使用。
对用户进行分组控制
LSF可以将使用软件的所有用户分成若干组,对应于实际工作中的各个工作/项目组,每组具有不同的优先级。每一组拥有的license 种类、数量、运行时间窗口都可以由LSF来定义和管理。
LSF可以根据用户优先级优化软件license的使用
用软件的不同用户/项目组具有不同的优先级。当软件的license数量足够多时,用户都可以正常使用。当软件license不足时,高优先级的用户作业将强行抢占低优先级的作业,保证紧要作业的及时完成。
三、动态资源管理系统的构造
我们使用动态资源管理系统来监控分布式计算资源管理,并使其自动操作的资源管理。它将现有的人工任务转变为自动进程。在使用模式和资源可获得性的基础上,通过重新自动设置负载,确保软件和服务始终保持运转状态。
首先我们需要确立我们实现的管理目标
1、计算机硬件资源使用的统计、管理和分析
2、CAD应用软件使用的统计和分析
3、用户使用情况的统计与分析
在硬件上,我们建立MDA域,将所有需要管理的计算机加入该域,统一管理和调配;在软件上,我们把所有的CAD应用软件信息收集到服务器上,集中管理所有软件的使用情况;用license收费统计来记录用户的使用情况。
在软件上,我们完成一个MDA作业,必须通过下列的流程:1、作业提交:我们可以选择提交的队列和主机,也可以让系统采用默认的设置;2、作业的调度与分配,可根据用户的优先级,采用不同的策略,如先来先服务或是分时服务;3、作业的主机选择,按任务的优先级,选择满足任务资源请求、环境要求的主机;4、运行作业
其中LSF Analyzer能够分析、计算资源的使用情况将计算机资源的使用情况,从黑箱变为白箱。我们可以用Analyzer统计分析资源是如何被使用的,及资源的利用率等,从而清晰地看到投资的回报,同时也可以找出应用中的瓶颈,并有针对性地添置设备或许可证,以最快的速度和最少的投资提升性能。
利用LSF Analyzer还能有效地管理长期占用许可证但却很少真正使用的用户。例如,我们可以为每个用户规定一个使用许可证的费用限额,然后用Analyzer定期统计用户对许可证的使用金额,当用户的使用金额达到限额后,系统管理员可以通过LSF降低用户的优先级,甚至限制用户访问或运行应用程序,直到用户申请到新的使用限额。通过这种方式可加强用户管理,使用户养成合理、高效的许可证使用习惯
License的统计分析
软件License是由大家共享的资源,由于不合理安排和使用而造成一些用户占着宝贵的license不干活而另外一些用户抱怨 license数量不够。
当软件license纳入LSF管理之后,每个用户对软件license的各个方面的使用情况进行全面的记录、统计和分析,并以直观的图形显示和表格打印出来,使用户可以尽快找到软件license的使用中的瓶颈,做出正确的决断.
四、结论
工欲善其事,必先利其器。动态资源管理系统的使用,能够让CAD系统变得更有效率,更利于管理,可实现下列目标:
1、对整个MDA系统各种软件集中管理,对其使用情况进行监控,提高系统管理的效率。
2、对宝贵的软件license进行监控和管理,可实现自动调配license,使license发挥更大的作用。
3、可由analyzer提供系统中软、硬件的使用情况报表,并对之分析,对部门的管理和采购计划提供有力的依据。
4、系统资源的使用可以得到监控,这对系统管理的合理化和高效率提供手段。