独家报道:惠普进军数据仓库的内幕
惠普CEO马克·赫德和CIO兰迪·莫特打算利用过去的经验,和IBM、甲骨文以及NCR一较高下。《信息周刊》网络版 John Foley,InformationWeek
发表时间:2007-2-7
现在的主要任务是为Neoview创造经过改进的管理和控制工具,以及保证系统对每天的业务运营提供精确的分析。这就是惠普朴素的战略路线图。到目前为止,惠普并不希望超越它原来的计划。贝特表示:“我们非常清楚,在这个市场我们只有一次出击的机会。”
中国惠普公司也将参与到开发活动的各个方面,位于北京的惠普实验室将发挥重要的作用,据惠普实验室的研究主管刘伟透露:6个惠普中国实验室的研究人员正与他们的美国同事通力合作。他们也和中国顶级大学的计算机科学家一起编写用于迁移海量数据的软件,其中的运算规则可以在处理器中更加平均地分配计算任务。
灵活的数据仓库
经过又两年的开发工作后,惠普拥有了第一位还没有宣布的客户——零售商邦顿商店(Bon-Ton Stores), 这家公司拥有272家百货商店和7家家具店,遍布美国23个州,目前他们用一个64位处理器、7TB的Neoview系统进行商品分析和营销。邦顿商店从上个世纪80年代中期开始就采用Nonstop处理系统,并在该系统上运行数据仓库达10年之久,这个数据仓库被邦顿商店的CIO吉姆·兰斯(Jim Lance)称为第一代数据仓库。当惠普将邦顿商店的数据分析工作在Neoview上运行后,反应速度是原来的13倍。兰斯表示:“这一点让我们决定采用Neoview。”
邦顿商店新的数据仓库包括商品数据、客户数据以及供应商数据,其他公司也已经开始测试Neoview。惠普表示在几个星期后将宣布一些新客户的名单。
按照惠普的观点,数据仓库之所以不再被业界期待是因为这项技术曾经一度昂贵、不开放并且只能支持部分业务,它并不能支持整个公司的所有数据。但Neoview将不同于以往的数据库,因为Neoview服务器采用英特尔制造的面向安腾架构的处理器,他们是设计方面的工业标准。而且惠普改造后的Nonstop软件非常灵活:它可以同时用来处理实时数据和存档数据。这个所谓的混合工作是在Nonstop可靠的并行处理架构上运行的,它最大的好处是提供可扩展性和99.999%的可用性。
在得克萨斯州的奥斯汀,有一幢毫不显眼的惠普大厦,曾经是Tandem的工厂,现在成了惠普公司销售、市场以及技术人员(包括前Tandem公司和康柏公司的雇员)的办公楼。就在这幢楼的一间会议室里,莫特透露了惠普企业内部数据仓库背后的战略意图。在办公楼的隔壁,一个12.5,万平方英尺的数据中心已接近竣工。莫特说,来自CEO的一个意想不到的不满是建立数据仓库的推动力。赫德无法从分散的750多个数据中心获得惠普全球运行情况的精确信息,这一点对于CEO来说是失败的。莫特表示:“公司并不缺少数据,缺少的是来自不同业务部门的协调一致的、及时的数据。”
根据莫特的经验,一个企业数据仓库是解决这一问题的办法。从部署速度上考虑的话,Teradata系统是一个便捷的选择。他所帮助建立的沃尔玛Teradata数据仓库被其他公司所称羡,这个数据仓库目前已经有570TB的数据量。莫特说惠普曾经考虑建立Teradata的数据仓库,并将此项目作为两家公司一起走向市场的一次合作。
但是惠普的工程师们已经为NonStop开发了数据仓库的功能,莫特需要给这个项目展示的机会,并且如果惠普自有的技术已经准备推广应用的话,就必须快速做出决定。2005年的最后4个月,他的团队一直在实验室进行系统压力测试。基于安腾架构的NonStop系统的测试结果让莫特非常满意。6个月后,也就是2006年5月,惠普启动了内部数据仓库的大规模建设工程。此后不久,Neoview作为一个商业产品迅速投放市场。