□实习生 陆洋 本报记者 黄辛
“过去,计算机以计算为中心,而近几年,国内外专家都意识到了数据的重要性,认为新的科学时代已经到来,即从海量数据中寻找科学规律。”
在近日举行的第183期主题为“海量数据处理——新型信息服务和科学研究的基石”东方科技论坛上,中国科学院院士、华东师范大学软件学院院长何积丰这样说道。
要从海量数据中寻找科学规律,需要海量数据的处理技术支持。何积丰对此表示:“通过参加的一些项目,我发现目前我国对收集海量数据还有些办法,但对处理海量数据基本没有办法。”
他说,现在物联网很热,很多城市提出由“数字海洋变成智慧海洋”等概念,其中就涉及到海量数据的收集和处理技术。当深入探究如何处理数据时,我们能做的无非是将数据收集到数据库里,而收集之后却大多不知如何处理。
何积丰担心如此大量的数据都被收集到数据库里,却不对其进行处理,不仅不能发挥作用,反而会成为新的负担。因此他提出疑问:“到底收集来的数据是为何种对象服务?如果是想做信息服务,那么,应该是做哪类信息服务?应当如何去做?”
他举例说,上海为了建立智能城市,今年提出建立上海市老百姓健康档案。目前上海户籍人口加流动人口一共两千三百多万,数据庞大,收集后也很有用。但是有些医生们对这个数据库却不看好。他们表示不知如何处理这么大的数据量,而且,他们更需要患有疑难病症病人的信息。
因此,由中科院上海高等研究院出面,民间自发地组织收集疑难病症病人的信息,再由医生对数据进行挖掘,希望给病人提供指导。对此,何积丰认为:“海量数据收集和处理的目标应该是信息服务,若没有服务,收集也无用。”
何积丰也指出,在物联网运行环境中,目前对海量数据的实施、加工和处理仍存在困难。他期盼有好的处理方法,但更强调这个办法应该耗资低且性价比高,若信息服务成本很高,老百姓是不会用的。他表示,目前科学家对信息服务中的经济指标关注较少,这个问题有可能成为未来信息服务的一个瓶颈。
《科学时报》 (2011-10-17 A1 要闻)