人民网北京6月12日电 (记者朱传戈)今天上午,2014移动互联发展大会暨第五届中国手机应用开发者大会移动互联网蓝皮书分论坛在北京国际饭店举行。西北工业大学计算机学院教授郭斌出席论坛并就如何利用移动数据做科学研究表达了自己的看法。
郭斌认为,互联网是非常大的领域,单从计算机技术的角度来说就可以分为很多层次,包括终端、移动网络、各种各样的服务。我们知道大数据和移动互联网几乎是同步的,成为整个信息领域的热点话题,当这两个,移动互联网和大数据合在一块的时候就创造了更热的话题。移动互联网里大数据基本上可以分成大的两块,一部分是来自于在线的数据,这是他传统的互联网里延伸过来的数据,包括移动社交网络里,有微博、微信等等产生的大量数据,另一方面电子商务里也产生了很多数据。
那么利用这些数据可以做什么?比如专门针对微博,我们知道微博已经成为即时的媒体,每个人都可以随时随地的发布信息,这就给我们能够及时的了解社会的动态提供了非常好的途径。我们这块就做了这样的研究,就是如何从微博数据里及时的发现一些社会热点的事件,怎么能从数据里发现热点事件传播的模式和规律,然后挖掘出来。我们知道针对某一个事件网上会有很多的讨论,可能相对来说会有几十万条的讨论,如何方便我们读者或者其他的用户,能够很好的把事件的脉络以及发展规律进行很好的呈现,这也是我们做的另外的内容,我们希望把这样一些海量的数据给进行进一步的挖掘,发现一些关键信息,并且以一种比较合理的形式呈现给我们的用户,这是我们在线数据里的研究。
郭斌表示,当我们发现事件了,将来它会往哪发展,这个事件传播范围有多大,能不能对它进行相应的控制或者疏导,这是我们做的另外一个工作。我们根据历史上这个数据的特征进行分析,发现了不同的传播模式。关于移动互联网我认为是两个主要的数据来源,一个是在线的,一个是线下的,这个是传播互联网所没有的。什么叫线下的数据?我们针对的是现在移动手机或者是可穿戴设备里含有大量的传感器,比如说里面有GPS,比如说摄象头、麦克风等等,就是这样一些大量的传感器的使用,使得我们获得了更多的数据的来源,这些数据因为它是直接来自于人本身的,所以它对于用户的理解,对于它的偏好的发现是非常有帮助的,所以我们对于如何利用这样的数据,在个体层面是什么样的爱好等等做了研究。
我们对传统感知网络也有很多研究,现在大街上的摄象头等等,我们是做了很多布置的,但是已经布置的传感器相对来说是静态的,和我们人身上所携带的传感器来说,它的覆盖似乎有很大限制。我们如何把分散在用户身上的感知资源集合起来,来进行大规模的社会的感知,这方面我们也做了很多研究。比如现在大家对环境污染都比较感兴趣,传统的政府布置的传感器就十几、二十个点,布置成本比较高。但是如果我们利用每个人身上所携带的手机里的传感器来做这个事,就可以比传统感知方式获得更加多的信息。同时,我们也做了一些其他的手机里传感器的工作,比如利用手机里的摄象头可以拍照。我们现在研究,通过我们创建这样一个平台,让散布在街头上的信息都搜集起来,如果每个人都拍的话,就可以把这样的数据搜集起来,然后进一步进行分类和挖掘。通过创建这么一个平台,来供这个城市里的人们需要,这块就是移动互联网两个主要的数据来源,一个是在线,一个是线下,都可以支持我们开发很多我们所需要的应用。