基础:可视化表征社会
根据出席OPCs会议的精神 -“other people’s conferences”,会议所关注的不是人口/专业小组,而是你被邀请到哪里-我现在正在参加微软研究学院首脑会议。我不是一名计算机科学家,也不是大学教学人员,我也没有做过任何由微软资助的研究...,但是所有这一切却是那么合理和让人喜欢,因为这是非常有趣的聚会,旨在寻找在当前计算机研究领域中的研究课题,带着对于社会网络研究的关注和重视,一些事情是那样让我感兴趣。虽然我对于这个领域和研究主题没有做任何积极的研究工作。
对于社会网络研究的关注有助于解释我为什么现在坐在拥挤的会议室里,学习Excel软件的扩展功能。即使在微软的会议上, Excel的扩展功能通常也不会受到像现在这样的关注。但是,这个扩展功能 NetMap ,已经由马克史密斯(Marc A. Smith)开发,他是社会网络研究的先行者,他在微软研究院期间已经分析了社会网络同以前Usenet群组的关系,对此他已经做了大量的分析研究工作。
最近,马克大量的研究工作是关注那些寻找技术支持的Usenet新闻组中的行为模式。正如事实证明的,这些群体对于那些寻找技术支持的人来说仍然是非常重要的(即使是在今天的垃圾邮件盛行的情况下)以及微软在培养使用这些社会网络很感兴趣。史密斯和他的研究小组不再关心和分析Usenet中的内容(因为内容庞大,很难做到),相反地他们开始关心其中的结构。他们做了大量的网络绘图,用图来表征这些帖子和回复响应,并寻找其中出现的行为结构。目前至少有三种行为结构类型出现:回复或者答复别人——-这些人几乎从来没有发布过新的主题,而是回答大量毫无关系的人们的询问。在网络行为方面,他们有很高的付出和很低的回收度。这些人在基于技术的新闻组中是非常重要和必不可少的人,因为他们可以为新来者提供必要的支持和帮助。
获得回复和响应的人——有些人似乎有一种天分,或者说是技巧,因为他们发布的帖子或者话题总是能够获得别人的关注和回复。这种类型的人正好是回答别人的一个方面。他们不断地发布话题或者帖子,而其他人会给与回复。史密斯认为,在新闻组中大约有0.5 %的这种类型的人。这些人的发帖会获得新闻祖中30%的用户的大约30%的回复。基本上,这些人是该议题的专家,因为这些人有能力提名议题,比普通用户会获得更多的成功。
讨论人员——这些人既发布帖子,也回答帖子,他们长期而持续地同大多数人保持联系。他们是最基本而典型的讨论组成员,但他们要比我们设想的要普通的多。如果我们能够进一步细致地分析这些讨论类型,我们可以根据用户生活的生态系统来将其定义为不同的生态系统。当然很有可能,这些角色和作用会随时间而变化,到目前为止,马克观察到,大多数人似乎仍然保持在自己的角色中,但随着时间的推移减弱,他们变得越来越不活跃。这将是非常有趣的,看看是否有一些网络能够让人们在其中,随着时间推移而变得更加积极互动。(例如:facebook)
史密斯指出,当社会性媒体成为占主导地位的在线媒体时,我们将从匿名转到“实名”的互联网,网络中所创建的内容通常代表了一个真实的身份识别。因此,我们将会获得那些让人难以置信的数据集合,而这些数据正可以被社会科学家用来做研究。因为“所有的社会媒体都保持着联系”,而“我们的关系也不断地在进行自我记录。”在这里又出现了一些问题,随着数据越来越容易获得和发现,但是却很难对其已有意义的方式加以呈现和表征。史密斯指出,有一系列好用的Java工具包能够用来表证社会网络映射关系,但奇怪的是,在Excel中却没有这项功能。所以,他和他的团队成员建构了一个—— NetMap,可以在C odeplex下载,通过使用他们的工具,在E xcel中输入各种关系和数据,你就可以获得一个你想要的网络关系图。该工具与Windows集成整合到一起,提供了一个最酷的示范功能,该工具还会基于您使用电子邮件的交互数据,来检索出您的邮件索引一记图形化表征您的个人社会网络。如此,有一件事情将会变得非常清楚:你要想获得这些图片,你只需要一些非常简单的E xcel操作,而你却有可能获得一份可以以各种不同方式来加以表征的,能够表达最强烈的关系的可视化表征图。正如马克在他的谈话中所说,他的一个合作者从Digg中抽取一组数据,可以证明在Digg中并没有一个小型的,竞争的群体,他们紧紧局限在一个讨论话题上面。Digg中所有的应该是一个高度活跃的用户,他们针对不同的话题展开积极的讨论,这才是Digg的核心。
我期待着使用这个工具,但是目前有点失望的是,它目前只适用于Windows。我担心许多社会科学家可能正在使用其他的替代平台,我希望该项目的研究工作能够走出目前的研究空间和融入研究主流,它将会获得更广泛的支持。