<<返回上一页

按照他们写的方式揭开维基百科袜子木偶的面纱

发布时间:2017-05-01 07:01:01来源:未知点击:

作者:Gareth Morgan(图片来源:Chris Batson / Alamy)我很难相信你在维基百科上看到的东西一大堆虚假假帐户正在操纵在线百科全书的条目以获取金钱并损害网站的可信度上个月,维基百科宣布它已经封锁了大约250个“袜子傀儡”帐户 - 由用户设置的虚假帐户,这些帐户通常由公司支付,以编辑对他们有利的文章现在,阿拉巴马大学伯明翰分校的Ragib Hasan和他的同事已经开发出一种工具,可以分析文章的编写方式以及是否由同一个人编辑哈桑表示,维基百科编辑试图发现此类帐户的一大问题是,由于需要隐私,用户的IP地址只能由少数管理员访问因此,编辑必须依靠自己的经验来确定多个帐户是否实际上是一个人的工作 Hasan的团队想知道他们是否可以通过分析他们使用的语言来使用算法来揭示袜子木偶团队成员Thamar Solorio表示,在写作风格中发现相似性的挑战在于,在维基百科编辑中,与大多数社交媒体写作一样,这些文章很短,所以没有什么材料可以使用他们查看了超过600个维基百科的袜子傀儡调查的编辑说明这些被用作算法的训练材料,该算法扫描了写作的大约230个特征,例如语法怪癖该团队表明,该算法可以预测哪些帐户是傀儡帐户,准确率为75% - 定义为同意维基百科调查员的决定(arxiv.org/abs/1310.6772) “对于维基百科的编辑来说,袜子傀儡调查是非常耗时的,所以任何有助于减少工作量的事都应该受到欢迎,”哈桑说纽约康奈尔科技大学的Mor Naaman喜欢这个团队的工作,但他说这个算法需要变得更准确:“作者大多依赖语法特征,只使用其他一些语言标记,因此肯定有改进的余地”虚假账户问题只是困扰维基百科的最新问题它受到了批评,因为它的编辑主要是白人,西方男性和90%的男性,