马蜂窝数据造假 马蜂窝1800万条评论涉嫌造假
马蜂窝旅行网想必大家认识,为旅游爱好者提供攻略,如果你有旅行中的问题,上马蜂窝旅行网,就解决了。但是,近日,有一篇文章指“马蜂窝数据造假”,在网上引起热议!85%的点评不真实,涉嫌抄袭这起事件正在进一步发酵。
马蜂窝旅行网号称是“游消费指南”,而且,马蜂窝旅行网覆盖了200多个国家和地区,帮大家解决旅游的难题。不过,现在有媒体指责马蜂窝数据造假,刷爆朋友圈!
据乎睿数据团队介绍,他们制定了一个非常严格的“抄袭”标准。以餐饮为例,团队抓取了马蜂窝上116万家餐厅,并抽取了三分之一的样本,然后按照用户点评信息“一字不差的抄袭,才算抄袭,10句话中有一句不同,就不算抄袭”,且要“抄袭150个不同的大众点评账户”为评价标准。
最终,他们在马蜂窝上发现了7454个抄袭账号,平均每个账号从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评、1221万条酒店点评,占马蜂窝官网声称总点评数的85%。
据了解,马蜂窝近年来开展了电商直销业务,在APP上线了酒店、旅行商城频道,直接提供机票购买、旅游线路、酒店预订等消费路径。在当前的消费场景下,消费者习惯在下单前阅读真实点评作为消费参考。因此,马蜂窝的这种抄袭很有可能是为了吸引消费者下单。
这次,被自媒体指责2100万条点评中85%涉嫌造假,舆论风波中,马蜂窝这次选择了起诉该作者。双方争论的焦点主要在于马蜂窝平台数据涉嫌造假的比例多少,以及马蜂窝员工和官方是否知情并参与了其中。显然,马蜂窝否认官方参与,将其归结为第三方商家的违规。
刷点评和虚假游记攻略产业链
双方各执一词,究竟孰是孰非仍旧未知。不过此次风波也将OTA行业甚至UGC行业的数据造假问题放上台面,一方面是平台之间抓取数据的现象屡见不鲜;另一方面,新浪科技发现,OTA行业中刷点评和虚假游记攻略等已形成一条产业链,甚至明码标价:一个全新账号0.18元,抓取点评3元一条,原创点评4-5元一条,虚假游记低则50元一篇,高则300-500元一篇。
在自媒体“小声比比”的文章中,作者称在马蜂窝上发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评,1221万条酒店点评,占到马蜂窝官网声称总点评数的85%。
不过马蜂窝在官方声明中并未就这些关键数据进行正面回应,而是称马蜂窝的UGC内容数据中,游记和攻略占比78.91%,嗡嗡(旅行故事)占比7.92%,问答占比10.26%,点评内容在马蜂窝整体数据量中仅占比2.91%,涉嫌虚假点评的帐号数量在整体用户中的占比更是微乎其微,马蜂窝已对这部分帐号进行清理。
该自媒体作者梓泉认为,马蜂窝的回应中存在着偷换概念和避实就虚的问题。一是马蜂窝声明点评内容在马蜂窝整体数据量中仅占比2.91%,并未明确是点评的条数还是数据大小;二是马蜂窝称涉嫌虚假点评的帐号数量在整体用户中的占比很小,但这些占比较小的虚假账号却贡献了85%的点评。
除了双方的虚假数据比例问题的争论之外,马蜂窝员工和官方是否参与其中也是一个关键。
马蜂窝:不法商家的违规行为
在自媒体“小声比比”的第一篇文章中,梓泉指出这些大量搬运虚假点评的账号却有着马蜂窝的官方背景,比如“问答小班长”系列账号,明确标示为马蜂窝官方账号,而马蜂窝方面则认为这是不法商家的违规行为,是运营过程中存在的审查漏洞,并不存在马蜂窝员工有组织地抄袭。
不过马蜂窝并未解释为何有官方账号参与其中,自媒体文章的数据提供方乎睿数据在后来的声明中指出,掌握了一些接管抄袭账号的马蜂窝内部员工的信息,但由于涉及隐私一直没有提及。
马蜂窝方面称,马蜂窝一直严厉打击游记和问答中违规广告的行为,平均每周处理26000条违规广告信息,查封15000个违规帐号。新浪科技试图就马蜂窝方面处理违规信息的机制和此次事件中处理的违规信息数量进行采访,截止发稿前采访请求并未得到马蜂窝方面的回应。
在23日马蜂窝的“圣地巡礼”发布会上,马蜂窝联合创始人、CEO陈罡的情绪似乎并未受到近日数据风波的影响,他向媒体回应称,马蜂窝在餐饮等点评数据方面存在部分问题,但远没有外界所表述的那么夸大。马蜂窝已开始对相关问题进行整改,并重新梳理工作流程,堵住漏洞。陈罡还认为,自媒体的文章涉及大量明显抹黑行为,将交由法律判定。
对此,自媒体作者梓泉24日凌晨表示,目前正在积极准备应诉,“我们一切正常,相信法律会给出公正的裁决。”大家对于此事怎么看呢?