机器学习+社交网络:你的很多小秘密就被读出来了业界

/ 网易科技报道 / 2017-03-29 15:38
据VentureBeat报道,当Cambridge Analytica等大数据公司宣称自己影响到2016年美国总统大选后,它们立刻成为媒体关注的重点。这些公司通过社交媒体贴文和第三方数据推断出用...

3月29日消息,据VentureBeat报道,当Cambridge Analytica等大数据公司宣称自己影响到2016年美国总统大选后,它们立刻成为媒体关注的重点。这些公司通过社交媒体贴文和第三方数据推断出用户的性格特征,并利用高度可操纵化的广告影响民意。利用购物习惯、杂志订阅、Facebook“点赞”以及其他高达5000项输入等大量数据,Cambridge Analytica等公司可以对美国2.2亿成年人的性格作出预测。

有了这些非常详细的“档案”,Cambridge Analytica就可以针对你的性格进行“行为微定位”。但是这家公司并非唯一这样做的机构。财富500强企业的品牌营销员、数字广告上以及各种各样的分析公司,都在通过分析社交媒体和公开贴文寻找影响消费者的更好机会。初步研究显示,针对消费者性格推出的广告,在Facebook上获得点击率高达63%。

如果你在Facebook或Twitter上非常活跃,你的社交媒体资料可能泄露你的很多信息,这些信息可被广告商利用。美国宾夕法尼亚大学计算机科学教授莱尔·昂加尔(Lyle Ungar)利用他的职业发展统计和机器学习方法从文本中提取洞见,重点关注你的Facebook和Twitter贴文,特别是与你的健康和福祉有关的内容。

经过对你社交媒体行为进行数年研究,昂加尔及其团队可以对你做出以下五项推测:

1.年龄和性别

女性来自金星,男性来自火星。当你分析男女在社交媒体上使用的语言时,这种区别就更加明显。女性更多使用情绪词汇、第一人称,更多提及心理和社交过程。而男性大量使用脏话和游戏术语,他们的占有欲更强,比如总会加上“我的妻子”、“我的女友”,女性则只使用丈夫或男友。

在自我表达过程中,男女在年龄方面的差异也很大。即使使用类似短语,也可以看出你是否足够“成熟”。昂加尔及其团队在MyPersonality项目中分析了7.5万份Facebook资料,才得出上诉结论。如果你觉得好奇,可以在昂加尔的网站(http://www.wwbp.org/agegender.html)上尝试下年龄或性别预测,看看其预测模型是否足够准确。

2.性格特征

麦尔斯-布瑞格斯性格类型指标(Myers-Briggs)可能很受欢迎,开放性、尽责性、外向性、宜人性以及神经质等五大性格特征,在预测中表现出更高的预测价值。但性格特征毕竟不是实物,你不可能精确到小数点后多少位。在最好的情况下,在进行实际预测时,研究人员会发现“弱阳性”和“负相关性”。

如果你想知道自己在神经质测试中得分多少,IPIP-300是可用到的更全面测试之一。你也可以使用昂加尔的社交媒体资料分析法。除了年龄和性别,性格特征在我们的语言表达中也截然不同。显然,外向性的人等不及参加派对,而内向性的人多沉迷于动漫、互联网以及游戏等。

即使个人资料中的照片选择,也会泄露我们的性格特征。性格非常开放的人更有可能选择艺术性和非正统性照片,而且这些照片都不是他们自己的面孔。他们也有更好的审美感,选择对比对、清晰度以及饱和度更高的照片。而尽责性的人则会做出相反的选择,他们通常张贴自己的正面照,而且只有脸部。外向性的人倾向于张贴自己与其他人的合影。

3.职业

如果你没有与职业社交网站LinkedIn上的人联系,你可能不会去看他们的资料和当前职位。事实证明,他们在Twitter上的公开发言也可能隐秘地揭示这个信息。这并不令人感到惊讶。高管们通常会写有关商业金融新闻方面的东西,而低级职员会用更多时间讨论个人兴趣爱好,而非与工作相关的主题。昂加尔的同事丹尼尔·彼得洛(Daniel Preotiuc-Pietro)及其团队能够通过分析Twitter上的用语,非常准确地分析出某人的职业。

4.自恋与精神变态者

通过社交媒体语言,你还可以发现令人毛骨悚然的东西。自恋者追求声望、地位以及其他人的艳羡,而精神变态者缺乏悔念、敏感性,对道德毫不关心。喜好权谋的人故意操纵和利用其他人实现自己的目标。这些人类行为的阴暗面可被合并称为“黑暗三弦”。正如预期的那样,精神变态者更多使用攻击性和暴力语言,比如杀戮、愤怒以及其他负面情绪用语。权谋者大量使用垃圾邮件和广告贴文。行为分析也可发现这些性格特征。自恋者更有可能发布涉及地理位置的推文,不太可能发布重复性贴文或标签,这显示他们对推文进行了精心策划。

5.死于心脏病的可能性

在2015年研究论文中,昂加尔及其团队描述了一种模式,只使用Twitter上的数据就能预测心脏病的死亡率,甚至比其他传统因素(包括人口、社会经济)与健康危险因素(比如吸烟、糖尿病、高血压以及肥胖)相结合的方法更准确。在人际关系恶劣和慢性压力下,心脏病会加重。昂加尔及其团队追踪反映负面社会交往、负面情绪(比如愤怒)以及脱离社会的语言,这些标志都是心血管疾病死亡的更精确预兆。

【来源:网易科技报道】



1. 遵循行业规范,任何转载的稿件都会明确标注作者和来源;2. 的原创文章,请转载时务必注明文章作者和"来源: ",不尊重原创的行为 或将追究责任;3.作者投稿可能会经 编辑修改或补充。


阅读延展



最新快报

1
3
Baidu
map