数据挖掘

2 文章

大数据令人恐惧的一面

滥用大数据将会让你最可怕的梦魇成真,除此之外,等待着你的还将是永无止境的政府监控、保险代理的”独裁”以及老板的”专制”。不管你喜欢与否,潘多拉盒已经打开—我们也已进入了数字监控时代。 保护你冰箱的隐私 保险代理会购买你的信用卡记录。他想知道你是否经常吃快餐、订阅了哪些杂志以及买过哪些处方药。 分析人员也需要通过你的购物行为来评估你是否是拥有良好理财习惯的客户。那些喜欢吃炸薯条的”问题”客户,他们的人寿保险费率很可能会提高,甚至还可能被保险公司拒之门外。因此如果你想保护’冰箱习惯’隐私的话,可以考虑用现金购买食品。 社交网络账号也是另一个重要个人信息的来源,而这往往是用户自愿公布的。就这一点而言,Facebook健康文摘的忠实读者们似乎更容易受到保险公司的青眯,而那些热衷于前往Buffalo Wild Wings就餐的单身汉将可能成为保险公司的弃儿。因此,正确配置Facebook的隐私设置不失为一个好主意 。 与银行间的亲密关系… 银行同样乐意加入保险公司的行列以获取个人数据。你想贷款吗?银行通过对客户消费行为分析,了解他们的消费倾向:是将钱肆意挥霍在度假中还是更愿意用来购买高档品牌。银行想要了解你的程度胜过你的老妈。 银行向客户”强加的关系”可能会导致实实在在的财务后果:一旦银行认定你有花费超支的倾向,就可能会提高你的贷款利率。被归入’不可靠’清单的客户可能从未从银行贷款或享受过类似的服务,原因很简单,银行也从未向他们发过任何贷款产品的广告。 令人遗憾的是,由于银行拒绝向那些’默认’不可能获得贷款服务的客户放贷,银行此举也进一步加剧了贫富差距。 大数据下的职场生涯:美梦还是噩梦? 你可能正在遭受老板的监视:有一种软件可以让你的老板知道你是否有离职的打算,有时甚至连你都不知道自己有这个打算。此类程序能够预测哪些员工最有可能超预算消费。除此之外,数据分析还能找出那些拥有三个或以上社交网站账号以及使用默认浏览器更频繁地换工作的人(还有其它许多类似的观察数值)。 尽管整个理念听上去有些毛骨悚然,但有些公司的确已开始使用大数据做一些雇佣和晋升方面的决策。至于能预测你未来决定的软件—是不是有点像《少数派报告》中开头的场景? 此类程序标榜不含任何人类的偏见;但的的确确又是由人编写的。人类,本来就是存在偏见又容易犯错的生物。此前,就曾发生过因此类程序发出错误指示而拒绝优秀应聘者的案例。 小心,大数据下的营销! 营销领域在使用数据挖掘技术时同样难免出现错误。前几年,营销领域的一些失误常见于各大新闻报刊,因此也大众所了解。 OfficeMax就曾犯了个大错,该公司在寄给一名客户优惠券的信封上竟然赫然印有寄给”Mike Seay,女儿在车祸中丧生”的字样。大约在一年前,这名客户年仅17岁的女儿和她的男朋友在一场车祸中不幸身亡。我们无法确定的是,公司在客户个人资料中保存这一敏感个人信息的目的到底是什么。 名声不佳的Target营销活动让人们不禁展开对”营销与个人隐私”话题的讨论,事情的起因是大型零售商Target在一名少女告诉家人自己怀孕之前透露了这个消息。该公司因为向少女寄送婴儿床和衣服的优惠券,使得她的父亲(也是未来的外公)意外获知了这一消息。 在这个事件后,Target营销活动开始变得隐秘起来,并决定向客户寄送各种优惠券以掩饰他们的’无所不能的超能力’。 “我们发现只要怀孕女性觉得自己没有被暗中监视,就会使用这些优惠券。她只要确保在她居住街区的每个人都收到了相同的尿布和婴儿床优惠券。只要我们没有特意发给她,就不会有问题。” —Target向《福布斯》杂志说道。 是否’较隐晦’的暗中营销就比”明目张胆”来得更好呢?可能会有助于缓解你的紧张情绪,但在现实中要想隐藏通过精确数据挖掘得到的信息几乎不可能。普林斯顿大学副教授Janet Vertesi和她的男友曾试图隐藏自己怀孕的消息,但结果证明这并不容易。 他们在线浏览婴儿产品时只使用洋葱路由;他们还要求朋友和家人不要将自己怀孕的消息发布到Facebook和其它社交媒体平台上,并且尽可能只用现金购物。最后Vertesi在总结过去几个月自己为隐藏怀孕事实所做的一切时表示:”你必须得像毒贩一样暗中交易。”太可怕了! 保护客户数据…你在开玩笑吗? 所有这些贪婪的数据收集公司从而考虑过太多的安全问题。许多黑客可以不费吹灰之力就成功入侵这些系统。 有时这样的事件看上去非常愚蠢。到后来则是见怪不怪了。金融服务提供商Money

十大意想不到的大数据项目

现在很多人都在谈论大数据,它既有优点也有缺点,同时也潜力巨大,这也让我们不禁想搜寻并向读者介绍全世界各地的大数据项目。在本文中,你将能了解到那些使用目的各异,且不乏严肃、有趣甚至令人惊讶的大数据使用案例。接下来就让我们共同赏析一番吧! 那么,大数据能帮助我们… #1.从互联网上精确搜索想要的内容 可能你从未想到过Goole、雅虎、Yandex、必应以及其他搜索引擎正是利用大数据来挑选你搜索查询的结果,事实上他们就是这么做的。 搜索引擎需要处理数以万亿的网络对象并分析数十亿人的在线行为,从而精确了解他们的搜寻内容。这些科技巨头自然在许多领域成为了数据分析的先驱者,并推出了大量与大数据相关的产品。 #2.畅行都市,远离交通拥堵 例如,Yandex公司在不断增强其数据分析技术的同时,决定从换个角度来使用他们的数据。这最终使Yandex.Traffic解决方案孕育而生。该技术能够对不同来源的信息进行分析,继而在城市地图上实时显示交通状况。 #3. 拯救濒危动物,抓捕偷猎者 偷猎者对于濒临灭绝的孟加拉虎的盗猎可谓屡禁不止,这主要是因为一些迷信的中国人认为它们的骨头有药用的价值。这些偷猎者对于孟加拉虎栖息地每一处的地形都了如指掌,因此执法人员很难抓到他们,但却可以借助…大数据。 #4. 让我们的城市变得更加环保 纽约市由于一些古树年代久远且缺少照料,时常会倒下砸落到市民头上或造成财产损失,有关部门因此而焦头烂额。现在,大数据将教会他们如何保护”城市森林”。 #5. 了解印度料理为何如此独一无二 科学家通过对大量食谱进行研究后发现在全世界各国的料理中,食材搭配都非常好—除了印度料理以外。 #6. 在非洲与疟疾流行病作斗争 由Google资助的一项大型项目通过利用大数据技术来解决全球健康问题。许多即使居住在偏远地区的非洲人都拥有自己的手机。他们可以通过文本数据发布他们服用药物情况,从而使科学家能够追踪疾病的传播范围以及治疗方法。 #7. 种出理想的圣诞树 科学家通过连接超过15个大型种植数据库的基因、物理和环境数据,从而研发出能够种出更好的农作物、植物以及理想圣诞树的工具。 #8. 了解我们的语言充满了幸福感 事实证明,全球各地语言所含的积极正面的词汇数量要多于消极负面的词汇,且会让人感觉幸福。 #9. 让体育比赛变得更加富有乐趣 职业体育教练利用大数据来制定战术、训练球员以及设计合理的食谱,甚至与体育迷之间的互动都能让运动员在赛场上发挥出更好的水平。 #10. 改善工作条件