Shazam如何处理其数据储备
声音识别公司Shazam是许多人手机的主食,最常用于识别电视,收音机或夜晚的吸引人的背景音乐。
Shazam每天收集客户使用数据 - 但它如何处理此类大量信息?
许多人认为shazam是一个初创公司,但事实上它已经存在超过15年。与始终收集数据的其他公司一样,它拥有许多关于客户如何使用其应用程序的信息,但并未总是能够妥善使用此数据。
该品牌已采用Splunk通过分析消费者正在使用该应用程序来更使用数据。
“我们正坐在数据的宝库,其中一些非常酷,也处于社会,人口统计和文化层面,”Shazam的高级基础设施工程师“。
多年来,Shazam已作为应用程序提供,但需要分析大量数据并不总是如此压力。
Kammermann表示,2007年第一个iPhone的发布导致下载突然跳跃,并且使用该应用程序的人数随着智能手机而增加。
随着用户的增长,Shazam的数据要求也是如此,经过几年,它无法使用其传统基础设施继续处理和处理数据。
“这只是数据的规模,它也是我们想要更改正在生成的数据的方式,”Salekammermann。“我们想改变数据的格式,更改数据的结构和我们的旧IT系统只是无法应对变化率。“
Kammermann说Shazam的“传统的一级硬件供应商”和“传统的第一件硬件供应商”的原始组合在SQL上运行不够灵活,无法以与Shazam的数据相同的速度扩展。
“为了保持全天候运行,我们需要三个或更多人全职,我们需要为硬件和软件供应商支付大量资金以获得他们的支持,并确保它一直在运行, “ 他说。
以前的系统使用批处理在当天的各个点的大型转储中将数据加载到其数据库中,有时具有日期的处理时间,使得难以在实时查询数据。
没有能力制作ad-hoc查询,并且必须由工程团队开发对查询的任何更改。
Shazam于2011年开始采用Splunk,这需要两年时间来阐明其遗产系统。
使用Splunk Enterprise,Shazam可以在任何结构或格式中收集数据,并在不支持工程团队的情况下实时创建和运行新查询。
过渡到Splunk后,Shazam的遗留数据存储在亚马逊的AWS云存储服务中,但Kammermann说没有理由查询它。
现在和在应用程序的早期收集的数据卷如此不同,比较两者不会产生最准确的结果,并且许多使用比较最多只回去一年。
“一般来说,我们每周比较一周和一个月,因为这就是我们对我们感兴趣的,”Saleskammermann。
这些比较中的大多数用于评估用户对应用程序中的变化的反应,但这些见解也可用于确定消费者趋势。
Kammermann使用David Bowie作为一个例子。Shazam的数据显示更多的人在他去世后的“Shazaming”Bowie比以前在。
该公司还可以根据收到的歌曲的歌曲有多少歌曲,这家公司也可以预测。
kammermann说,Shazam还在零售环境中进行了零售环境中的数据,以充分利用应用程序和它可以收集的数据。
例如,该公司发现客户与正在玩“酷音乐”的商店拥有更积极的品牌。因此,在未来,沙扎姆希望与品牌合作以确定见解,例如客户在特定商店中的音乐后追求的洞察力,无论他们是否购买一些东西以及如何最好地将这些行为转化为利润。
“这是我们作为公司所做的那种东西,”Kammermann说。“我们与品牌和零售商与品牌和零售商一起参与其中,使其更有利可图。
“Shazam是一个神奇的应用程序,如果你想到它,你可以用很多。这就是让它如此特别,这就是为工作而言非常有趣的原因。我喜欢这些数据。我很享受。”
展示Shazam的一些新功能时,kammermann扮演了超声声,Shazam应用程序将其识别为与计算机每周与计算机会面的预编程指示器。
该应用程序还具有大量的电视广告,鼓励观众到Shazam用于广告中使用的歌曲作为交易或产品信息。
图像也可以通过应用程序识别,驾驶进一步的参与。“这一点是,我们不仅仅是一个音乐识别应用程序,”Saleskammermann。“我们认识到焦炭罐,麦当劳托盘等商品,ConcéNast的部分 - 你可以从杂志中摆脱杂志,它识别你的位置。”
未来,公司的目标是让用户Shazam他们想要的任何东西。但是要做到这一点,kammermann说,它可能必须成为其中许多零售商或品牌的默认应用程序,以利用潜在的交易或客户忠诚度。
他指出,大多数人在他们的智能手机上有最多50个应用程序,但定期使用其中10个。
“拥有自己的品牌应用程序或当今世界的任何应用程序的问题之一就是每个人都有有限的App Real Estate,”Saleskammann。“现在在开发自己的应用程序时,由于手机的房地产很难来,那么少点。”
在未来,品牌可以使用Shazam应用程序在不必开发自己的应用程序的情况下烹制产品信息或对消费者达成优惠,从而更容易与消费者互动。
“Shazam到处都是下载了数百万的时间,”Kammermann说。“我们可以利用,所以品牌不必生成自己的应用程序。如果你在街上出来,你想与品牌搞,你不必拿出你的手机,下载应用程序超过3G,等待两分钟,然后单击一个按钮。它已经通过shazam了。“
英国缺乏缺乏大数据技能,行业贸易机构技术英国预测目前的培训率不会符合预计将在未来五年内出现的预计157,000个额外的大数据角色。
Kammermann表示,具有数据知识的人是“难以通过”并补充说:“我们正在将数据作为产品销售,因此我们从识别特定歌曲来识别蓝牙信标,超音速射频或可乐可以。我们现在也在寻找数据。“
这增加了重点是数据意味着Shazam需要数据娴熟的员工,Kammermann所说的是一个“令人惊讶的挑战”。
但他说,这一愉快程度比在蝙蝠脱离蝙蝠的数据技能更重要,因为有工具可以帮助人们发现数据洞察力。
“处理数据的人不一定来自数据科学背景,”Kammermann说。“如果您有兴趣,您可以进行更改。”