什么机器学习从业者可以从数据仓库中学习
作为一个大数据平台,企业正在使用Cloudera来了解大量数据,以在业务的各个方面产生洞察,例如客户偏好和制造效率。
最近,公司 - 由Facebook,雅虎和谷歌的工程师建立在2008年 - 通过形成三个业务单位,更深入地推入机器学习,该公司将重点关注其新兴的业务 - 机器学习,分析和云。
Cloudera对机器学习的高度焦点并不令人惊讶,因为机器学习算法的功效只与可用数据一样好。这就是数据仓库的位置,它清理并将来自多个来源的数据聚集在一个系统上,进来。
“数据仓库在过去的20年里已经进化了很多 - 这是一个团队运动,没有人认为在桌面上做到这一点,因为您需要公司的所有数据,”新兴业务高级副总裁Charles Zedlewski表示Cloudera。
“另一方面,机器学习是一项史的辛西运动,才能大约八年前开始起飞。在金融服务和营销行业中,有有限数量的从业者。“
机器学习和数据仓库团队模型的方式也有所不同,说Zedlewski表示,前者更喜欢“奉承”型号,而后者通常使用大量建模的数据。
所以,机器学习和数据仓库至少有一个共同点,这是商业智能的核心方面(BI) - 机器学习和数据仓库团队都专注于使用相同的数据来收集到Gren Business Insights。
“他们从相同的数据集中运行,可以不同地组织数据,但双方都希望了解他们的客户和运营,管理成本和较低的风险,”Zedlewski表示,如果可以存储相同的数据,这两个团队会受益,在共享环境中担保和管辖。
他说,机器学习专家还将从数据仓库中学到几十年来的数据仓库和毕业方面。
机器学习中数据管理的某些方面已经来自数据仓库世界,但Zedlewski表示,机器学习从业者可以从传统的软件开发生命周期中占用叶子。
“我们并不试图将机器学习从业者转变为软件开发人员,”他说。“但对于五年前的大多数客户来说,没有作为生产模型的源头控制,这是一天推动数千个决定的生产模型。”
随着机器学习应用程序的数量增加,Zedlewski表示,“这将使共享平台和团队 - 体育方法在一个与10年前相比的共享环境中。
同时,机器学习也在数据仓库中应用。在Next'18,Google宣布了BigQuery ML服务,使数据科学家和分析师能够使用SQL语句直接在其BigQuery数据仓库内直接在大规模的,结构化或半结构化数据集上构建和部署机器学习模型。
这意味着它们可以执行预测分析,例如预测销售和创建源头的客户群,在那里他们已经存储了数据,而无需将数据移出数据仓库以开发和培训机器学习模型。
更重要的是,BigQuery ML有可能将机器学习的使用扩展到数据分析师,他们与数据科学家不同,可能无法参加R和Python等编程语言,通常用于构建机器学习模型。
下一步
监督VS.无监督学习:在商业中使用