什么机器学习从业者可以从数据仓库中学习
谷歌将于今年晚些时候发货Soli姿态开发套件
四分之一的英国人希望他们的工作被技术取代
Yahoo Breach展示了国家赞助的黑客攻击
汗湿的贝蒂改造网站,以满足数字客户
Gartner索赔纯Play IAAS提供商可以被缺陷,因为企业态度成熟
三个犁276米进入5G准备
聪明的泰迪熊涉及有争议的数据泄露
HPE重新聚焦云上的技术服务组,大数据
不完整的可见性最佳安全性失败
'Candy-Bar'手机将获得智能手机功能,具有新的Qualcomm芯片
Mystery更新KB 3150513制作了另一种重新出现
手机银行木马达到历史新高
Marissa Mayer要求她的年度奖金分发给雅虎员工
'满足'谷歌的企业新的视频会议服务
修复文化以使数字取得成功
IBM的新Q程序包括一个50 Qubit量子计算机
缺乏DMARC电子邮件验证将品牌和客户面临风险
芬兰政府审查公共采购法
Twitter帐户被黑客攻击,推特计数器向前迈向罪魁祸首
只有11%的雇主在明年不期望技术技能短缺
Apple获取工作流程自动化应用程序,提供免费
英国公司的密码安全分数'平均'
Gartner建议CIO获得深度学习熟练
Techuk要求理事会建立数字委员会
苏格兰物业开发商挑选高压全光纤宽带
苏格兰的改进服务签署了飞行员数字身份平台
华为的P10相机手机比彩虹更具色彩
BlackBerry阅读三星Galaxy S7的更安全版本
马来西亚的金融部门达到云,但缺乏安全领导
便士使用私人邮件作为州长作为州长,帐户被黑客攻击
修复数据流动以获得最佳成功机会与S / 4 HANA成功
缩放的scala variant切割与JVM的关系
智能城市在移动世界大会中心
法规可能证明荷兰踏板车初创公司的制作或破坏方面
喜欢在PCS中,Microsoft和Arm在服务器中翻页英特尔
新的黑莓有一个物理键盘,将于4月到货
谷歌如何使用开源,集装箱和混合云来赢得企业
面对性别歧视,优步说埃里克持有人将调查
首席执行官罗宾斯将多云放在思科的业务中心
H-1B改革法案统一政治对立面
Carnival Corporation CEO表示,创新的多样性键
Telefonica-sigfox交易是不同的IoT网络的大胜金
Butlin警告潜在的个人数据违约
农村企业机构密封新的宽带协议
Peiceytics转变为推广产品的方式
我!5 Google的Android O预览的关键外来
假数据窃取购物网站的爆炸
Verizon计划今年11个城市的5G试用服务
数字部长表示,AI将在NHS中提高生产力
您的位置:首页 >论坛 > 移动互联 >

什么机器学习从业者可以从数据仓库中学习

2021-08-12 08:44:16 [来源]:

作为一个大数据平台,企业正在使用Cloudera来了解大量数据,以在业务的各个方面产生洞察,例如客户偏好和制造效率。

最近,公司 - 由Facebook,雅虎和谷歌的工程师建立在2008年 - 通过形成三个业务单位,更深入地推入机器学习,该公司将重点关注其新兴的业务 - 机器学习,分析和云。

Cloudera对机器学习的高度焦点并不令人惊讶,因为机器学习算法的功效只与可用数据一样好。这就是数据仓库的位置,它清理并将来自多个来源的数据聚集在一个系统上,进来。

“数据仓库在过去的20年里已经进化了很多 - 这是一个团队运动,没有人认为在桌面上做到这一点,因为您需要公司的所有数据,”新兴业务高级副总裁Charles Zedlewski表示Cloudera。

“另一方面,机器学习是一项史的辛西运动,才能大约八年前开始起飞。在金融服务和营销行业中,有有限数量的从业者。“

机器学习和数据仓库团队模型的方式也有所不同,说Zedlewski表示,前者更喜欢“奉承”型号,而后者通常使用大量建模的数据。

所以,机器学习和数据仓库至少有一个共同点,这是商业智能的核心方面(BI) - 机器学习和数据仓库团队都专注于使用相同的数据来收集到Gren Business Insights。

“他们从相同的数据集中运行,可以不同地组织数据,但双方都希望了解他们的客户和运营,管理成本和较低的风险,”Zedlewski表示,如果可以存储相同的数据,这两个团队会受益,在共享环境中担保和管辖。

他说,机器学习专家还将从数据仓库中学到几十年来的数据仓库和毕业方面。

机器学习中数据管理的某些方面已经来自数据仓库世界,但Zedlewski表示,机器学习从业者可以从传统的软件开发生命周期中占用叶子。

“我们并不试图将机器学习从业者转变为软件开发人员,”他说。“但对于五年前的大多数客户来说,没有作为生产模型的源头控制,这是一天推动数千个决定的生产模型。”

随着机器学习应用程序的数量增加,Zedlewski表示,“这将使共享平台和团队 - 体育方法在一个与10年前相比的共享环境中。

同时,机器学习也在数据仓库中应用。在Next'18,Google宣布了BigQuery ML服务,使数据科学家和分析师能够使用SQL语句直接在其BigQuery数据仓库内直接在大规模的,结构化或半结构化数据集上构建和部署机器学习模型。

这意味着它们可以执行预测分析,例如预测销售和创建源头的客户群,在那里他们已经存储了数据,而无需将数据移出数据仓库以开发和培训机器学习模型。

更重要的是,BigQuery ML有可能将机器学习的使用扩展到数据分析师,他们与数据科学家不同,可能无法参加R和Python等编程语言,通常用于构建机器学习模型。

下一步

监督VS.无监督学习:在商业中使用

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。