火花峰会17:Databricks推出Delta作为纯粹的数据湖
AT&T,IBM团队在虚拟网络上的Flexware上
私人瑞士银行朱利叶斯巴默与云小时节省100万美元
比赛是为了建造一个5G业务案例,说BT CEO
Pal-V在北美打开了第一所飞行汽车学校
高速公路英格兰奖励电信服务合同TELENT
更快,更长的蓝牙5即将到达设备
弗雷泽的房子滚动了由MicroStrategy提供动力的下一代BI
加州大学与HCL的关系很复杂
研究人员表示,英国必须在工作场所使用新技术来逆转生产力问题
CIO采访:Adam Warne,Ao.com在黑色星期五
福特购买乘车共享服务,并提供自行车共享服务
巴克莱银行停止向新用户提供卡巴斯基软件
数字转型之旅 - 四个IT领导者分享了学习的经验教训
Tesla的Elon Musk为什么“零死亡”评论非常重要
U.S.限制了平面上的Galaxy Note7手机
小提琴从灰烬升起2018年计划的新产品
可以解决网络安全技能短缺,说(ISC)2
移动到EVS;氢燃料电池车可能很快通过你
英国政府责备朝鲜的崇拜网络攻击
花旗集团通过制造更简单的储存来降低成本
2017年十大公共部门IT故事
政府5G投资必须解决推出以及研发
迪拜医院实现智能通信系统,以改善患者护理
三星释放世界上最快的牙龈SSD
法院在三星案中恢复苹果120米的专利奖
Mingis关于Tech:iPhone 7,Apple Watch 2 - 和Gadget Guy!
新的东西来到PC行业:生长
Salesforce使用Chatbot Building Tools在Microsoft拍摄了另一个摇摆
保险经纪人只是商业沟渠遗留MPLS为SD-WAN
Ioactive警告海上通信系统中的安全缺陷
潜在的Apple Watch Snooping:一个不那么偏执的赛支队的风险
Max Schrems Champions Ngo为GDPR获得了争夺
数据违反了建立信任的机会
TLS 1.3通过CloudFlare获得早期采用
报告发现,超过40%的营销人员们觉得他们的业务尚未为GDPR提供准备
IBM的IOT区块链服务已准备好滚动
加拿大的CGI在2017年的英国政府合同中取代了英国政府
Oracle也进入了Chatbot Revolution
北欧财务看门狗在银行的反洗钱系统耐心失去耐心
微服务是关于组织变革的
Marks和Spencer Eyes£30米年度从数字第一零售推动的年度成本节省
雪佛兰螺栓范围从水中吹掉其他电源
CIO采访:Juan Perez,Cio,UPS
屋顶太阳能安装价格降落回收后的时间
欧盟隐私看门狗对雅虎的秘密电子邮件扫描有疑问
HMRC IT系统崩溃,因为客户试图填写税收申报表
Microsoft指向Windows 10 Mobile的转换为64位
欧盟计划为所有人提供免费Wi-Fi
Splunk Ups机器学习赌注
您的位置:首页 >论坛 > 电子业界 >

火花峰会17:Databricks推出Delta作为纯粹的数据湖

2021-07-23 12:44:26 [来源]:

DataBroks,Apache Spark处理平台的Inventor和商业分销商宣布,该系统称为Delta,它认为将为CIOS作为数据湖,数据仓库和“流入口系统”。据说据说消除了提取,变换和负载(ETL)过程的需要。

供应商的首席执行官和联合创始人Ali Ghodsi在都柏林的Spark Oumit发布了公告。

Databricks Delta将成为在云中运行的供应商统一分析平台的组件。Databricks在一个与Delta的声明中表示,“企业组织不再需要跨各种系统运行的复杂,脆性提取,转换和加载过程,并创建高延迟以获取对相关的业务关键数据的访问。”

Ghodsi说:在与计算机周刊上的会议的采访中说:“Delta基本上是一个具有数据仓库能力的数据湖。它还将额外的“控制”信息存储在系统中的数据 - 有关数据本身的统计信息。

“这对于开始询问数据的问题时,这可能很有用。它使得分析更快。我们还验证了数据进入数据湖时的数据是正确的。否则,您将未来存储问题。例如,如果摄氏度值改变为华氏度[在数据存储中]。“

Ghodsi表示,该公司开始在一年和半前工作的三角洲,以应对处理多个数据仓库和数据湖泊的客户问题。

“我们创造了Spark以简化这些东西,发现我们没有。我们的客户告诉我们他们的数据仓库是表演,但昂贵的。他们的数据湖泊充满了垃圾。所以,我们回到了绘图板,而不是继续逐步修补东西,“他说。

在发布会议的声明中,他说:“Delta将数据仓库的可靠性和性能与流系统的数据湖泊和低延迟相结合。借助本统一管理系统,企业现在受益于简化的数据架构,查询性能增加到100倍,并更快地访问相关数据。“

在同一声明中,我们汽车购物网站Edmunds.com技术执行主任Greg Rokita表示:“获得实时客户和收入洞察对我们的业务至关重要。但我们一直以复杂的ETL处理挑战,这会减慢我们对数据的访问。

“Delta允许我们通过将数据仓库的性能与数据湖的规模和成本效率混合来克服此障碍,”罗基塔添加。

柏林旅游旅游信息网站GetyourGuide的数据平台的工程经理Yonatan Aharon与计算机周期,Yonatan Aharon说:“对我来说,Delta将是一个使用Spark和DataBricks的数据仓库。

“在数据湖中,数据通常不洁净和非结构化。我们希望为您的业务用户提供干净,结构化和快速执行的数据。这将是一个巨大的一步,“哈隆说。目前,GetyourGuide仍在使用Postgres数据库进行数据仓库。

据说Delta允许“统一的数据管理系统[该]简化了流水线,允许用作数据源和接收器”,以及“自动化小文件的压实以获得高效读取”和“智能数据跳跃”和索引“。

该系统将其所有数据存储在Amazon S3中,该公司表示可以通过标准的Spark应用程序编程接口(API)从DataBricks平台上运行的任何Spark应用程序访问它。

根据Databricks的说法,Delta还集成到DataBricks企业安全模型中,包括细胞级访问控制,审计和符合HIPAA的处理。然后将数据存储在客户自己的云存储帐户内“最大控制”。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。