Google Sheets探索:正在进行的工作
将理解您数据的自然语言问题的电子表格软件肯定是一个很酷的概念。Microsoft Power Bi“S云服务 - 其分析平台,而不是Excel - 已经提供了这一段时间的这种功能,但将其缩小为电子表格将其置于更多潜在用户之前。
我一直在拍摄谷歌表今天下午探索试驾。第一个想法?它得到了很多潜力,但目前我“D的小心”你不依赖于它以与同样的方式理解你的意思,例如,谷歌搜索有时可以打算你想要的东西,即使你是你想要的错了一个词。
在这里为什么。谷歌在其博客文章中使用的样本问题之一是“销售价格的三个项目是什么?”这是一个很清楚的问题和一个相当简单的回应:返回最大销售价格的三个项目。
但是如果您的电子表格也有窗户,并且您希望每个类别中最多的物品?我试图找出类似的东西,使用一个月的商业航空公司航班,抵达波士顿的一个月的商业航空公司。当我在询问航空公司前三次延迟的问题中,我完全得到了三次最延迟的航班(以及哪些航空公司对每个航空公司负责)。键入“航空公司”未分组的三个ARR_DELAY是什么“DIDN”的工作。也没有“每个航空公司的前三个Arr_delay是什么?”
当我问“航空公司的平均Arr_delay是什么时候”时,我收到了适当的回应。“平均ARR_DELAY”也工作。但是,“航空公司的中位数Arr_delay是什么”返回所有航班的中位数。这种情况奇怪的行为不一致,特别是因为Google Sheets枢转表可以按组计算中位数。对于那些希望探索的人来说是一种简单的方式,无论只要想要枢轴表,平台至少还有那里的平台就会出现自然语言。
接下来:按组计数。“每个航空公司的计数”给了我电子表格中的总行数。如果我在“航空公司”中键入,我已经“是什么是航空公司的计数”,我收到了数据中独特的航空公司列表。
这是一个不可能的要求吗?不,事实证明,“航空公司的分销”是获得由航空公司组合的计数的正确短语。(“航空公司分布”但是,无法理解。)“通过航空公司的[其他栏目]的数量”也最终让我为每个航空公司提供了记录的计数。
我“LL是第一个承认”“我选择的变量”分布“比创建一个新的枢轴表更容易记住。但如果探索真的被设计为“自然语言”,而不是需要特定语法的简化SQL,它需要更好的理解。
要公平,Power BI在了解我的查询时具有类似的问题,尽管有时似乎在发展问题的同时提供更多的指导。作为BI工具,它有一些其他优点,例如自然语言请求进行可视化 - 您可以要求它生成结果图。Google Sheets探索提供一些数据的自动可视化,您可以轻松地将这些电子表格添加到电子表格中,单击。但据我所知,如果可视化是在自动探索中生成的,那就有人要求它让你成为一个。
但回来探索“自然语言能力”。使用此新功能的最佳提示之一是在答案文本中仔细查找,该文本仅在您的问题和高于您的结果下显示。它将告诉您如何将您的问题解释为您的问题,例如“航空公司的Dep_delay的平均值”如果您要求它“是什么是航空公司Dep_delay的意思?”这可能是确保你所要求的东西的最佳方式也是什么表格所理解的。