AI战斗正在升级:这是IT巨头的下一步
人工智能是竞争中的竞争,微软和谷歌在5月份的各自开发人员会议,建立和I / O中的企业的强大,始终可用的AI工具。
它不仅仅是关于工作:AI软件现在可以比任何人更好地播放国际象棋,去,以及一些复古的视频游戏 - 甚至比我们许多人更好地开车。由于应用数十年的AI研究 - 越来越多,在构建和I / O,越来越多的研究,这些超人的表演虽然狭窄的领域,尽量狭窄的领域。
与此同时,像苹果公司Siri,微软“Sira,亚马逊的Alexa和三星电子等虚拟助手一样的AI动力语音技术”Bixby“可以提供不满的性能,但它们也需要较少的力量超级计算机运行。企业可以涉及这些边缘,例如开发允许亚马逊回声所有者与公司互动的Alexa“技能”,而无需拨打其呼叫中心,或者使用基于各种基于云的语音识别和文本 - 演讲“-AS-A-Service”产品,以开发自己的全方位自动呼叫中心。
AI的一些最早的工作试图以计算机可以处理的形式明确地模拟世界的人类知识,如果实际上没有理解,那么如果实际上没有理解。这导致了基于文本的“专家系统”的商业化。那些早期的系统并没有通过他们的专业知识来实现人类所做的方式,在他们的职业生涯的过程中学习。相反,在采访其他人类的人类艰苦的过程中,这种经验是勺子 - 喂给他们,并将其隐性知识蒸馏成明确的规则。
近年来AI研究中最大的进展情况,以及最适用于企业,涉及从经验中学习的机器,以获得他们的知识和理解。机器学习的改进直接导致戏剧性的4-1击败了18次世界Go冠军李Sedol,由alphago是由谷歌“Seepmind子公司开发的程序。
机器学习开始创建神经网络 - 模拟神经细胞或神经元的计算模型,围绕我们的身体传输信息。我们的大脑含有大约1000亿神经元,每个神经元都连接到约1,000人。一个人工神经网络模拟这些单元的集合,每个单元都有自己的输入(传入数据)和输出(该数据对简单计算的结果)。将神经元组织成层,每层从前一个层次,并将其输出传递到下一个。当网络正确解决问题时,向正确预测答案的神经元的输出提供额外的重量,因此网络了解。
具有许多层的网络 - 所谓的深神经网络 - 可以更准确。它们也在计算上更昂贵 - 在他们的早期非常昂贵。他们从GPU的并行处理能力所节省了研究好奇,以前主要用于展示游戏,而不是玩它们。
晶体管正在为自己而做
这些进步正在为企业提供新的方法来处理他们的大数据问题 - 但在一定程度上创造必要的技术本身就是一个大数据问题。
我们的优势之一是我们可以从几个例子中学习,Google Engineering Director Ray Kurzweil在3月在CeBIT全球会议上告诉与会者。
“如果你的重要其他人或你的老板告诉你一次或两次,你可能真的从中学习,因此”是人类智慧的力量,“他说。
但在深度学习领域,“生活始于十亿示例的说法”,“他说。
换句话说,深神经网络等机器学习技术需要观察十亿次的任务,以便比人类更好地做到这一点。
找到有10亿的例子本身就是一个问题:alphano的开发人员通过人类玩家扮演的数千场比赛的互联网来挑选互联网,为他们的13层神经网络提供初步培训,但由于它变得更强大,因此采取了对抗其他版本本身的初始化游戏数据。
alphago画了两种类型的机器学习,赢得它的比赛。使用监督学习分析人类奥运会,其中输入数据被标记为响应神经网络应该学习 - 在这种情况下,播放这些动作导致胜利。
当alphago留下来对抗本身的另一种技术,被使用,称为强化学习。赢得比赛的目标仍然明确,但没有输入数据。alphago留下来生成和评估本身,使用第二个神经网络,其中神经元从与监督学习网络相同的加权开始,但逐渐被修改为Superhuman策略。
第三种技术,无监督的学习,在业务中有用,但在游戏中不太有用。在这种模式下,神经网络没有关于其目标的信息,但留下了探索自己设置的数据,将数据分组成类别并识别它们之间的链接。机器学习以这种方式变成了另一个分析工具:它可能会识别游戏可以以多种方式播放或结束,但它会使对人类主管做些什么的判断。
有充足的公司,大而小,为企业应用和服务提供了一些AI的建筑块。较小的公司往往专注于特定的任务或行业;在大图片上的较大较大,可以用于一般应用的工具。
衷心感谢涉及其Watson产品的宣传的阻碍,IBM是春天的第一家AI供应商之一 - 虽然它更喜欢“认知计算”一词。
Watson系列包括用于在文本数据中创建聊天机器人,发现模式和结构的工具,并从非结构化文本中提取知识。IBM还培训了其一些Watson服务与行业特定的信息,为用户提供了卫生保健,教育,金融服务,商业,营销和供应链业务的供应。
IBM及其合作伙伴可以帮助将这些与现有的业务流程集成,或者开发人员可以自行挖掘,因为大多数工具也可以在IBMSBluemix云服务门户上作为API。
认知也是微软的首选术语。在Microsoft认知服务品牌下,它为开发人员提供了将机器学习技术合并到自己的应用程序中的API。这些包括将语音转换为文本并理解其意图的工具;检测和纠正文本中的拼写错误;翻译语音和文本;并探索学术论文,作者和发布他们的期刊之间的关系。还有一个为建立聊天机器人的服务,并将其连接到Slack,Twitter,Office 365邮件和其他服务,称为机器人框架。Microsoft还提供一个开源工具包业务可以下载以使用自己的大规模数据集培训他们的深度学习系统。
在5月初的构建中,它提供了以前仅在预览中可用的服务的生产版本,包括面部标记API和自动内容主持人,可以批准或阻止文本,图像和视频,转发困难案例以供审查。还有一个新的自定义图像识别服务,该服务可以训练识别他们感兴趣的对象,例如工厂中使用的零件。
谷歌提供了许多机器学习技术,它是内部使用的,作为其Google云平台的一部分。该系统可用于专用于特定任务或可在您的数据上培训的空白板材培训,包括图像,文本和视频分析,语音识别和翻译。有一个用于从聊天机器人和呼叫中心中使用的文本提取情绪和含义的自然语言处理工具。即使是一个超专注的求职工具,也可以尝试根据他们的位置,资历和技能匹配职位空缺的求职者。
对于亚马逊Web服务,它允许企业为Alexa,亚马逊回声设备中嵌入的数字助理创建新的“技能”或语音控制应用程序,并提供了alexa“作为服务”背后的许多技术。其最新信息是作为服务的呼叫中心,亚马逊连接,每次通话和每分钟充电。这提供了与亚马逊的语音识别和理解服务的集成,允许业务创建更复杂的交互式语音响应(IVR)系统。
明天来了
这些服务都在生产中,但有很多其他人在翅膀中等待。
例如,微软已经邀请企业测试几种其他服务的“预览”版本。这些包括情感API图像分析工具,可以识别照片中面临的情感,为愤怒,蔑视,厌恶,恐惧,幸福,悲伤和惊喜分配相对概率。(你可以把它发送一个selfie来试用它。)该公司的语音工具的增强将允许企业将引擎调整到特定地区或环境(自定义语音服务),甚至识别扬声器。
一个名为QNA制造商提取的新工具从文本语料库中提取常见问题,并将它们作为聊天机器人的答案服务。到目前为止的结果有点迟钝,但这可能是源文本而不是QNA制造商的问题,这在所有可能性中尚未读过十亿常见问题解答来学习其艺术。
在Google“S Cloud Next”的17次会议上,旧金山于3月份会议,该公司推出了其云视频智能API的私人测试版测试,这将允许测试人员通过搜索描述内容的名词或动词来查找相关的视频剪辑。谷歌希望通过新的机器学习启动竞赛刺激其服务进一步的需求,它与风险投资公司数据集体和出现资本一起运行,并开设了加利福尼亚山景的高级解决方案实验室,客户可以工作与谷歌专家申请机器学习自己的问题。
两个月后,在Google I / O,该公司向移动电话的Tensorflow Lite平台显示了Tensorflow Lite平台,以及用于运行机器学习工作负载,云TPU(张量处理单元)的允许处理器。它还公布了它在内部使用的一些机器学习API的详细信息。
大公司不会对AI进行研究,但对合格人员的竞争激烈。Facebook拥有自己的内部AI研究专区,组织内部培训活动,以提高工作人员中机器学习的认识。
从事AI研究的一些最大的公司旨在愿意发布其结果,并在开源许可证下释放大部分代码。即使是臭名昭着的秘密苹果甚至在去年年底发布了第一个研究论文。
但他们“他们没有赠送冠珠宝。那些机器学习工具包和云服务都非常好,但明确表示未经培训的神经网络对典型企业视为一个16岁的高中辍学而有用。
经验计数,就像在招聘中一样,以及像谷歌,Facebook,亚马逊,甚至苹果和微软这样的公司正在收集Kurzweil谈到的数十亿的小例子。每个搜索结果都点击或购物推荐接受,每个照片标记或举办的体育评分被添加到集合中。
当然,可能并不总是必要的十亿示例:计算机可以学习几乎和人类更少的人类做一些事情,并且对于今天的许多任务,几乎可能是足够的,特别是如果计算机能够引用它可以对人类主管交易的情况。
就在你身边
在任何情况下,那就是建立AI动力聊天机器人的组织的许多组织都在依靠。它们的数据要点少于10亿数据点,但他们仍然希望像微软的QNA制造商那样的服务将帮助他们以新的方式为客户服务。
一个如此是关节炎研究英国,一个慈善组织,资助关节炎症的医学研究,并向患者提供建议。它正在使用IBM的Watson对话API来构建一个虚拟助手,该助理将回答有关关节疼痛的问题,并建议缓解症状的适当练习。
组织的目标是双重的:为了减少其现有电话支持人员的负载,并创建一个新的会话渠道,将来可能会提供其他服务。
助理已经学习了有关50个肌肉骨骼条件的常见问题的1,000个答案。
“我们将延长其能力,包括有关医疗和手术治疗以及适当课程的饮食的信息,”关节炎研究英国的通信竞选经理Shree Rajani表示。