甲骨文公司周三宣布推出新的OracleCloud Infrastructure DataScience Service,这是OracleCloud Infrastructure(O CI)的原生服务,旨在让数据科学家团队在机器学习模型的开发,部署和维护方面进行协作..
这本电子书基于最新的ZDNet/Tech Republic特性,研究了企业如何利用收集到的数据保持竞争力、节省资金、提高利润和推动数字转型。
阅读更多
随着甲骨文“第二代”云的足迹不断扩大,这项新服务旨在超越其他公有云供应商为数据科学家提供的服务,以及典型数据科学家工作流程带来的问题。
甲骨文产品开发、数据和人工智能服务的SVP对ZDNet说:“数据科学中的一个传统问题,我认为它仍然是几乎所有组织中通常看到的问题,那就是[数据科学家]实际上是各自为战,孤立地工作。 “这项服务的重点是使他们真正团结起来,进入一个协作的环境,使他们能够共同工作,并使各组织能够以不给数据科学家制造障碍的方式跟踪他们的工作。”
Pavlik说,为客户提供一个完整的数据科学平台是甲骨文云战略的“战略关键”部分。 他说,甲骨文已经拥有全球最大的SAAS业务之一,而且随着数据库客户向云端移动,它的势头也很强劲。
他说:“在这两种情况下,利用这些数据来推动业务决策,无论是在应用程序中还是在单个数据库中,都是客户试图做的第一件事。”
其他公共云供应商提供的工具旨在使数据科学更加协作-例如,谷歌引入了Kubeflow管道及其AIHub,以最大限度地扩大数据科学对一个组织的影响。
Pavlik认为,甲骨文的新服务突出了它对团队执行的关注。 首席数据官和首席信息官,他说,“正在努力,我如何使这些团队有效? 我如何对这些团队负责,如何确保我理解数据科学家正在构建他们能够实际利用的东西? 这些都是这里服务的组成部分。”
Pavlik说,新的服务关键功能可分为四个部分。 首先,它为数据探索、机器学习实验和模型训练提供了协作空间。
其次,它包括甲骨文所谓的“加速数据科学工具包”。 本机Python库提供多个关键功能,例如访问底层云资源,以及诸如高级可视化功能等生产力工具。 它还包括Oracle的自动ML功能,使数据科学家能够在很大程度上自动化模型选择和模型优化。
该工具包还包括模型解释能力,允许用户解释什么数据集和什么输入驱动模型的输出。 Pavlik说:“非常重要的是,要能够坦率地解释是什么促使这些进入商业领域,”但在严格的治理要求领域的受监管企业中,你必须能够解释为什么正在做出决定。
数据科学服务的第三个组成部分是一个模型目录,通过该目录,数据科学家可以向其他用户提供模型,包括其他数据科学家、业务分析师或应用程序开发人员。 Pavlik解释说:“任何人试图使用这些模型来驱动商业决策、报告或应用逻辑,都可以非常简单地消耗模型并将其集成到自己的上下文中,而不必具备机器学习方面的专门技能或知识。
最后,该服务提供模型部署到松散耦合的服务上下文中。 用户可以监控模型的有效性,并在不干扰应用程序或模型的消费者的情况下更新模型。
帕夫利克说:“这种松散耦合的模式是一种新兴的最佳做法,即如何管理机器学习模型的整个生命周期。”