加入收藏 | 设为首页 | 会员中心 | 我要投稿 唐山站长网 (https://www.0315zz.com.cn/)- 数据安全、数据开发、文字识别、图像处理、媒体智能!
当前位置: 首页 > 站长资讯 > 评论 > 正文

正确人工智能数据存储的6个注意事项

发布时间:2021-03-16 14:07:39 所属栏目:评论 来源:互联网
导读:智能数据存储之前,企业必须考虑一系列基于机器学习平台如何获



智能数据存储之前,企业必须考虑一系列基于机器学习平台如何获取、处理和保留数据的需求。

首先,企业需要检查机器学习软件使用的数据的生命周期,因为这可以帮助企业了解为人工智能选择存储时应考虑的事项。最初,企业必须获取数据来训练机器学习或人工智能算法。这些是处理数据以学习任务的软件工具,例如识别对象、处理视频和跟踪运动。数据可以从多种来源产生,并且通常本质上是非结构化的,例如对象和文件。

人工智能的训练过程需要使用数据资产,并使用机器学习或人工智能软件创建算法,以处理未来的数据源。在训练或开发算法时,人工智能软件将处理源数据,以开发一个模型,该模型可以创建企业需要获得的洞察力或收益。

开发机器学习算法很少作为一个单一的过程来完成。随着企业积累新的数据,其算法得到了改进和完善。这意味着很少的数据被丢弃,相反,它会随着时间的推移而增长并重新处理。

购买人工智能数据存储的标准

在企业为人工智能平台选择存储之前,必须首先考虑以下注意事项:

1.成本。人工智能数据存储的成本是企业考虑的关键因素。显然,企业管理层和参与采购决策的管理人员都希望其存储尽可能具有成本效益,并且在许多情况下,这将影响企业的产品选择和策略。

2.可扩展性。在此需要强调收集、存储和处理大量数据以创建机器学习或人工智能模型的必要性。机器学习算法要求源数据呈指数增长,以实现精度的线性提高。创建可靠和准确的机器学习模型可能需要数百TB甚至PB的数据,而且这只会随着时间的推移而增加。

构建PB级存储系统通常意味着使用对象存储或横向扩展文件系统。现代对象存储当然可以解决人工智能工作负载的容量需求,但是它们可能无法满足其他标准,例如高性能。横向扩展文件系统可以提供高性能和良好的可扩展性,但是将整个数据集存储在单个平台上可能会很昂贵。由于可扩展性要求和大容量产品的成本,块存储通常不是机器学习或人工智能的正确选择,因为高容量产品的可扩展性要求和成本。这里唯一的例外是在公共云中。

存储成本的变化引入了分层或使用多种存储类型来存储数据的思想。例如,对象存储是存储大量非活动人工智能数据的良好目标。当需要处理数据时,可以将其移动到高性能文件存储集群或为高性能而设计的对象存储中的节点,并且在处理完成后可以

(编辑:唐山站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读