-
云数据仓库中的数据安全思虑
所属栏目:[大数据] 日期:2022-06-30 热度:50
近年来,由于云计算与云存储具有一定的廉价性和可扩展性,云数据仓库(Cloud data warehouses,CDW)得到了广泛的应用并飞速发展。同时,CDW不但能够存储比本地数据库更多的数据,而且可以通过现代化数据管道,简化了ETL的各种流程,因此许多企业都开始用它[详细]
-
终于有人把MPP大数据系统架构讲清楚了
所属栏目:[大数据] 日期:2022-06-30 热度:162
本文首先回顾并行硬件架构的发展,并进一步介绍基于并行硬件架构的数据库一体机系统与基于MPP架构的数据库软件系统。数据库一体机系统在银行等大型企业中采用广泛,一体机的优点是开箱即用、功能丰富、稳定、售后服务好,缺点是价格昂贵、扩展不灵活。基于普[详细]
-
数据科学家应对的几大挑战及解决方法
所属栏目:[大数据] 日期:2022-06-30 热度:77
每天,全球各地的组织都在寻找2.5万亿字节的数据,以获得对其业务的见解和价值驱动的行动。为了实现这一目标,需要高技能的科学专家或数据科学家参与开发业务中的企业AI。在不断增长的业务领域中,数据科学家的每一个行动都有助于改进业务的功能。 下面来探[详细]
-
使用Java和Python进行数据统计和剖析
所属栏目:[大数据] 日期:2022-06-30 热度:61
Java 和 Python 是当今最流行的两种计算机语言。两者都非常成熟,并提供了工具和技术生态系统,帮助我们解决数据科学领域出现的挑战性问题。每种语言都各有优势,我们要知道什么时候应该使用哪种工具,或者什么时候它们应该协同工作相互补充。 Python 是一种[详细]
-
云迁移之后 企业凭什么充分挖掘数据潜力
所属栏目:[大数据] 日期:2022-06-30 热度:135
近年来,基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)等业务模式正飞速发展,也推动着云投资屡创新高。根据GlobalData的报告,2024年亚太地区云计算市场规模预计将达到1918亿美元,2019至2024年期间的复合年增长率为7.7%。 然而,云迁移[详细]
-
字节跳动数据平台技术揭晓
所属栏目:[大数据] 日期:2022-06-30 热度:129
ClickHouse作为目前业内主流的列式存储数据库(DBMS)之一,拥有着同类型DBMS难以企及的查询速度。作为该领域中的后起之秀,ClickHouse已凭借其性能优势引领了业内新一轮分析型数据库的热潮。但随着企业业务数据量的不断扩大,在复杂query场景下,ClickHouse容[详细]
-
大规模分布式计算学习引擎Ray在字节跳动NLP场景下的践行
所属栏目:[大数据] 日期:2022-06-30 热度:82
RayRTC 是字节基础架构组与字节 AML 组共同合作,在内部 RTC(Realtime Text Classification)文本训练平台上基于 Ray 进行的下一代 Serverless ML 的探索。RTC 文本分类平台是一个一站式的 NLP 服务平台,包括了数据预处理,标注,模型训练,打分,评估,Au[详细]
-
远程访问装有GPU的电脑很不方便 如今有一个值得试试的办法
所属栏目:[大数据] 日期:2022-06-30 热度:177
由于多种原因,很多人无法将在本地存储了大量文件的电脑和软件带回家,好在有办法做到从任何地方发起高质量的远程访问,而无需额外费用。下面介绍几种经过测试的方法,实现方便地远程管理办公电脑。 DOC怎么了? 普通员工只需使用远程桌面协议(RDP协议)连[详细]
-
几款日常的开源无代码测试工具
所属栏目:[大数据] 日期:2022-06-30 热度:127
编程语言一直是自动化测试、自动化测试人员、框架甚至工作职责中不可或缺的一部分。如果一个遗留项目已经使用了Java进行测试,该公司会为该项目寻找具备Java专业知识的人员。同样,如果新项目需要从零开始构建测试流程,那么首要考虑的事情就是团队擅长哪种[详细]
-
Kafka 万亿级消息实践之资源组流量掉零故障排查分析
所属栏目:[大数据] 日期:2022-06-28 热度:141
Kafka 万亿级消息实践之资源组流量掉零故障排查分析: 一、Kafka 集群部署架构 为了让读者能与小编在后续的问题分析中有更好的共鸣,小编先与各位读者朋友对齐一下我们 Kafka 集群的部署架构及服务接入 Kafka 集群的流程。 为了避免超大集群我们按照业务维度[详细]
-
用Elastic Block Store EBS 改善性能和数据可用性
所属栏目:[大数据] 日期:2022-06-28 热度:117
如今,许多数据库即服务(DBaaS)解决方案将计算层和存储层分开来,比如包括Amazon Aurora和Google BigQuery。由于数据存储和数据复制可以由现有服务来处理,DBaaS无需担心这种复杂性,这种解决方案很有吸引力。然而,这种设计的性能有时可能不如传统方式:[详细]
-
大数据依赖不可取
所属栏目:[大数据] 日期:2022-06-28 热度:123
当下没有人会忽视大数据的重要作用。在生活的一切方面,大数据都潜在地发生着作用,特别是在管理层面,大数据已经成为重要的辅助工具。站在当前的角度来看,没有大数据,经济社会管理工作几乎就没有办法正常进行。 对传统统计数据的依靠和对现代大数据的依赖[详细]
-
区块链为大数据分析提供机会
所属栏目:[大数据] 日期:2022-06-28 热度:181
大数据能够获得实践应用并被各行各业青睐,最重要的原因还是大数据分析得出的结论具有指导意义,能够为行业决策提供数据统计基[详细]
-
技术迷途者指南 我有问题 你有解吗
所属栏目:[大数据] 日期:2022-06-28 热度:128
在日常工作中,我们可能会遇到各种技术问题,比如运维、开发、框架、操作系统等领域,不同的技术人,碰到的难题也不尽相同。为了帮助大家更好的解决问题,51CTO技术交流群针对一些技术问题展开了深入的讨论交流。51CTO对其中精彩问答进行了整理,并通过文章[详细]
-
挖掘互联网开放数据可带来巨大商业价值
所属栏目:[大数据] 日期:2022-06-28 热度:108
星巴克的门店选址方法 20世纪80年代末,美国星巴克公司董事会名誉主席霍华德舒尔茨(Howard Schultz)曾经在西雅图总部组建地产团队,专门研究咖啡门店的选址。 他们除了有着专业的地产团队外,还有地理信息系统进行数据化分析,从而决定开店位置和营销方式,[详细]
-
2022年优秀预测分析工具和软件
所属栏目:[大数据] 日期:2022-06-28 热度:188
数据管理一直是企业面临的挑战。随着新的数据源不断涌入,使用合适的工具比以往任何时候都更为关键。预测分析工具和软件是完成这项任务的最佳解决方案。数据专家和商业管理者必须能够组织和清理数据,以启动这一进程。随后是对数据进行分析,并与同事分享结[详细]
-
使用替代数据的五个隐性成本
所属栏目:[大数据] 日期:2022-06-28 热度:176
如今,替代数据源已嵌入到各个行业的企业业务流程中。根据Lowenstein Sandler 律师事务所2022 年的一项调查,92% 的投资机构(从对冲基金、私募股权到风险投资)都在以中等或很大的程度使用替代数据来为决策提供依据。受访者还预计,他们在 2022 年对替代数据[详细]
-
具备可视化的数据不仅可以节流 还可以开源
所属栏目:[大数据] 日期:2022-06-28 热度:167
当数据团队在谈论具备可视化的数据和数据质量高的好处时,通常只会涉及数据不完整带来的负面影响:决策不力、收入流失,甚至降低客户的信任度。 Gartner预测,糟糕的数据质量使企业每年损失1290万美元,因此具备可视化的数据成为非常重要的选择。 如果公司能[详细]
-
详解元宇宙的七层产业链
所属栏目:[大数据] 日期:2022-06-28 热度:192
详解元宇宙的七层产业链: 1. 体验层映射现实世界的生活场景 元宇宙中的体验并不是打造简单的立体空间中的沉浸感,它可以把人类生活场景的方方面面映射进数字世界。当物理世界数字化之后,体验可以变得更加丰富。元宇宙可以帮助人类拓展边界,在虚拟世界中,[详细]
-
阻碍人工智能在企业中被高效使用的主要障碍是什么?
所属栏目:[大数据] 日期:2022-06-27 热度:83
企业高级主管参与人工智能(AI)计划的情况目前正在迅速增长,高质量的培训数据正在成为重点。受到疫情的影响,企业加快了人工智能计划的推进速度。2020年,无论是参与人工智能计划的高管数量还是预算都翻了一番。 企业从此次疫情中得到的一个重要教训是,企[详细]
-
人工智能对于未来网络的重要性
所属栏目:[大数据] 日期:2022-06-27 热度:148
人工智能将在未来网络如何切片、支持多种用途(包括物联网和私有5G网络)方面发挥重要作用。 电信基础设施提供商诺基亚推出了一项新服务,旨在帮助运营商使用人工智能和自动化技术更好地管理其5G网络并避免网络和服务级别的故障。 诺基亚在宣布其AVA 5G认知运[详细]
-
你不知道的人工智能背后的AI训练师
所属栏目:[大数据] 日期:2022-06-27 热度:157
抬头是山,低头是煤。曾在山西传统煤矿工作8年, 整天盯在电脑屏幕前监测矿井瓦斯浓度的郭梅从来没有想过,有一天自己的工作会和人工智能有了联系。 两年前,因为孩子来省会城市太原上学,郭梅在附近求职,做起了数据标注。同样是盯在电脑屏幕前,现在郭梅每[详细]
-
构建芯片AI性能新标准!地平线提出MAPS测试方法
所属栏目:[大数据] 日期:2022-06-27 热度:106
疫情过后,我们看到随着AI芯片的发展,智慧医疗、智能工厂、智能5G网络优化都已经成为可能。AI是新基建里的重要部分,而芯片则是AI新基建发力的重中之重。在AI应用的第一阶段,应用场景主要为训练和推理,在模型训练方面,算法模型需要对海量数据进行处理;[详细]
-
人工智能的使用有助于防止濒危动植物的灭绝
所属栏目:[大数据] 日期:2022-06-27 热度:92
利用人工智能进行生物多样性保护有助于防止动植物灭绝,从而维持稳定的生态系统。 近年来,诸如Rhynia、Pluchea GluTInosa、渡渡鸟、大海雀、塔斯马尼亚虎和西部黑犀牛等动植物的灭绝是一个非常令人关注的问题,因为它们对我们的生态系统造成了不利影响。每一[详细]
-
利用人工智能技术,全面推进人、车、路协同
所属栏目:[大数据] 日期:2022-06-27 热度:116
细细数来,普遍困扰大家的痛点无非有以下三点: 首先是道路拥堵。其实这也是老大难问题了,甚至可以说是城市治理中的痼疾。谁还没经历过几次堵车长龙呢?以往处理道路拥堵问题,只能通过后台监控画面进行人工判断,然后增派警力到拥堵点进行疏导。然而这种方[详细]
