预计阅读时间: 7 分钟
如果数据来自不同来源,无论是 CRM、社交媒体源还是行为事件数据。这些数据可能存储在整个技术堆栈中的各种不同工具和系统中(例如遗留系统、基于云的工具和 数据仓库 o 湖泊).
数据编排的第一步是收集和组织来自所有这些不同来源的数据,并确保其格式针对目标目的地正确。这给我们带来了:转型。
该数据有多种不同的格式。它可能是结构化的、非结构化的或半结构化的,或者同一事件在两个内部团队之间可能有不同的命名约定。例如,一个系统可能会收集并存储日期为 21 年 2022 月 20220421 日,而另一个系统可能会以数字格式 XNUMX 存储该日期。
为了理解所有这些数据,公司通常需要将其转换为标准格式。数据编排可以帮助减轻手动协调所有这些数据以及根据组织的数据治理策略和监控计划应用转换的负担。
数据编排的一个关键部分是使数据可用于激活。当干净、整合的数据被发送到下游工具以供立即使用(例如,创建活动受众或更新商业智能仪表板)时,就会发生这种情况。
数据编排本质上是消除孤立的数据和碎片化的系统。 Alluxio赞赏 数据技术每 3-8 年就会发生重大变化。这意味着一家拥有 21 年历史的公司自成立以来可能已经经历了 7 个不同的数据管理系统。
数据编排还可以帮助您遵守数据隐私法、消除数据瓶颈并加强数据治理——这只是实施它的三个(众多)充分理由。
GDPR 和 CCPA 等数据隐私法对数据收集、使用和存储有严格的指导方针。合规性的一部分是让消费者可以选择退出数据收集或要求您的公司删除他们的所有个人数据。如果您不能很好地掌握数据的存储位置以及访问者,可能很难满足这一需求。
自 GDPR 颁布以来,我们收到了数百万个删除请求。对整个生命周期有深入的了解至关重要 数据 以确保没有任何东西逃脱。
如果没有数据编排,瓶颈将是一个持续的挑战。假设您是一家拥有多个存储系统的公司,您需要查询这些系统的信息。负责查询这些系统的人员可能有很多请求需要筛选,这意味着团队之间可能会出现延迟 他们需要的 数据和那里的人 收到 有效地,这反过来又会使信息过时。
在精心安排的环境中,这种类型的启动和停止将被消除。您的数据将已传送到下游工具进行激活(并且该数据将被标准化,这意味着您可以对其质量充满信心)。
当数据分布在多个系统上时,数据治理就很困难。公司没有完整的数据生命周期视图,也没有存储哪些数据的不确定性(例如 鸽子)会造成漏洞,例如无法充分保护个人身份信息。
数据编排通过提高数据管理方式的透明度来帮助解决这个问题。这使得公司能够在不良数据到达数据库或影响报告之前主动阻止它们,并设置数据访问权限。
尝试实施数据编排时可能会出现一些挑战。以下是需要注意的最常见问题以及如何避免它们。
数据孤岛在企业中很常见,即使不是有害的。随着技术堆栈的发展以及不同的团队拥有不同方面的客户体验,数据很容易在不同的工具和系统中变得孤立。但结果是对公司绩效的不完全了解,从客户旅程中的盲点到对分析和报告准确性的不信任。
企业总是会有数据从多个接触点流入各种不同的工具。但如果这些公司想从数据中获取价值,打破孤岛就至关重要。
近年来,出现了一些关于公司如何管理数据流和激活的趋势。实时数据处理就是一个例子,即数据在生成后几毫秒内得到处理。实时数据在所有行业中都变得至关重要,在IoT (例如,汽车中的接近传感器)、医疗保健、供应链管理、欺诈检测和近乎即时的个性化。特别是随着机器学习和人工智能的进步,实时数据允许算法和人工智能 以更快的速度学习。
另一个趋势是转向基于 云。虽然有些公司已经完全转向 云,其他人可能会继续混合使用本地系统和基于云的解决方案。
然后,软件构建和部署方式的演变,这会影响数据编排的执行方式。
– 不包含数据清理和验证
– 不测试工作流程以确保流程顺利和优化
– 对数据不一致、服务器错误、瓶颈等问题的延迟响应
– 没有关于数据映射、数据沿袭和监控计划的明确文档
衡量数据编排的投资回报率:
– 了解基本性能
– 为数据编排制定一套清晰的目标、KPI 和目标
– 计算所使用技术的总成本以及时间和内部资源
– 衡量重要指标,例如节省的时间、处理速度和数据可用性等。
BlogInnovazione.it