有关数据排气所需了解的5件事
大数据在大多数商业世界中是一个熟悉的术语,而且大小的公司都争先恐后地利用它。另一方面,数据排气是不太广为人知的,并且在某种程度上它是一个邪恶的双胞胎兄弟。以下是您应该了解数据排气的利弊的五件事。
1.它基本上是所有的大数据,也不是您的业务的核心。
Tifacta的数据科学和解决方案工程总监Tye Rattenbury表示,“数据排气”术语已经存在于十多年来,并从智能手机出现了来自智能手机的新数据流,这使得数据准备软件。如今,更多可访问的数据工具将排气到前面。
如果大数据是与业务的核心功能相关的“主要”数据,则数据排气是次要数据,或者在路上创建的其他一切,Rattenbury解释说。
例如,银行将考虑借记有关借记和信用的所有数据,以其客户“帐户。辅助数据可能包括信息等信息,如什么百分比的事务在ATM而不是物理分支中完成。
数据排气没有标准定义或模式,这往往是生成和非结构化,但在许多方面,它相当于与公司机器和核心在线活动相关的副产物。它可以包括来自Web浏览器,插件,日志文件,物联网(物联网)设备等的流。
2.它通常比“大”更大。
朗格尼伯里说,术语“大数据”本身就是一个相对的术语,基本上沸腾了“任何那么大的东西,你可以通过记录手动检查或使用它记录。”通常,数据排气往往更大,主要是因为公司可以收集的限制很少。
“谷歌是这里的领导者,”他说。“他们甚至在他们知道他们会用它做什么之前收集一切。”
这会带来数据排气的另一个有趣功能:它可以成为发现它的主要数据。
3.它具有很大的潜力。
数据排气可能非常有用。例如,在该银行示例中,了解消费者在何处进行大部分交易,可以帮助银行做得更好。
“这不是交易的核心,但它仍然可以与客户在更好的水平上维修客户有关,”Rattenbury说。“它为客户越来越希望的主要交易或服务提供了一定程度的理解和上下文化。”
数据排气可以包含您今天可能不寻求的信息的重要元素,但这可能在将来有用,研究公司Transworld数据的主席Mary Shacklett Negled Shacklett。
“很多排气数据并不是立即有价值的,”企业战略集团的高级分析师尼克·鲁达商达了。“诀窍是弄清楚什么或者可能是。”
4.小心“沼泽” - 和法律行李。
可以存在与数据排气相关的风险。
“这通常是客户可能或可能不愿意给你的东西,”朗格伯里解释说。“因此,潜在的法律,营销和利用该数据的公共关系风险。通过了解他们的东西,您最终可能最终疏远您的客户群或合作伙伴,以至于他们没有希望您知道。“
影响可能是微妙的。例如,如果保险公司是利用它可以看到到处都可以看到的GPS位置,例如,您最近停放了您的汽车,例如,它可以为经常犯罪地区公园公园的客户提高利率。他指出,没有打算这样做,它可能会建立一个最终歧视种族的算法。
另一种潜在风险是节省永远不会有用的数据。
“CIO需要平衡数据排气的价值,以防止浪费浪费永久无用的数据,”Shacklett说。“这是非常困难的。"
Rouda说,目标是拯救可以超越仅仅在商业活动中增加增量的洞察和颜色,可以超越逐步的洞察力和颜色。“如果没有任何经营理由,这就是数据湖泊得到了一个糟糕的说唱的地方”并成为数据沼泽。
5.你需要做出一些决定。
底线是,对选择性保存的数据排气是至关重要的。
Shacklett说:“开始对你要抛弃的事情进行一些执行决定很重要。”
例如,当涉及智能手机和其他设备时,它众所周知,许多相关的流数据是从设备握手和无关的“日志数据Gibberish”的“开销”,她指出。“这种数据将是有用的。”
朗格尼伯里说,公司还应咨询律师。
此外,他们应该与数据联系最接近核心业务的员工。“他们”LL立即有问题,他们可以立即展示相关性,“他解释道。
从技术角度来看,公司需要可扩展的存储技术以及用于自助服务数据访问的工具。
朗格尼伯里说,伴随着排气数据的最艰难的工作件之一是围绕它欣赏一张连贯的观点。清理和统一数据可能是一个挑战。
“我可能已经在一个地方注册了服务,并在另一个地方输入了信用卡信息,”他解释道。“你”通过一些不同的地方对我进行了同样的数据。“
随着次要数据,公司在收集清理时,公司通常担心,朗格伯里补充道。所以“你必须意识到它不仅仅是一个说法,”这在这里“这一堆数据 - 让我们用它做点什么。”