有关数据排气所需了解的5件事
数字转换在IT部门的平衡转移
爱立信推出了第一杆网络平台
Cisco表示,5G部署将解决新兴数据需求的地址
Microsoft发布KB 3163207,Retifire KB 3157993,Reissues Flash Patch MS16-064
Amazon.com显示欧盟委员会如何实现电子商务平等
Challenger Bank Monzo被卡片处理器停电击倒
爱沙尼亚人在全球DNS劫持僵尸网络中的角色获得7年
谷歌拥有一个新的芯片,使机器学习方式更快
Microsoft到Windows Live Mail 2012用户:现在切换
Facebook开始在非用户瞄准广告
欧盟准备在线销售货物和服务的结束地理群
美国指责俄罗斯间谍指挥雅虎违规行为
Oracle在2017年扩展英国数据中心足迹
荷兰专业知识透明企业区块链
白宫发布关于如何刺激智能枪技术的报告
印度尼西亚大学推出更快,更安全的网络
领主在宽带USO上加压政府
BT同意OpenReach Split的OFCOM的术语
面对地平线诉讼的邮局在地平线诉讼中分水岭决定
调查下太阳能发电厂的火焰原因
英特尔正在退出智能手机和平板电脑市场的边缘
伦敦消防队系统崩溃导致延误对紧急情况的反应
HTC通过新的Vive X Accelerator向下翻下虚拟现实
Quip正在Excel播放另一个摇摆,具有更好的电子表格功能
俄罗斯黑客在线共享的数百万盗窃电子邮件
BT创建1,700名学徒和毕业生岗位
Microsoft一直在两个月内刺激了Windows用户
中东银行索赔区块链首先付款
超频器推动了英特尔的新Badwell芯片到5.7GHz
谷歌,你在做什么?摩托罗拉Ex-Prez现在新的硬件主管
美国代理商释放隐私“最佳实践”的无人机使用
Ai可以在鞋子上打败你吗?是的。是的,它可以
AWS致力于解决长期英国云技能短缺
将原子拍摄到硅中,您可能有量子计算机的开始
GDS宣布公共云足够为“绝大多数”公共部门安全
使用NASA的帮助,Spacex拍摄2018年Mars Mission
大规模增长显示为什么亚马逊是公共云领导者
HMRC旨在缓解英国企业的转型给数字纳税申报表
中东机构敦促网络防御优先考虑
FDM Everywoman在Tech:2017年获奖者宣布
需要加密解决方法的参议院提案可能已经死亡
三星的Tizen 3.0在9月开始迎接Android和iOS
事情互联网在业务中获得了牵引力
泰国2017年4月推出了物联网网络
微软教授超过56万人的数字技能
MWC 2017:塔塔有助于电话转向数字化
NHS网站被突尼斯伊斯兰语法污染了
组使用Windows Hotpatching方法进行恶意软件
尽管增长,Twitter仍然令人失望
您的位置:首页 >电子新品 >

有关数据排气所需了解的5件事

2021-07-02 18:44:01 [来源]:

大数据在大多数商业世界中是一个熟悉的术语,而且大小的公司都争先恐后地利用它。另一方面,数据排气是不太广为人知的,并且在某种程度上它是一个邪恶的双胞胎兄弟。以下是您应该了解数据排气的利弊的五件事。

1.它基本上是所有的大数据,也不是您的业务的核心。

Tifacta的数据科学和解决方案工程总监Tye Rattenbury表示,“数据排气”术语已经存在于十多年来,并从智能手机出现了来自智能手机的新数据流,这使得数据准备软件。如今,更多可访问的数据工具将排气到前面。

如果大数据是与业务的核心功能相关的“主要”数据,则数据排气是次要数据,或者在路上创建的其他一切,Rattenbury解释说。

例如,银行将考虑借记有关借记和信用的所有数据,以其客户“帐户。辅助数据可能包括信息等信息,如什么百分比的事务在ATM而不是物理分支中完成。

数据排气没有标准定义或模式,这往往是生成和非结构化,但在许多方面,它相当于与公司机器和核心在线活动相关的副产物。它可以包括来自Web浏览器,插件,日志文件,物联网(物联网)设备等的流。

2.它通常比“大”更大。

朗格尼伯里说,术语“大数据”本身就是一个相对的术语,基本上沸腾了“任何那么大的东西,你可以通过记录手动检查或使用它记录。”通常,数据排气往往更大,主要是因为公司可以收集的限制很少。

“谷歌是这里的领导者,”他说。“他们甚至在他们知道他们会用它做什么之前收集一切。”

这会带来数据排气的另一个有趣功能:它可以成为发现它的主要数据。

3.它具有很大的潜力。

数据排气可能非常有用。例如,在该银行示例中,了解消费者在何处进行大部分交易,可以帮助银行做得更好。

“这不是交易的核心,但它仍然可以与客户在更好的水平上维修客户有关,”Rattenbury说。“它为客户越来越希望的主要交易或服务提供了一定程度的理解和上下文化。”

数据排气可以包含您今天可能不寻求的信息的重要元素,但这可能在将来有用,研究公司Transworld数据的主席Mary Shacklett Negled Shacklett。

“很多排气数据并不是立即有价值的,”企业战略集团的高级分析师尼克·鲁达商达了。“诀窍是弄清楚什么或者可能是。”

4.小心“沼泽” - 和法律行李。

可以存在与数据排气相关的风险。

“这通常是客户可能或可能不愿意给你的东西,”朗格伯里解释说。“因此,潜在的法律,营销和利用该数据的公共关系风险。通过了解他们的东西,您最终可能最终疏远您的客户群或合作伙伴,以至于他们没有希望您知道。“

影响可能是微妙的。例如,如果保险公司是利用它可以看到到处都可以看到的GPS位置,例如,您最近停放了您的汽车,例如,它可以为经常犯罪地区公园公园的客户提高利率。他指出,没有打算这样做,它可能会建立一个最终歧视种族的算法。

另一种潜在风险是节省永远不会有用的数据。

“CIO需要平衡数据排气的价值,以防止浪费浪费永久无用的数据,”Shacklett说。“这是非常困难的。"

Rouda说,目标是拯救可以超越仅仅在商业活动中增加增量的洞察和颜色,可以超越逐步的洞察力和颜色。“如果没有任何经营理由,这就是数据湖泊得到了一个糟糕的说唱的地方”并成为数据沼泽。

5.你需要做出一些决定。

底线是,对选择性保存的数据排气是至关重要的。

Shacklett说:“开始对你要抛弃的事情进行一些执行决定很重要。”

例如,当涉及智能手机和其他设备时,它众所周知,许多相关的流数据是从设备握手和无关的“日志数据Gibberish”的“开销”,她指出。“这种数据将是有用的。”

朗格尼伯里说,公司还应咨询律师。

此外,他们应该与数据联系最接近核心业务的员工。“他们”LL立即有问题,他们可以立即展示相关性,“他解释道。

从技术角度来看,公司需要可扩展的存储技术以及用于自助服务数据访问的工具。

朗格尼伯里说,伴随着排气数据的最艰难的工作件之一是围绕它欣赏一张连贯的观点。清理和统一数据可能是一个挑战。

“我可能已经在一个地方注册了服务,并在另一个地方输入了信用卡信息,”他解释道。“你”通过一些不同的地方对我进行了同样的数据。“

随着次要数据,公司在收集清理时,公司通常担心,朗格伯里补充道。所以“你必须意识到它不仅仅是一个说法,”这在这里“这一堆数据 - 让我们用它做点什么。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。