8个步骤开始(大)数据

发布的

A.以前的职位将数据处理比作消化系统。我们认为大数据技术在摄入消化(捕捉数据和处理数据)被大肆宣传,代价是吸收同化(创造新的见解并付诸行动)。获取一个新工具,将其安装到硬件上并学习如何运行它可能需要几个月的时间。尽管一些供应商声称你可以在数小时内获得新的见解,建立Hadoop集群并安装所有东西需要的时间远不止这些。你真正想要的是尽快获得这些见解并付诸行动。然后验证结果,并在需要时返回技术以实现更健壮的实现。怎样这就是这篇文章的主题。

8个步骤开始。

下面是我们开始处理大数据(或小数据)的8个简单步骤。

  1. 从一个小的数据样本开始。你不需要数据的全部宽度和深度来寻找有趣的东西。从小事做起。一开始,它可以省去很多技术方面的麻烦。
  2. 使用Bibeplay2网页登陆gML或任何其他简单易用的工具来构建您可以理解并快速集成的初始预测模型.检查这一系列的博客文章比较一些SaaS机器学习产品。这里的重要词语简单、可操作且易懂。你不想浪费太多时间弄清楚如何使用工具。你也不想浪费时间翻译和编码结果。你想了解结果,以便执行第三步。
  3. 检查模型是否为您提供了任何实用的见解。探索模型。找到它的黄金。或者不,然后丢弃它。
  4. 使用这个模型来产生预测,看看它是否可以改善你公司的表现。将模型付诸实践。在你的公司中找个地方进行测试,衡量用户流失率、转化率、风险等方面的变化。
  5. 检查更多的数据如何改进模型。您可以通过两种方式添加数据:只需向同一数据集添加更多数据点。或者您可以向数据集添加更多功能、新的信息片段,以增强模型并找到性能可能更好的新关系。电子表格术语:您可以添加更多行或更多列。
  6. 检查这个更复杂的模型是否优于之前的模型。再一次:把它付诸行动,看看它的表现如何。它是否改善了以前的结果?
  7. 迭代秘诀是尝试多个模型,看看哪一个在此时给出最佳结果。继续迭代以找到最佳拟合。
  8. 现在检查适合您的情况的技术概念。现在您已经看到了一些预测模型的成功实现,您可以更好地评估各种供应商的产品。您已经体验过基于云的服务如何为您节省年度许可费、硬件投资和培训等。您可以将其与更传统的现场实现进行比较,并选择最适合您的需求和预算的概念。

可操作的分析。

这种方法的核心是您能够轻松地创建各种模型并立即将它们投入工作。在Bibeplay2网页登陆gML中,我们创建了两个方面。你的模型只需要点击几下鼠标。通过API连接到我们的平台进行预测已经非常简单了。最近,我们努力使您的模型可下载,以便您可以在自己的环境中运行它们。只需单击下载图标,选择需要的语言,然后复制/粘贴生成的代码。我们甚至添加了一个小大象按钮。这将激活下载的一个特殊Hadoop版本(可用于某些语言):代码被拆分为一个映射器和一个减速器,并准备好在Hadoop环境中部署。

开始。

所有的零件都可以买到,通常价格很低,甚至不收费。在BigML注册只需一分钟,不beplay2网页登陆需要你留下任何个人信息,可以获得高达50MB的免费建模积分。你所需要的只是一些很棒的数据。你为什么不开始?

4评论

  1. 好的文章!从技术上讲,您确定的步骤是正确的。但为了在一个组织中发挥效力,我认为还需要考虑其他一些事情:
    -这些步骤只有由合适的人(组织倾听的人,或与合适的涉众合作的人)执行才会对组织产生影响。否则,伟大的成果就会出现,但没人在乎。
    –使用您的工具将数据从组织移动到云中。这可能会导致问题,特别是如果云来自一家小型初创企业,可能运行在Amazon或类似平台上。提前对数据进行动画化是明智的(见这本伟大的新出版物)http://www.ico.gov.uk/for_organisations/data_protection/topic_guides/anonymisation.aspx)
    -你将工具定位为一种快速开始的方式,而不以牺牲最终解决方案为代价进行投资。

    当做

    1. 谢谢理查德。
      你的第一项和第二项当然是正确的。然而,我确实希望,如果有人带来了可以改善企业业绩的好结果,他会找到一个倾听者。但事实并非如此。
      至于数据保护:事实上,我们已经就这一主题与公司进行了多次讨论。我们的回答通常是,保护匿名性的最佳方法是不使用个人可识别数据。在我所看到的例子中,个人身份数据从来都不相关。在预测分析中从不使用姓名、id、地址、账号等。然而,这是公司必须面对的障碍。
      至于你的第三条评论:我们预测,当用户体验过BigML之后,转向昂贵的现场授权产品的可能性会很低。beplay2网页登陆但我很乐意接受您的评论,使其更明确:BigML将非常适合您的需求,不仅作为起点,而且作为最终解决方案!beplay2网页登陆

留下一个回复

在下面填写详细信息或单击图标登录:

掘墓人
WordPress.com徽标

您正在使用您的WordPress.com账户进行评论。(注销/改变)

谷歌图片

您正在使用您的Google帐户进行评论。(注销/改变)

Twitter图片

你在用你的推特账号评论。(注销/改变)

Facebook的照片

您正在使用您的Facebook帐户评论。(注销/改变)

正在连接到%s