2014年开始,更快,更容易,更方程式机器学习

大家,新年快乐!自从我们上次博成以来已经有一段时间了,但有充分的理由:我们比以往任何时候都忙着忙碌冬季释放同时服务于我们快速增长的用户群。到目前为止,Bibeplay2网页登陆gML已经被用来创建不止一个60万个活跃的预测模型- 他们的哈尔夫在过去几周内创造了。我们开始2013年,款式不到10,000款,我们正在追踪2014年初百万号模型标志。

beplay2网页登陆BIGML 2014年冬季释放构成三个方向前进的重要一步:

  • 速度:您现在可以在先前拍摄的1/8内建立一个模型,并与之快速,实时预测beplay2网页登陆BigML的PredictServer
  • 可编程性:我们使用Programmatic手段授权我们的API来过滤,示例或使用新的字段进行任何数据集或数据集列表。数十种预构建功能已经可用,并定义新功能非常简单。
  • 每个人的数据驱动决策:beplay2网页登陆BigML的新开发模式允许您运行无限的任务16 MB自由,使BigML成为beplay2网页登陆实践、教学和学习机器学习或预测分析的理想框架。没有理由不这样做从今天开始做数据驱动的决定

beplay2网页登陆

现在让我们快速回顾一下最显著的新特性。在接下来的几天里,我们将添加博文来进一步详细解释其中的一些。

更快的模型

一个第三代我们的算法极大地改善了我们在建模时的性能。为了让您快速了解,在我们之前的版本中,建模一个包含50个字段和略多于500,000行(约80mb数据)的数据集大约需要8分钟。现在,这只需要不到一分钟。

加权模型

对于像欺诈或者入侵检测广告单击预测, 或者最好的客户保留,感兴趣的类是少数类(例如,与其他类别的实例数相比,利益类的实例数量不足。这些情况被称为不平衡它们构成了一个严重的挑战,因为大多数传统的监督机器学习算法忽略了少数类,而倾向于多数类。对输入数据进行欠采样或过采样等技术可能有所帮助,但它们通常提供的性能不是最优的。

beplay2网页登陆BIGML的新算法附带三种方式来优雅地处理这个问题并创造加权模型.使用它们,您将能够构建将考虑的模型在构建时根据您建立的权重标准,每个实例或类。

数据集转换

我们开发了一种类似LISP的语言代码平线(在传说中的网络 - 牛仔之后McCoy Pauley),并对规范进行开源在这里.平线既可以用于过滤数据集的行和列,也可以用于生成新字段。例如,如果数据集中的温度用华氏度表示,那么可以使用单一的Flatline表达式轻松地将其转换为摄氏温度。

Flatline允许您水平地选择同一行的不同字段,或者选择一个有限的行滑动窗口来垂直地遍历数据集。这对于根据大量的前后值生成值非常有用。换句话说,您可以根据对另一个字段的以前值计算一个函数来生成一个新字段。想象一下,添加一个新的字段,其中包含7天的每日最高温度平均值。

Flatline提供了许多预先构建的功能,它可以很容易地在数据集上执行标准分析任务,例如discretezing连续变量删除异常值代替缺失值变量正常化等。对于喜欢平线表达式的人来说,它有一个类似json的等效表达式。您可以阅读有关BigML的数据集转换的更多信息beplay2网页登陆在这里

能够通过高级语言和基于云的API进行编程方式转换数据集,加上我们将提及的其余功能,打开新的可能性,以便在云上编程机器学习任务以前可用。我们会在下天给你一些例子。例如,在少数API调用中检测训练数据和生产数据之间的协变量。我们开始称这个新的范式“编程机器学习”。

beplay2网页登陆

多数据集和多数据集模型

在我们的Winter版本中,另一个很酷的特性是使用多个数据集作为输入创建数据集的能力。当您需要将多个数据源合并到单个数据集或希望构建批量收集数据的在线解决方案时,这非常有用。您甚至可以单独抽样每个数据集。

此外,您可以使用多个数据集作为构建模型的输入乐团评估(例如,您不需要首先将它们合并到单个数据集)。你可以阅读更多关于多数据集的内容在这里

新预测策略

我们已经制定了第二个策略来应对缺失值在您的输入数据中。到目前为止,当用于生成新预测的输入数据包含缺失值时,BigML将计算得到的预测返回到需要该输入的节点(拆分)。beplay2网页登陆我们称之为策略最后的预言

缺少战略

现在,您可以选择命名的替代策略成比例的它将评估一个缺失分割的所有子树,并根据每个子树中数据的比例重新组合它们的预测。

我们还开发了一种新的基于阈值的分类组合器组合器这对于实施保守或激进的预测策略都很有用。

基于阈值的组合器

这个组合器允许您根据给定的阈值k触发预测。假设您已经创建了一个20个模型的集合来检测计算机网络中的入侵者,并且您使用k阈值1来进行预测。然后,只要集合中有一个模型预测正确,集合就会预测入侵正在进行。或者设想您有另外30个模型集合来预测营销活动的成功,这一次您希望减少误报的数量。然后,你可以将k设置为一个高值,比如27或28,以确保你不会把钱花在那些不会对你的活动做出反应的客户身上。

新的开发模式

我们注意到许多BigML用户并不知道我们的beplay2网页登陆免费开发模式。因此,许多用户会尝试我们在生产模式下提供的促销数据集,很快在完成他们的初始项目之前就用光了积分。为了解决这个问题,我们现在已经在我们的网页界面上做了更明显的开发转换,并且把最大的任务大小增加到16mb。

发展模式

beplay2网页登陆与生产模式相比,BigML的开发模式有3个局限性:1)一个集合的模型数量最多不能超过10个;2)文本分析的词汇数上限为32个;3)树的最大节点数不能大于512。所有其他功能都是完全相同的,你可以运行无限的任务。

beplay2网页登陆BigML免费

还有几件事

那不是全部。在仪表板中的新搜索框中有一些其他伟大的功能,在Excel导出的型号中的多个预测,通过私有链接共享评估,以及更多。我们很快就会列出我们的所有这些功能什么是新的部分。最后但并非最不重要,beplay2网页登陆BigML的PredictServer现已从中获得亚马逊市场

所以,让2014年成为你开始在业务中加入预测分析的一年建筑预测应用程序用bigmbeplay2网页登陆l。为了帮助您,我们今年签约的前50个年度BIGML订阅提供额外的15%折扣。beplay2网页登陆如果您对其中一个感兴趣,请向我们发送电子邮件至info@bigml.com,我们很乐意发送您的优惠券。beplay体育官网网站beplay2网页登陆

beplay2网页登陆

2的评论

留下一个回复

请在下面填写您的详细信息或单击图标登录:

功能
WordPress.com的标志

您正在使用您的WordPress.com账户进行评论。注销/改变

谷歌照片

您正在评论您的Google帐户。注销/改变

Twitter图片

你在用你的推特账号评论。注销/改变

Facebook的照片

您正在使用您的Facebook帐户评论。注销/改变

连接到%s