适合机器学习的公共数据源列表

下面是大量指向自由开放数据集的链接,这些数据集可用于构建预测模型。我们希望我们的读者将通过深入了解世界和我们的政府为更大的利益而工作的方式,充分利用这些信息。如果您有学术或研究项目,请记住BigML提供beplay2网页登陆特别折扣及免费使用为了那些。事实上,您将自动获得免费专业订阅只要你注册了你的。Edu”电子邮件。

数据日志

Data-artikelen |马尾藻
《卫报》的数据新闻和数据可视化

数据市场和数据中心

Knoema——回家
公共数据集:亚马逊网络服务
索克拉塔
数据公社| Les données pour votre business
归档It–为图书馆和归档提供的Web归档服务
自由基
公共数据资源管理器
欢迎来到数据中心
数据集| AggData
查找和购买数据订阅| Windows Azure Marketplace

数据搜索引擎

Zanran数值数据搜索
Quandl–数字数据的智能搜索

国际机构

货币基金组织的数据和统计
数据|世界银行
经合组织统计
UNdata
数据和地图-欧洲环境署(EEA)
欧盟统计局总部

地方政府

米西奥尼斯酒店
开放政府数据Wien(OGD)
开放数据——布鲁塞尔市
开放数据——布里斯班市议会
开放数据-萨尔福德市议会
桑德兰市议会:当地公共数据
欢迎来到伦敦数据存储|伦敦数据存储
利兹市议会-开放数据
Home - DataGM -数据大曼彻斯特
开放数据|德比市议会
议会数据–布莱顿和霍夫市议会
开放数据-伯明翰市议会
香港仔市议会公开资料
开放数据——滑铁卢市
开放数据目录|温哥华市
开放数据之家–开放数据之家–多伦多市
乔治王子城-开放数据目录
开放数据渥太华|市渥太华
开放数据目录-城市的马鹿
开放数据|市尼亚加拉瀑布,加拿大
开放数据目录|纳奈莫市
米西索加。ca居民-出版物和开放数据目录
梅迪辛哈特市开放数据目录
Kamloops开放数据
开放数据目录Kelowna
汉密尔顿市-开放数据
弗雷德里克顿市-开放数据之家
埃德蒙顿市开放数据目录
马萨诸塞州萨默维尔市
Data.西雅图.Gov|西雅图的数据站点
斯科茨代尔市
欢迎-圣克鲁斯开放数据
数据|旧金山
开放罗利-罗利的官方城市门户
数据集| CivicApps.org波特兰OR
OpenDataPhilly–用数据连接人
纽约市公开的数据
大新奥尔良社区数据中心
麦迪逊市|开放数据
火奴鲁鲁市和县
美国/哥伦比亚特区数据目录
丹佛开放数据目录
data.cookcountyil.gov |库克县政府开放数据网站
芝加哥市|数据门户
开放政府|波士顿市
OpenBaltimore/巴尔的摩市的开放数据目录
Data.austinexas.gov |开放奥斯汀
OpenDataAsheville–用数据连接人
美国/阿瓦达
香港政府一站通:关于数据
data.gov.sg新加坡

机器学习的挑战

ACM KDD杯
比赛——Kaggle
数据-存储库-因果关系工作台
TunedIT–数据挖掘和机器学习数据集、算法、挑战

机器学习数据集

TunedIT–数据挖掘和机器学习数据集、算法、挑战
欢迎光临
UCI机器学习存储库:数据集

各种各样的数据源

IHME |卫生计量和评估研究所
Gapminder:为基于事实的世界观揭开统计之美。
在纽约市公立学校做研究并请求数据-纽约市数据-纽约市教育部门
丽塔| BTS |来自h2的标题
俄勒冈州的气候数据
量子网::开始
数据工具-定位器
我的数据|测量我
来自雅虎的Webscope!实验室
SoourceForge.net研究数据
在线数据–罗伯特·希勒
从NSSDC获取数据
癌症计划数据集
癌症影像档案(TCIA)
百万首歌曲数据集|缩放和平号研究
谷歌Ngram Viewer
数据| GeoDa中心
国内GEO数据集- NCBI
金融数据查找器A–G
频繁项目集挖掘数据集存储库
Europeana专业链接开放数据
Inforum–经济数据
按应用领域列出的数据集摘要
皮尤研究中心的互联网与美国生活项目
而是大世界——探索
NFL高级统计数据:逐场比赛数据

国家政府和各州

透明义务入口
安达卢西亚军政府——达托斯·阿比尔托斯
Reutilización de la Información del部门Público | Reutilización de la Información de los Servicios Públicos
JCCM阿比尔托斯大门酒店
萨拉戈萨阿尤塔米恩托。萨拉戈萨雷乌利扎西翁酒店
Dades obertes Lleida–Lleida行政区
ISTAC | El-ISTAC
戴德斯·奥伯特斯。加泰罗尼亚政府
戴德斯·奥伯特斯·凯布
公共部门信息再利用研究所(Reutilización de la Información del Sector Público en Gijón)
开放数据(Open Data)
夏威夷数据| Data.hawai.gov
佛罗里达有权知道
Open.Georgia.gov
联邦数据点
开放数据| Data .maryland.gov
康涅狄格透明度的网站
RI.gov:公开数据
纽约数据中心
缅因州政府数据共享
阿拉巴马州–Open.Alabama.gov
田纳西州开放政府
俄亥俄政府|事实和历史
OpenDoor–肯塔基州
伊利诺斯州官方网站|开放伊利诺斯州
SOM -密歇根数据存储
路易斯安那透明度和问责门户网站
data.mo.gov |密苏里州数据门户
数据共享| data.iowa.gov
明尼苏达开放数据//你的门户为明尼苏达数据透明
开放数据德州
欢迎来到俄克拉何马州的官方网站
KanView:堪萨斯州透明度纳税人法案-堪萨斯州收入和支出搜索
南达科他州政府信息
北达科他州地理信息系统
州政府数据新墨西哥州
科罗拉多州官方门户网站
亚利桑那州OpenBooks |–详细介绍亚利桑那州透明财务
犹他州数据–犹他州政府
Data.CA.gov |加利福尼亚州的数据透明度
俄勒冈数据|打开俄勒冈的数据
数据。华盛顿州的数据网站
Home | Data.gov
Datos Públicos门户-伊尼西奥
datos.gub. ub0乌拉圭Estado门户
Bem vindo–巴西大门
公司董事,Marcas registradas, Normas legales Teléfonos en Perú
StatCentral.ie–爱尔兰官方统计数据门户
data.gov.be |比利时公开数据倡议
Data.overheid.nl:het开放数据门户van de Nederlandse overheid
PortalU–德国环境信息门户
统计数据库
Date.gov.md | Portalul Datelo Guvernantale deschise al-Republicii摩尔多瓦
Offee DatenÖsterreich | data.gv.at
Vitajte–data.gov.sk
dati.gov.it | I dati aperti della PA
Δημοσια, Ανοικτά Δεδομένα
开放肯尼亚|透明非洲
沙特|国家电子政务门户-主页
data.govt.nz–新西兰政府数据在线»data.govt.nz
data.gov.au
국가공유자원포털
中国政府公开信息整合服务平台
开放数据加拿大
OpenGovData.ru
OpenAid——开始
data.norge.no||pne offentlige data i norge–定义
Portada | datos.gob.es
开放数据哥伦比亚
主页| data.gov.uk

开放公司数据源

Yelp的学术数据集| Yelp
数据导出–繁荣
借贷俱乐部统计-借贷俱乐部

美国机构数据来源

联邦机构参与| Data.gov
services.sunlightlabs.com
FRB:数据下载程序(DDP)

各种数据源列表

编程挑战:数据科学中有哪些好的“玩具问题”库拉
数据:在哪里可以找到向公众开放的大型数据集库拉
数据分析:你最喜欢的免费数据源是什么库拉
哪些是公开的市场数据源?-库拉
每个国家的LinkedIn统计数据是否有可靠的免费来源库拉
@pskomoroch#数据集–美味
免费公共数据集|黑客新闻
欧洲开放数据目录清单,网址:lod2.okfn.org
开放数据
数据归档
网络上的一些数据集»数据争论博客

希拉里梅森的研究质量数据集

Lending Club贷款资料
垃圾短信收集
Flickr个人分类法
雅虎研究人员数据
ICWSM Spinnr挑战2011数据集
量子混沌思想:Facebook100数据集
Amazon Web服务(AWS)上的公共数据集
ClueWeb09数据集
人口普查局网页
数据|世界银行
图像网
什么是Twitter,社交网络还是新闻媒体?——WWW的10
dotbot | DotNetDotCom.org
arXiv.org帮助–arXiv批量数据访问–Amazon S3
YouTube数据集
人脸识别主页-数据库
Pajek数据集
UCI网络数据存储库
“统计学习要素”数据集
安然电子邮件数据集
MovieLens数据集| GroupLens研究
翻译任务–EMNLP 2011统计机器翻译第六次研讨会
古登堡计划
关于WordNet - WordNet -关于WordNet
加拿大第36届国会议事录
CRCNS–计算神经科学合作研究–数据共享
USENET语料库
非重复序列
ChEMBLdb
UCI机器学习库
基因表达综合(GEO)主页
社会科学数据
网络电影数据集
斯坦福大学大型网络数据集
谷歌图书n-gram数据集
百万首歌曲数据集|缩放和平号研究
肚脐生物多样性2.0
共享PyPi/Maven依赖数据«RTFB
点击数据集|复杂网络和系统研究中心
电饭煲-被删除的微博档案一年
已注册的陨石撞击地球可视化-分析桥
用于实时弗吉尼亚州交通数据的GeoJSON文件。
NYPD碰撞数据带
8亿文档中的110亿条线索:一个用Freebase概念注释的网络研究语料库|研究博客
大数据集- 35亿个网页-为我们所有人提供-大数据新闻
Data.西雅图.Gov|西雅图的数据站点
新的爬网数据可用!|爬虫
2013年通过率、种族和性别的详细数据
数据下载