免费下载书籍:大数据挖掘
大数据正在改变世界。在这里,您将学习数据挖掘和机器学习技术处理大型数据集并从中提取有价值的知识。
这本书基于斯坦福计算机科学课程CS246:挖掘海量数据集(和CS345A:数据挖掘)。
与课程一致,这本书是在本科计算机科学水平上设计的。为了支持更深入的探索,大部分章节都补充了进一步的阅读参考。
《海量数据集挖掘》一书已由剑桥大学出版社出版。经与出版商达成协议,您可以从此页面免费下载该书。但是,剑桥大学出版社确实保留了该作品的版权。
本书第 3 版
以下是本书的第三版。它包含有关 Spark、Tensorflow、minhashing、社区查找、simrank、图算法和决策树的新材料。有一个新的第 13 章,涵盖深度学习。
还提供了一组讲座幻灯片,用于教授斯坦福CS246:挖掘海量数据集课程。请注意,幻灯片不一定涵盖相应章节中讨论的所有材料。
下载PDF 文件 (603 页,3.6 MB) 该书的最新版本。获 取 更多前沿科技 研究 进展访问:https://byteclicks.com

斯坦福大数据课程
CS246
CS246:挖掘海量数据集是研究生水平的课程,讨论用于分析大量数据的数据挖掘和机器学习算法。重点是 Map Reduce 作为创建可以处理大量数据的并行算法的工具。
CS341
CS341 Project in Mining Massive Data Sets是一门基于项目的高级课程。学生研究用于分析大量数据的数据挖掘和机器学习算法。有趣的大数据集和计算基础设施(大型 MapReduce 集群)均由课程人员提供。一般来说,学生先考CS246,再考CS341。
CS341得到了Amazon的慷慨支持, 可以访问他们的 EC2平台。
CS224W
CS224W:社会和信息网络是研究生水平的课程,涵盖了对此类大型社会和信息网络的结构和分析以及抽象其基本属性的模型和算法的最新研究。课程探讨如何实际分析大规模网络数据,以及如何通过网络结构和演化模型对其进行推理。