本书目前处于Beta版本。我们期待着获得反馈和批评,您可以邮寄到[email protected]
感谢Martina Cantaro,Camilo Plata,Manuel Puebla,LucasRaúlFernandez珍纳,奥斯瓦尔多马丁,IñakiGaray和Mariana Vinyolas。
我们在写作科学期刊上发表的文章习惯,使工作尽可能完成,以掩盖所有的轨道,不用担心盲目的小巷或描述你如何先拥有错误的想法,依此类推 - 理查德FEYNMAN
只有那些开放的东西都可以是真的。完全透明度最适合我和你 - OpenBSD
关于这本书的第一件事之一是它不是学术教科书。本书的作者不是学者,而是一个多学科的热情团队,来自不同背景的业余从业人员,即工程,计算机科学,物理和经济,发现一个共同的地写这本书,当天一天往往阅读,学习并应用新方法,技术和思维方式。本书在某个方法之间的某处和理论密集型教科书之间。我们要提供的是面对具体数据科学问题的数学和计算方法,即将理论和科学应用于涉及数据的现实问题。理论与实践之间的关系是复杂的。考虑到他们整体可以让我们更远。这些页面可能会提供理论家,以便在更下地球态度中思考有问题的情况,并向从业者,刺激超越仅仅在于编程库和工具的应用。
作为书籍姓名,这是一本黑客的书。该术语可以具有相反的内涵,具体取决于谁声明它以及它指的是谁。在媒体和流行文化中,它与网络犯罪分子有关,人们使用计算机和技术的恶意意图。在网络安全域中,如同黑客的最后一章所述,黑客是Jon Eriickson的剥削艺术,“...只是具有创新精神的人和深入了解技术知识”。但是我们喜欢的定义是由Jargon文件的词汇表借用,由Eric S. Raymond写道,
“一个尤其高兴地了解系统,计算机和计算机网络的内部工作的人。”
这是在这种意义上,这本书是为黑客的意思:它将带来与结果驱动的视角,慢慢增长关于涉及数据的许多问题的内在工作的道路以及它们都有共同之处的内心运作,重点在应用程序。这本书的名称也受到了黑客的大贝叶斯方法的启发,这对本书的主题和方法产生了很大影响。
本书所呈现的情况是多元化的,反映了数据科学的广泛应用。然而,解决方案不要试图美观或完美。我们知道解决现实生活问题的道路是泥泞的,有时你可能会感到迷茫,并且你试图找到解决方案时,你的想法可能会发生变化,但我们鼓励拥抱这些粗糙的特征并接受这个学习中的尖角 - 通过解决旅程。建议,批评和反馈非常欣赏,这本书还活着,并将作为环境的反应而发展。
虽然这本书并不旨在具有模糊,过于技术或学术定义,但可能将读者放在读者中,有一点编程知识的人,对微积分的基本了解,一些建模直觉将充分利用这些页面。熟悉像Python这样的高级语言,采取衍生品和一些函数分析应该足以让读者通过这本书跟随。所有章节包括读者播放的代码,探索和实现自己的解决方案。此外,可提供与带有工作解决方案的笔记本电脑的链接。
为什么朱莉娅的数据科学?朱莉娅为数据科学的大语言有几个原因。朱莉娅代码是可读的,特别是对数学相关的计算。朱莉娅专为数学而来的数学设计,考虑到数据科学中涉及的大量数学,这使得它是一种非常方便的编程语言。朱莉娅的其他有趣方面是其融合主义。这是由于其历史背景:它是由一个科学家团队制定的,他们是一个想要解决他们在研究时通常遇到的问题的工具。通常,科学家面临着需要整合各种工具的复杂情况,并在许多要求中找到均衡点,例如以新语言学习编程,并有效地使用可用的设备和硬件。朱莉娅是这些需求的完美工具,适合实现高级解决方案,而不是以交互式方式轻松且快速地测试,并允许在需要时以简单的方式编写高度性能的代码,所有这些都是相同的语言。此外,多次调度和简单语法等功能允许包装之间的可兼能以及可扩展性,使得写入软件的任务更加用户友好和可维护。
第二章:Julia编程语言简介,显示代码和一些第一步的示例。
第五章:概率介绍了概率编程和使用TITE.JL包的一些简单示例。
第六章:我们估计火星的重力来计算逃生速度,投掷石头并从中拍摄非常简单的测量。
第七章:我们使用分层贝叶斯模型来估计描述总理联盟足球队的潜在变量。 第八章:我们分析了评分概率如何受到一些变量的影响,例如距离箍的距离和拍摄角度。 第九章:使用贝叶斯的角度解决了最优定价优化问题。 第十章:机器学习概述和一个简单的卷积神经网络的实现,能够区分蜜蜂和黄蜂的图片。 第十一章:我们解释了使用微分方程来构建人口动态模型的Ultima在线灾难。 第十二章:Ultima在线灾难的延续,引入了通用微分方程,以恢复科学模型的缺失部分。 第十三章:我们奠定了时间序列分析的基础,专注于指数平滑方法。